知识产权数据库作为高科技竞争的首选情报资源, 对避免重复研发,提升创新效率, 实现高质量的科技成果产出具有重要作用。在国内加强自主可控知识产权数据库建设的背 景下,平台对保护我国自主研发的关键核心技术成果、有效突破产业瓶颈、防范化解重大 风险,保障国家科技安全和经济安全意义重大。也面临以下难题: 一是,全球知识爆炸环 境下,如何全面、准确、及时的获取科技创新情报正难上加难;二是,高质量创意难、专 利撰写难、知识产权管理运营难亦是科技创新链条中的典型问题;三是,从市场现有解决 方案来看,往往伴随着时间、成本及效果无法保障等附加负担,对问题改善作用甚微。
在科研创新相关的知识产权数据库管理应用软件领域首创“跨语种知识产权语义检索 多模型融合技术”,建立了立足中国、涵盖世界的知识产权大数据库,拥有 1.82 亿 + 全 球专利数据,1.5 亿 + 期刊数据,0.8 亿 + 商标数据,覆盖全球 200+ 国家和地区,涉及物理、 化学、电学、机械等众多领域。打破了西方长期对我国知识产权数据库、知识产权分析工 具等进行的深度布局,从源头保障我国科技创新自主可控和数据安全。 针对专利文本不同段落写作特点构建针对性模型算法, 解决了单一专利检索算法模型 针对性不强、多语种处理弱问题,提升了专利检索的准确率和检索效果。突破了基于知识 产权大数据的知识图谱智能构建及建模技术。引入人工语言规则,自动发现文献中新的实 体和关系,并将新发现的实体和关系扩展到种子知识图谱,通过机器学习方式,学习到新 的特征提取语言规则,经过不断迭代建立多领域完备的专利知识图谱。 针对创新效率低、成本高、进展慢、周期长等痛点问题, 星河智源依托专利文本生成 大模型 IP-LLM、高精度的可专利性评估体系以及垂直领域智能语义引擎,推出专利智能 撰写、交底查新、专利申请前评估等核心产品。
技术创新方面,一是采用语义智能结合图像智能的多模态检索技术, 实现检索结果准 确率和检索效率大幅提升。二是通过深度适配全量专利数据的自然语言预训练工程,实现 基于专利特征的文本生成模型,打造了知识产权垂直领域大语言模型。 应用创新方面,一是基于和权威机构多年紧密合作整理出的上百条专家规则, 结合前 沿的基于 Transformer 机制的 NLP 算法模型和传统的 LCS 内容查重算法,构建了全方位、高精度的可专利性评估体系。二是基于前沿的 GPT 生成式预训练大模型技术,实现了专 利数据深加工模型,可从专利文本中精准挖掘、加工和生成高价值发明要素。 模式创新方面,平台新推过程式交互生成模式, 实现专利生成过程可干预、生成结果 可引导,有效增强专利文本可塑性。
经济效益方面,平台产品已赢得国家知识产权局、国防知识产权局、中科院、清华大学、 武汉大学等政府机构、高校和科研院所,以及科达制造、立讯精密等龙头企业的认可。 在检索方面,平台智能检索引擎在功能上实现了 ×, Y(新颖性和创造性)类专利文献 的精准检索, 准确率行业领先。实现通过一个简单的指令就可以智能完成原先费时费力 的人工检索工作,工作效率可提升 50%。针对从创意到 IP 的过程,发明创新者可在数 秒间精准查询全球创新情报,获得目标解决方案,从源头提升创意质量。并且,过去 20 天左右才能完成的专利申请文件撰写工作,现在基于用户创意,通过平台 2-3 天就能完 成。此外, 依托 AI 专利评估模型,平台能筛查出 90% 以上的非正常、低质量专利申请, 避免重复研发的同时,大幅降低企业专利保护费用,有效节省研发经费。在知产管理方面, 平台可有效解决知识产权管理成本高、流程繁琐、价值难发挥等问题,大幅降低人力成 本和时间成本。 社会效益方面,一是在知识产权强国建设背景下, 平台坚持自主可控建设,对保障科 研安全和国家安全意义重大,具有行业示范作用。二是提高了决策效率,缩短了研发从立 项到运营的周期,降低了研发风险,更多的研发和产业化尝试获得了现实可能性。