术语在线
申报单位:北京市电通电话技术开发有限公司
浏览量: 发布时间:2024-07-12
案例背景

在国家数字经济和知识经济战略导向下, “十四五”规划和“数据二十条”的政策背景下,术语在线作为专业术语服务平台,致力于构建高质量的多学科中文术语库。这一数 据库涵盖生命科学、信息与计算机科学、工程技术学等领域, 为 AI 模型训练提供了专业、 精准的数据支持。然而,当前在非英语环境中,尤其是在中文应用场景下,大模型面临着 输出内容规范用词问题,这在医疗、科技等行业尤为明显,导致专业信息传播受限以及南 北医疗术语差异。此外,各行业在数据入表时面临字段不统一的问题,影响了数据的流通 性和应用效率。术语在线通过统一术语标准,解决了数据字段不统一的问题,提升了数据 录入和管理的规范性,确保数据的规范性和准确性,并提升了数据的流通效应。平台的数 据来源权威,包括全国科学技术名词审定委员会及国家标准术语,确保术语的规范性、权 威性和唯一性,进一步推动了知识经济和数字经济的融合发展。

解决方案

术语在线通过构建高质量的中文术语库,解决了数据获取难度大、处理复杂度高、 术语知识体系建立、大模型输出规范化、数据资产入表数据流通效率等问题。具体方案 包括: 1. 行业应用 术语在线通过与医科类大学和众多医院合作,分析与整合医疗术语库,并融入校对 审定术语和标准库形成专业、权威、标准的医疗行业知识体系。解决了术语内容与行业 结合形成知识体系,有助于行业专业学习以及标准术语差异化的问题。 2. 大语言模型输出内容规范化 利用医疗行业知识体系,通过 AI 技术训练出语言模型,开发智能小术 AI 模型,提 供术语知识版权链,辅助创作者学习使用专业术语,提供自动化排版、纠错和全文审核 服务,确保内容符合国家标准。有助于大模型输出规范化,形成的智能小术 AI 模型,提供辅助词典服务,由 API 接口销售术语数据,提供便捷的阅读软件内在线查询功能,提 升用户体验,减少流失率。同时大模型输出的标准用词,有助于输出内容的规范化。 3. 加速数据流通有助于数据资产入表 通过统一术语标准,解决了数据字段不统一的问题,提升了数据录入和管理的规范性, 确保数据的规范性和准确性。通过一站式数据治理服务和入表标准字段的统一,加速了 数据流通,有助于数据资产入表。平台的数据来源权威,包括全国科学技术名词审定委 员会及国家标准术语,确保术语的规范性、权威性和唯一性,进一步推动了知识经济和 数字经济的融合发展。

创新点

技术创新方面,通过技术训练形成专业领域大模型。术语在线结合 AI 和大数据技术, 构建高质量术语库,确保术语数据的专业性和准确性。利用 Hadoop 框架进行文本数据 的预处理,并通过 AI 技术对术语名词进行词法、句法、语义和情感分析,生成术语知识图谱,实现智能识别、分类及流转追溯。这些技术创新使术语在线能够训练出专业领域 的大模型,确保在各行业应用中提供精准、规范的术语支持。 应用创新方面,通过 AIGC 技术生成科普视频和教学视频,结合术语定义以及行业 标准和标准委规范,形成以术语为核心的术语知识体系,弥补行业对术语知识理解的欠缺, 以及统一术语在行业内的规范性,辅助大模型产业内容规范、数据入表业务加速规范数 据流通。 模式创新方面,解决行业入表的数据字段统一问题。术语在线与数据局和全国科学 技术名词审定委员会合作,制定统一的术语标准,提升数据入表的规划性和标准化。通 过标准化字段简化数据录入流程,减少错误,加速数据资产的积累与利用。这种标准化 管理不仅提升了数据的规范性和准确性,也为行业数据的高效应用奠定了基础。

应用成效

经济效益方面,通过高质量术语库的建设,提升了行业教育和科研效率,降低了资 源浪费,节约了社会成本。在内容创作方面,提供的智能辅助工具提升了出版效率,节 省了人力成本,推动了出版行业的数字化转型。同时形成接口调用的商业模式,服务于 医疗行业、互联网产业、数据资产产业,助力各行业通过术语形成的知识库,完成内容 输出的规范性以及加快数据流通的有效性,提升行业收入规模。 社会效益方面,通过制定统一的术语标准的术语大模型,提升数据入表的规划性和 标准化。通过标准化字段,简化数据录入流程,减少错误,加速各行业数据资产的积累 与利用。应用于各行业上将名词术语作为大模型训练的基础数据,确保专业内容输出的 准确性和规范性。解决当下大模型规范术语知识输出,各行业数据资产入表数据资源的 流通效率。