字段搜索
共有 287 个数据目录
-
-
-
-
-
-
生成式对话大模型精调语料
面向对话大模型的高质量、多类型指令数据集,包括但不限于单轮对话、多轮对话、个性化指令、上下文理解指令和推理思维链等
数据堂(北京)科技股份有限公司提供主题领域:2023-09-14更新
-
-
-
大模型中文千万轮对话数据集
该数据集是一个上千万轮的双人对话的高质量工程化数据集,覆盖金融、教育、客服等行业和场景,用于大模型的训练和调优。
数据堂(北京)科技股份有限公司提供主题领域:2023-09-12更新
-
中文千万轮对话语料库 DOTS-NLP-216
真实场景对话采集,高度还原真实场景的模拟对话。兼顾分布的代表性、多样性和样本规模。
数据堂(北京)科技股份有限公司提供主题领域:2023-09-12更新
-
-
-
高质量跨语言行业知识图谱三元组库
面向全球企业、产业链、创新技术、防务目标的高质量知识数据,涵盖多语种对齐,实体数量高达5亿,三元组数量近100亿
数据堂(北京)科技股份有限公司提供主题领域:2023-09-12更新
-
-
-
-
-
-
-