共有 287 个数据目录 开放方式: 无条件开放 有条件开放(AI数据) 无条件开放(AI数据) 授权运营专区 问答数据集 涵盖网络问答对数据,包括知识问答、常识问答、娱乐新闻问答等主题,培养模型对问题的深刻理解和准确回答的能力 主题领域:2023-11-15更新 查看 医疗影像数据集 医疗影像是通过医疗系统内成像设备(CT、核磁等)拍摄,形成患者DICOM格式影像数据,同时医生出具报告,形成“诊断报告+影像”交付患者,用于患者保存、异地会诊、院内科室会诊等。 主题领域:2023-11-15更新 查看 美食图片数据集 有关美食的摄影图像数据,包含高清图片、说明、标签等 主题领域:2023-11-15更新 查看 政策数据集 包括国家部委、地方政府等的政策文件、政策研究报告、政策解读文章和政策问答数据 主题领域:2023-11-15更新 查看 全球生物序列数据集 根据核苷酸和蛋白质序列获取到相似序列,以及相关专利、期刊文献和生物公共库中的公开信息;可帮助研发和IP人员进行序列创新信息检索,了解项目是否有侵权风险,并可以快速获取当前市场的战略布局,监控市场动态 主题领域:2023-11-05更新 查看 生成式对话大模型精调语料 面向对话大模型的高质量、多类型指令数据集,包括但不限于单轮对话、多轮对话、个性化指令、上下文理解指令和推理思维链等 主题领域:2023-09-14更新 查看 财税文本数据集 该数据集包含全国各地区政策、新闻、财税类知识、问答等信息 主题领域:2023-09-14更新 查看 中文高质量大模型预训练文本数据集 文本内容涵盖80多个学科领域,进行了准确的标签分类和严格的内容清洗。 主题领域:2023-09-12更新 查看 大模型中文千万轮对话数据集 该数据集是一个上千万轮的双人对话的高质量工程化数据集,覆盖金融、教育、客服等行业和场景,用于大模型的训练和调优。 主题领域:2023-09-12更新 查看 中文千万轮对话语料库 DOTS-NLP-216 真实场景对话采集,高度还原真实场景的模拟对话。兼顾分布的代表性、多样性和样本规模。 主题领域:2023-09-12更新 查看 大模型多语种语音识别数据集 来自世界10多个国家的20万小时音频文本,主要包含中、英、维、藏等国内重点安防关注领域; 主题领域:2023-09-12更新 查看 “科情头条”全球科技动态数据集 来自世界主要国家2200余个官方信源、经过翻译审校的全球科技前沿信息。 主题领域:2023-09-12更新 查看 高质量跨语言行业知识图谱三元组库 面向全球企业、产业链、创新技术、防务目标的高质量知识数据,涵盖多语种对齐,实体数量高达5亿,三元组数量近100亿 主题领域:2023-09-12更新 查看 智能座舱人机交互高质量数据集 4000w句智能座舱场景高质量人机交互数据,涵盖座舱场景内各种交互形式。 主题领域:2023-09-04更新 查看 中医知识数据集 包含中医学领域知识信息,包括中医疾病诊断方法、治疗方案、中医药品、方剂、中医操作、古籍文献等内容。 主题领域:2023-09-04更新 查看 智能会议场景高质量对话式语音数据集 涵盖956场真实会议场景,多人多轮次对话音频数据集,可应用于语音对话与听觉大模型的研究。 主题领域:2023-09-03更新 查看 信息化项目数据集 "全国信息化、数字化建设项目公开信息数据。同时,对文本进行了清洗,形成了结构化字段。 字段:包括建设单位、项目名称、预算、供应商、建设内容等" 主题领域:2023-09-03更新 查看 电商商品数据集 主流电商商品信息数据 主题领域:2023-09-03更新 查看 产业数据 全国、省、市、区县宏观经济数据、产业发展指标数据、产业链指标数据 主题领域:2023-09-03更新 查看 大模型方言口语语音数据集 涵盖17种方言口语,自然表达的音频数据集,可应用于语音对话与听觉大模型的研究。 主题领域:2023-09-03更新 查看 找到287项 第3页/共15页 上一页 1 2 3 4 5 6 7 8 9 10 下一页 末页