字段搜索

共有 287 个数据目录

  • 问答数据集

    涵盖网络问答对数据,包括知识问答、常识问答、娱乐新闻问答等主题,培养模型对问题的深刻理解和准确回答的能力


    数据堂(北京)科技股份有限公司提供主题领域:2023-11-15更新

  • 医疗影像数据集

    医疗影像是通过医疗系统内成像设备(CT、核磁等)拍摄,形成患者DICOM格式影像数据,同时医生出具报告,形成“诊断报告+影像”交付患者,用于患者保存、异地会诊、院内科室会诊等。


    数据堂(北京)科技股份有限公司提供主题领域:2023-11-15更新

  • 美食图片数据集

    有关美食的摄影图像数据,包含高清图片、说明、标签等


    数据堂(北京)科技股份有限公司提供主题领域:2023-11-15更新

  • 政策数据集

    包括国家部委、地方政府等的政策文件、政策研究报告、政策解读文章和政策问答数据


    数据堂(北京)科技股份有限公司提供主题领域:2023-11-15更新

  • 全球生物序列数据集

    根据核苷酸和蛋白质序列获取到相似序列,以及相关专利、期刊文献和生物公共库中的公开信息;可帮助研发和IP人员进行序列创新信息检索,了解项目是否有侵权风险,并可以快速获取当前市场的战略布局,监控市场动态


    数据堂(北京)科技股份有限公司提供主题领域:2023-11-05更新

  • 生成式对话大模型精调语料

    面向对话大模型的高质量、多类型指令数据集,包括但不限于单轮对话、多轮对话、个性化指令、上下文理解指令和推理思维链等


    数据堂(北京)科技股份有限公司提供主题领域:2023-09-14更新

  • 财税文本数据集

    该数据集包含全国各地区政策、新闻、财税类知识、问答等信息


    数据堂(北京)科技股份有限公司提供主题领域:2023-09-14更新

  • 中文高质量大模型预训练文本数据集

    文本内容涵盖80多个学科领域,进行了准确的标签分类和严格的内容清洗。


    数据堂(北京)科技股份有限公司提供主题领域:2023-09-12更新

  • 大模型中文千万轮对话数据集

    该数据集是一个上千万轮的双人对话的高质量工程化数据集,覆盖金融、教育、客服等行业和场景,用于大模型的训练和调优。


    数据堂(北京)科技股份有限公司提供主题领域:2023-09-12更新

  • 中文千万轮对话语料库 DOTS-NLP-216

    真实场景对话采集,高度还原真实场景的模拟对话。兼顾分布的代表性、多样性和样本规模。


    数据堂(北京)科技股份有限公司提供主题领域:2023-09-12更新

  • 大模型多语种语音识别数据集

    来自世界10多个国家的20万小时音频文本,主要包含中、英、维、藏等国内重点安防关注领域;


    数据堂(北京)科技股份有限公司提供主题领域:2023-09-12更新

  • “科情头条”全球科技动态数据集

    来自世界主要国家2200余个官方信源、经过翻译审校的全球科技前沿信息。


    数据堂(北京)科技股份有限公司提供主题领域:2023-09-12更新

  • 高质量跨语言行业知识图谱三元组库

    面向全球企业、产业链、创新技术、防务目标的高质量知识数据,涵盖多语种对齐,实体数量高达5亿,三元组数量近100亿


    数据堂(北京)科技股份有限公司提供主题领域:2023-09-12更新

  • 智能座舱人机交互高质量数据集

    4000w句智能座舱场景高质量人机交互数据,涵盖座舱场景内各种交互形式。


    数据堂(北京)科技股份有限公司提供主题领域:2023-09-04更新

  • 中医知识数据集

    包含中医学领域知识信息,包括中医疾病诊断方法、治疗方案、中医药品、方剂、中医操作、古籍文献等内容。


    数据堂(北京)科技股份有限公司提供主题领域:2023-09-04更新

  • 智能会议场景高质量对话式语音数据集

    涵盖956场真实会议场景,多人多轮次对话音频数据集,可应用于语音对话与听觉大模型的研究。


    数据堂(北京)科技股份有限公司提供主题领域:2023-09-03更新

  • 信息化项目数据集

    "全国信息化、数字化建设项目公开信息数据。同时,对文本进行了清洗,形成了结构化字段。 字段:包括建设单位、项目名称、预算、供应商、建设内容等"


    数据堂(北京)科技股份有限公司提供主题领域:2023-09-03更新

  • 电商商品数据集

    主流电商商品信息数据


    数据堂(北京)科技股份有限公司提供主题领域:2023-09-03更新

  • 产业数据

    全国、省、市、区县宏观经济数据、产业发展指标数据、产业链指标数据


    数据堂(北京)科技股份有限公司提供主题领域:2023-09-03更新

  • 大模型方言口语语音数据集

    涵盖17种方言口语,自然表达的音频数据集,可应用于语音对话与听觉大模型的研究。


    数据堂(北京)科技股份有限公司提供主题领域:2023-09-03更新

找到287项  第3页/共15页     上一页   1  2  3  4  5  6  7  8  9  10  下一页   末页