字段搜索
共有 287 个数据目录
-
智慧城市治理图像文本多模态数据集
该数据包含图像文本多模态数据,包括“城市道路、非机动车违停、道路积水、占道经营、城市垃圾、城市井盖”等6类;该数据用于智慧城市治理、自动驾驶等方面;数据集包含原图、标注图、文本数据(yolo格式)。
数据堂(北京)科技股份有限公司提供主题领域:2023-09-03更新
-
-
绿色投资标的评估数据集
是根据绿色投资相关标准和框架形成的评估数据集,该数据集包含各类绿色相关评估标签和信息语料,有助于构建绿色投资标的评估模型和投资策略模型。
数据堂(北京)科技股份有限公司提供主题领域:2023-09-03更新
-
-
-
-
-
自动驾驶大模型预训练数据集
数据集采集自北京高级别自动驾驶示范区的3个不同路口路侧数据,数据内容为路侧视角的脱敏视频数据,覆盖多路口、多路况、多时段,可用于自动驾驶大模型训练。
数据堂(北京)科技股份有限公司提供主题领域:2023-09-03更新
-
-
-
-
高品质、大规模、多语种双语平行语料数据集
来自于科技服务、军事、国防安全、金融、医疗等领域的专利、论文、科技文献等资料整理的双语平行语料
数据堂(北京)科技股份有限公司提供主题领域:2023-09-03更新
-
-
科技文献挖掘语义标注数据集
人工整编的可用于科技文献语步识别、概念定义识别、研究问题识别、领域分类、领域科研实体识别等任务的训练数据集。 其中语步识别数据集40万条,标注了文献摘要中各句子的语步类型,包括研究背景句、研究目的句、研究方法句、研究结果句、研究结论句;概念定义识别数据集1万条,标注了文献中描述概念定义的句子;研究问题识别数据集1万条,标注了文献中描述研究问题的句子;分类数据集50万条,包括了每篇文章及其中图分类号的对应关系;科研实体识别数据集10万条,标注了文献摘要中描述研究问题、方法模型、数据资料、仪器设备等实体词。
数据堂(北京)科技股份有限公司提供主题领域:2023-09-02更新
-
中国科学引文数据库数据集
中国科学引文数据库(Chinese Science Citation Database,简称CSCD)创建于1989年,是我国第一个引文数据库,覆盖我国数学、物理、化学、天文学、地学、生物学、农林科学、医药卫生、工程技术和环境科学等领域出版的中英文科技核心期刊1300余种。数据准确、处理规范,目前已积累高质量论文记录 600余万条,包括论文题名、作者、机构、关键词、摘要等信息,可用于基于中文文献的知识挖掘等场景。
数据堂(北京)科技股份有限公司提供主题领域:2023-09-02更新
-
-
-
-
-