共有 287 个数据目录
开放方式:
-
智慧城市治理图像文本多模态数据集
该数据包含图像文本多模态数据,包括“城市道路、非机动车违停、道路积水、占道经营、城市垃圾、城市井盖”等6类;该数据用于智慧城市治理、自动驾驶等方面;数据集包含原图、标注图、文本数据(yolo格式)。
主题领域:2023-09-03更新
-
-
-
-
-
-
-
自动驾驶大模型预训练数据集
数据集采集自北京高级别自动驾驶示范区的3个不同路口路侧数据,数据内容为路侧视角的脱敏视频数据,覆盖多路口、多路况、多时段,可用于自动驾驶大模型训练。
主题领域:2023-09-03更新
-
-
-
-
-
-
科技文献挖掘语义标注数据集
人工整编的可用于科技文献语步识别、概念定义识别、研究问题识别、领域分类、领域科研实体识别等任务的训练数据集。 其中语步识别数据集40万条,标注了文献摘要中各句子的语步类型,包括研究背景句、研究目的句、研究方法句、研究结果句、研究结论句;概念定义识别数据集1万条,标注了文献中描述概念定义的句子;研究问题识别数据集1万条,标注了文献中描述研究问题的句子;分类数据集50万条,包括了每篇文章及其中图分类号的对应关系;科研实体识别数据集10万条,标注了文献摘要中描述研究问题、方法模型、数据资料、仪器设备等实体词。
主题领域:2023-09-02更新
-
中国科学引文数据库数据集
中国科学引文数据库(Chinese Science Citation Database,简称CSCD)创建于1989年,是我国第一个引文数据库,覆盖我国数学、物理、化学、天文学、地学、生物学、农林科学、医药卫生、工程技术和环境科学等领域出版的中英文科技核心期刊1300余种。数据准确、处理规范,目前已积累高质量论文记录 600余万条,包括论文题名、作者、机构、关键词、摘要等信息,可用于基于中文文献的知识挖掘等场景。
主题领域:2023-09-02更新
-
-
-
-
-


