共有 296 个数据目录
开放方式:
-
糖尿病门诊病例数据集
可提供数十家二级以上公立医院(近二十多年)主诊断为糖尿病的门诊就诊数据,包含患者年龄、婚姻状况、疾病诊断、用药情况、检查情况、检验情况等维度。(特别说明:不提供患者、医院、医生等敏感信息)
北京市大数据中心 主题领域:2023-09-03更新
-
自动驾驶雨天长尾场景合成数据集
涉及Detection(2D/3D)、Tracking、prediction、激光雷达分割、全景任务、占用网格多个任务, 同时提供高速,高架,城区,城中村,乡村,测试场多种场景, 保证测试集和训练集的场景完全隔离
北京市大数据中心 主题领域:2023-09-03更新
-
-
-
MagicData-CLAM_SFT 大模型微调数据集-通用领域
此数据集包含200万组通用领域多任务单轮问答数据,任务类型包含头脑风暴、内容分类、关键信息提取、文章生成、内容重写、聊天、封闭域问答、开放域问答等,适用于大模型构建及微调。
北京市大数据中心 主题领域:2023-09-03更新
-
-
-
-
-
智慧城市治理图像文本多模态数据集
该数据包含图像文本多模态数据,包括“城市道路、非机动车违停、道路积水、占道经营、城市垃圾、城市井盖”等6类;该数据用于智慧城市治理、自动驾驶等方面;数据集包含原图、标注图、文本数据(yolo格式)。
北京市大数据中心 主题领域:2023-09-03更新
-
-
绿色投资标的评估数据集
是根据绿色投资相关标准和框架形成的评估数据集,该数据集包含各类绿色相关评估标签和信息语料,有助于构建绿色投资标的评估模型和投资策略模型。
北京市大数据中心 主题领域:2023-09-03更新
-
-
-
-
-
自动驾驶大模型预训练数据集
数据集采集自北京高级别自动驾驶示范区的3个不同路口路侧数据,数据内容为路侧视角的脱敏视频数据,覆盖多路口、多路况、多时段,可用于自动驾驶大模型训练。
北京市大数据中心 主题领域:2023-09-03更新
-
-
-