共有 296 个数据目录
开放方式:
-
41小时中国低幼儿童语音数据(麦克风+手机)【数据堂】
格式16kHz/22.05kHz/44.1kHz,16bit,未压缩wav,单声道录音环境相对安静的室内语言普通话录音内容通用;儿童歌谣;故事书;命令
北京市大数据中心 主题领域:2023-08-19更新
-
122人乘客行为识别数据【数据堂】
数据规模122人人种分布性别分布:男86人,女36人;种族分布:白种人30人,黑种人87人,印度人5人;年龄分布:18~30岁94人,31~45
北京市大数据中心 主题领域:2023-08-19更新
-
14,511张英文手写体OCR数据【数据堂】
数据规模1,591人,14,511张人员分布性别分布:男659人,女932人;年龄分布:18岁以下30人,18-45岁1,479人,46-60岁82人国籍分布
北京市大数据中心 主题领域:2023-08-19更新
-
71,535张英文自然场景OCR数据【数据堂】
数据规模71,535张,每张图片有1-200个单词采集环境英国和美国实地采集,包括商店牌匾、海报、路标、提示语、警示语、包装说明、
北京市大数据中心 主题领域:2023-08-19更新
-
6,924张占道经营数据【数据堂】
数据规模2,002人,每人1张照片,4-5段视频采集环境包括街边、小吃街、店铺门口等采集多样性多种场景、不同时间段、不同拍摄角度
北京市大数据中心 主题领域:2023-08-19更新
-
1,535小时中英混读手机采集语音数据【数据堂】
格式16kHz,16bit,未压缩wav,单声道录音环境相对安静的室内;录音内容通用口语;人机交互人员共3,972 人;其中男性占比43%;12
北京市大数据中心 主题领域:2023-08-19更新
-
16类75,239张城市精细化治理数据【数据堂】
数据规模16类,共计75,239张图像采集时间白天、夜晚采集环境包括街道、小吃街、店铺门口、楼道、小区门口等采集多样性多种场景、
北京市大数据中心 主题领域:2023-08-19更新
-
4,999人55,348张婴幼儿人脸采集数据【数据堂】
数据规模4,999人,55,348张人种分布人种分布:黄种人;性别分布:男孩2,881人,女孩2,118人;年龄分布:0-1岁(含1岁)1,461人,
北京市大数据中心 主题领域:2023-08-19更新
-
56,920条细粒度汽车评论标注数据【数据堂】
数据规模56,920条数据内容汽车论坛帖子细粒度标注存储格式xml语言中文标注内容属性、评价内容、描述值、厂商、品牌、型号、对比
北京市大数据中心 主题领域:2023-08-19更新
-
1,030小时上海方言手机采集语音数据【数据堂】
格式16kHz,16bit,未压缩wav,单声道录音环境相对安静的室内;普通环境,包含不影响语音识别的噪音录音内容通用类;交互类;数
北京市大数据中心 主题领域:2023-08-19更新
-
211小时德语手机采集语音数据_朗读【数据堂】
格式16kHz,16bit,未压缩wav,单声道录音环境相对安静的室内,无回声录音内容娱乐;新闻;口语;经济;数字;字母人员327名德国
北京市大数据中心 主题领域:2023-08-19更新
-
26,090张人脸肤质缺陷采集数据【数据堂】
数据规模26,090张:痘痘(9,690张),痘印(9,614张 ),色斑(21,647张 ),皱纹(21,228张 ),黑眼圈(9,200张)人种分布人种
北京市大数据中心 主题领域:2023-08-19更新
-
1,652小时粤语手机采集语音数据【数据堂】
格式16kHz,16bit,未压缩wav,单声道录音环境相对安静的室内;普通环境,包含不影响语音识别的噪音录音内容50万句常用口语人员4
北京市大数据中心 主题领域:2023-08-19更新
-
28,237句交互场景单句意图标注数据【数据堂】
数据规模28,237句应用场景意图理解数据内容智能交互场景下多个领域的单句意图标注数据数据格式excel标注内容人工编写相应意图的
北京市大数据中心 主题领域:2023-08-19更新
-
101小时录音笔采集场景噪音数据【数据堂】
格式44.1kHz 16bit,wav,双声道录音环境含嘈杂噪音的场景;地铁、超市、餐厅、马路、展厅、机场、影院、高铁、高速公路、市内道
北京市大数据中心 主题领域:2023-08-19更新
-
1,282万组中韩平行语料数据【数据堂】
数据规模1,282万对中韩平行语料数据,中文部分平均句长25.7字数据内容中韩平行语料语言汉语、韩语数据格式txt准确率90%应用场景
北京市大数据中心 主题领域:2023-08-19更新
-
4,082个家庭-家庭人脸数据【数据堂】
数据规模4,082个家庭,15,595人,18,172组亲属关系对采集环境室内场景、室外场景采集多样性多种场景、多个家庭、11种亲属关系对
北京市大数据中心 主题领域:2023-08-19更新
-
4,001人单目标跨头跟踪数据【数据堂】
数据规模4,001人,每人最少385张,最多2,779张人种分布人种分布为黄种人性别分布男2,052人,女1,949人采集环境包括室内场景采集
北京市大数据中心 主题领域:2023-08-19更新
-
15人3D人体22关键点标注数据【数据堂】
数据规模15人,21,210张人种分布性别分布:男6人、女9人;年龄分布:11-27岁采集环境居家环境、办公环境采集多样性涵盖多种场景
北京市大数据中心 主题领域:2023-08-19更新
-
983万组中日平行语料数据【数据堂】
数据规模983万对中日平行语料数据数据内容中日平行语料语言汉语、日语数据格式txt准确率90%应用场景机器翻译
北京市大数据中心 主题领域:2023-08-19更新