共有 296 个数据目录
开放方式:
-
1,505小时普通话手机采集语音数据【数据堂】
格式16kHz,16bit,未压缩wav,单声道录音环境相对安静的室内;普通环境,包含不影响语音识别的噪音录音内容30万条口语化句子人
北京市大数据中心 主题领域:2023-08-19更新
-
190,426张扫地机器人视角采集数据【数据堂】
数据规模190,426张图像采集环境包括室内场景采集多样性多种场景、不同时间段、不同拍摄角度、不同物品类别采集设备手机数据格式
北京市大数据中心 主题领域:2023-08-19更新
-
10.4小时日语女声合成库【数据堂】
格式48kHz,24bit,wav,单声道录音环境专业录音棚环境录音内容新闻及口语的录音文本,音素进行了平衡覆盖人员女性,20~30岁,声
北京市大数据中心 主题领域:2023-08-19更新
-
10,464段打电话行为视频数据【数据堂】
数据规模10,464段采集环境包括室内场景和室外场景采集多样性多种场景、多种拍摄角度、多种分辨率采集设备监控摄像头、手机采集角
北京市大数据中心 主题领域:2023-08-19更新
-
23对同卵双胞胎人脸图像数据【数据堂】
数据规模23对,一对同卵双胞胎每人分别采集40张照片(20张室内,20张室外)人种分布黄种人;性别分布:男性9对,女性14对;年龄分
北京市大数据中心 主题领域:2023-08-19更新
-
23,110人多色人种人脸多姿态数据【数据堂】
数据规模23,110人,每人29张照片人种分布黑种人7,324人,白种人3,830人,棕色人918人,印度人6,270人,黄种人4,768人性别分布男1
北京市大数据中心 主题领域:2023-08-19更新
-
5,808人人体行为识别数据【数据堂】
数据规模5,808人人种分布人种分布为黄种人性别分布男3,054人、女2,754人从少年到老人,中青年为主采集环境包括室内场景和室外场
北京市大数据中心 主题领域:2023-08-19更新
-
12.6小时中文女声对话式客服合成库【数据堂】
格式48kHz,24bit,wav,单声道录音环境专业录音棚环境录音内容模拟电信场景的自然对话人员女性,20~30岁,声音甜美设备专业录音
北京市大数据中心 主题领域:2023-08-19更新
-
769小时法语手机采集语音数据【数据堂】
格式16kHz,16bit,无压缩wav,单声道;录音环境相对安静的室内,无回声录音内容口语类;交互类;家居车载命令类;数字类;新闻
北京市大数据中心 主题领域:2023-08-19更新
-
3,506张印地语OCR标注及转写数据【数据堂】
数据规模2,002人,每人1张照片,4-5段视频人种分布人种分布为黄种人性别分布男940人、女1062人采集环境包括室内场景采集多样性不
北京市大数据中心 主题领域:2023-08-19更新
-
40人3D&2D活体检测数据【数据堂】
数据规模40人,一个人采集48段视频,150组(252张)图像人种分布人种分布:黄种人;性别分布:男20人、女20人;年龄分布:18~57
北京市大数据中心 主题领域:2023-08-19更新
-
593小时中国人说英语手机采集语音数据【数据堂】
格式16kHz,16bit,未压缩wav,单声道录音环境相对安静的室内,无回声录音内容10万句常用句子人员3,691人,其中女性占比66%设备
北京市大数据中心 主题领域:2023-08-19更新
-
50人3D扫描人脸数据【数据堂】
数据规模50人人种分布人种分布为黄种人性别分布男28人、女22人18~57岁采集环境包括室内场景采集多样性不同类型的电梯、不同类型
北京市大数据中心 主题领域:2023-08-19更新
-
1,073只64,378张狗鼻子采集标注数据【数据堂】
数据规模1,073只,64,378张采集环境包含室内外多种场景采集多样性多种场景、多种狗类型(泰迪、拉布拉多、柴犬等)、不同光照条件
北京市大数据中心 主题领域:2023-08-19更新
-
101人4,538张日语手写体OCR数据【数据堂】
数据规模101人,4,538张采集环境A4纸采集多样性涵盖社会民生、娱乐、旅游、体育赛事、电影、作曲等领域采集设备扫描仪数据格式图
北京市大数据中心 主题领域:2023-08-19更新
-
343人西班牙语手机采集语音数据_引导【数据堂】
格式16kHz,16bit,未压缩wav,单声道录音环境相对安静的室内,无回声录音内容车载场景,智能家居,语音助手人员343人来自西班牙
北京市大数据中心 主题领域:2023-08-19更新
-
10,000段人群行为视频数据【数据堂】
数据规模10,000段采集环境室外场景采集多样性多种场景、多种时间段、不同密度的游行人群采集设备监控摄像头、手机采集角度俯视、
北京市大数据中心 主题领域:2023-08-19更新
-
13个模块实体名单句标注数据【数据堂】
语言中文数据规模13个模块,共计15,900句语料来源人工编写标注内容实体名、实体类型数据格式excel准确率95%
北京市大数据中心 主题领域:2023-08-19更新
-
205人噪音环境口音普通话手机采集语音数据_引导【数据堂】
格式16kHz,16bit,未压缩wav,单声道录音环境噪音环境,包含地铁、超市、餐厅、马路、机场等场景录音内容车载场景;智能家居;
北京市大数据中心 主题领域:2023-08-19更新
-
21,299张人体人脸抠图数据【数据堂】
数据规模21,299张人种分布黄种人、白种人、黑种人性别分布男性、女性从少年到老年,中青年为主采集环境包含室内场景和室外场景采
北京市大数据中心 主题领域:2023-08-19更新