共有 296 个数据目录
开放方式:
-
9,497张10种表格OCR数据【数据堂】
数据规模9,497张,10种表格类型采集环境纯色背景采集多样性多种表格类型数据格式图像格式为.jpg,标注格式为.json标注内容矩形框
北京市大数据中心 主题领域:2023-08-19更新
-
200人中文手机采集语音数据【数据堂】
格式16kHz,16bit,未压缩wav,单声道录音环境安静环境;噪音环境录音内容口语化句子人员200名中国人,其中女性占比53%设备荣耀h
北京市大数据中心 主题领域:2023-08-19更新
-
9,181人59,490张跨年龄人脸数据【数据堂】
数据规模9,181人,59,490张人种分布人种分布:黄种人;性别分布:女性5,097人,男性4,084人性别分布男940人、女1062人采集环境室
北京市大数据中心 主题领域:2023-08-19更新
-
3,919人人脸多姿态数据【数据堂】
数据规模3,919人,每人24张图片,9段视频人种分布人种分布为黄种人性别分布男2,046人,女1,873人国际分布柬埔寨114人,印度尼西
北京市大数据中心 主题领域:2023-08-19更新
-
38人港式粤语素人平均音色合成库【数据堂】
格式44.1kHz,16bit,wav,单声道录音环境录音室录音内容日常用语和文章句子人员38人,其中女性29人,男性9人设备麦克风标注内容
北京市大数据中心 主题领域:2023-08-19更新
-
10,142段摔倒行为视频数据【数据堂】
数据规模10,142段采集环境包括室内场景和室外场景采集多样性多种场景、多种拍摄角度、多种采集时间、多种分辨率采集设备监控摄像
北京市大数据中心 主题领域:2023-08-19更新
-
105,941张12种语言自然场景OCR数据【数据堂】
数据规模105,941张,包括亚洲语系: 日语9,997张、韩语10,231张、印尼语7,591张、马来语5,650张、越南语8,822张、泰语9,645张;
北京市大数据中心 主题领域:2023-08-19更新
-
1,998人唇语视频数据【数据堂】
数据规模1,998人,每人至少14段视频,共计41,866段视频人员分布从少年到老人,中青年为主采集环境室内场景采集多样性多场景、不
北京市大数据中心 主题领域:2023-08-19更新
-
8,643张14类异常图像&视频数据【数据堂】
数据规模8,643张,14类采集环境室内场景(图书馆、工艺品商店等)、室外场景(道路、建筑物、广场、火车站等)采集多样性涵盖多
北京市大数据中心 主题领域:2023-08-19更新
-
1,420小时普通话自然语音手机采集数据【数据堂】
格式16kHz,16bit,未压缩wav,单声道录音环境相对安静的环境录音内容无预制文本,录音人以自然方式进行手机通话,只录制录音人
北京市大数据中心 主题领域:2023-08-19更新
-
6,087张体检报告OCR数据【数据堂】
数据规模6,087张,385,107个框采集多样性多种体检报告类型数据格式图像格式为.jpg,标注文档格式为.json标注内容行级矩形框标注
北京市大数据中心 主题领域:2023-08-19更新
-
2,000人会议场景人脸多姿态数据【数据堂】
数据规模2,000人,每人采集23段视频和4张图像人种分布黄种人,白种人,黑种人,棕色人年龄分布从少年到老人,以中青年为主采集环
北京市大数据中心 主题领域:2023-08-19更新
-
2,000人会议场景手势识别数据【数据堂】
数据规模2,000人,每人采集18张图片和2段视频人种分布黄种人,白种人,黑种人,棕色人年龄分布从少年到老人,以中青年为主采集环
北京市大数据中心 主题领域:2023-08-19更新
-
104,320张韩语和印地语自然场景OCR数据【数据堂】
数据规模韩语76,861张,555,913个框;印地语27,459张,200,453个框采集环境包括商品包装、海报、车票、提示语、菜单、建筑物标志
北京市大数据中心 主题领域:2023-08-19更新
-
76,184张扫地机器人视角液体污渍数据【数据堂】
数据规模76,184张图像采集环境包括室内场景采集多样性多种场景、不同时间段、不同拍摄角度、不同物品类别采集设备手机采集时间白
北京市大数据中心 主题领域:2023-08-19更新
-
48类307,776张场景分类数据【数据堂】
数据规模48类,涵盖15个子类,共计307,776张图像采集时间白天、夜晚采集多样性多种场景、不同拍摄角度数据格式.jpg、.png、.jpeg
北京市大数据中心 主题领域:2023-08-19更新
-
351人意大利语手机采集语音数据_引导【数据堂】
格式16kHz,16bit,未压缩wav,单声道录音环境相对安静的室内,无回声录音内容车载场景,智能家居,语音助手人员351名意大利人,
北京市大数据中心 主题领域:2023-08-19更新
-
500人会议场景表情识别数据【数据堂】
数据规模500人,每人采集7段视频人种分布黄种人,白种人,黑种人,棕色人年龄分布从少年到老人,以中青年为主采集环境室内办公场
北京市大数据中心 主题领域:2023-08-19更新
-
500小时闽南语自然对话手机采集语音数据【数据堂】
格式16kHz,16bit,未压缩wav,单声道录音环境相对安静的室内,无回声录音内容给出话题列表,录音人从中挑选多个自己熟悉的话题
北京市大数据中心 主题领域:2023-08-19更新
-
10,000条中文新闻事件标注数据【数据堂】
数据规模1万采集时间2,013年5月数据内容新闻事件标注存储格式xml标注内容事件词语标注数据类别事件提取;舆情监测
北京市大数据中心 主题领域:2023-08-19更新