共有 296 个数据目录
开放方式:
-
老年人福利补贴发放信息
该数据是由北京市大数据中心通过AI生成的老年人福利补贴发放信息,包括序号、姓名、性别、所在区、所在街道 身份证号码、入库时间、联系方式、居住地址、户籍地址、出生日期、补贴时间、补贴类型、补贴金额等字段
北京市大数据中心 主题领域:2025-07-29更新
-
老年人能力综合评估信息
该数据是由北京市大数据中心通过AI生成的老年人能力综合评估信息,包括姓名、序号、身份证号码、评估完成时间、评估结果、居住地址、户籍地址等字段
北京市大数据中心 主题领域:2025-07-29更新
-
-
-
-
-
-
-
-
110人多种角度光照表情组合人脸图像数据【数据堂】
数据规模110人,每人2,100张照片人种分布黄种人11人,白种人44人,黑种人55人性别分布男61人、女49人采集环境室内场景采集多样性
北京市大数据中心 主题领域:2024-01-22更新
-
178小时中国儿童麦克风语音采集数据【数据堂】
格式44.1kHz, 16bit,未压缩wav,单声道录音环境相对安静的室内语言普通话录音内容儿童教科书;故事书;数字人员739名中国儿童
北京市大数据中心 主题领域:2024-01-05更新
-
531小时麦克风手机采集车载噪音数据【数据堂】
格式麦克风 32kHz 32bit,wav,单声道;手机 16kHz 16bit,wav,单声道数据特点包含 5 类条件,每类包含多种情景;每段音频对应
北京市大数据中心 主题领域:2023-12-10更新
-
中文普通话语音识别库(桌面)
该识别数据在安静办公室环境中完成录制,共有260位发音人参与,录音时长138.9小时,包括130位男性和130位女性,录音语种中文普通话。所有参与录音的发音人均经过专业筛选,保证其发音标准,吐字清晰。录音文本覆盖短信等信息。
北京市大数据中心 主题领域:2023-12-10更新
-
-
中文大模型垂直领域图像描述数据集
14万张图像,图像内容包括但不限于人脸、车辆、人体行为、手势、中文OCR、场景、监控人体。每张图像配备一段详细中文文本描述。
北京市大数据中心 主题领域:2023-11-15更新
-
语音复刻大模型高品质数据集-中文
本数据集招募了18226名说话者,男女近似1比1。语料覆盖领域多样,包含了对话、唤醒词、控制命令、数字串、新闻论坛、书面语。所有数据使用麦克风进行采集,具备48kHz高采样率,内容自然,是通用语音复刻模型的绝佳训练数据。此数据集已被数家AI头部企业用于声音克隆应用研发,数据质量经过实践检验认可。
北京市大数据中心 主题领域:2023-11-15更新
-
-
-
美国英语多模态语音视频数据集
多模态模型被认为是目前提高人工智能系统能力的最佳途径之一,而本产品库采用最新采集形式,同时采集录制美式英语native发音人的多人对话的音频和视频数据,共计约85小时的有效对话数据,音频和视频数据采集结果会进行对齐处理,误差在30毫秒以内。在稀缺资源语种的基础上具有非常高的信息丰富度,可提供更加全面的信息输入从而高效提升系统的表现和效率。
北京市大数据中心 主题领域:2023-11-15更新
-