字段搜索
共有 287 个数据目录
-
工业车辆动态监控时序数据集
本数据集包罗了全国范围内17万工业车辆,尤其是场内物流设备领域的丰富时序数据,为研究者和工程师提供了深入分析和优化场内物流设备运营性能的基础。数据涵盖了场内物流设备在单次作业中的多方面运营细节,从而呈现了一个全面且细致的工业车辆运营画像。
数据堂(北京)科技股份有限公司提供主题领域:2023-11-15更新
-
-
-
-
-
-
-
-
-
中文大模型安全性测评数据集
中文大模型需符合国家相关安全法规要求,本数据集包括政治、暴力、色情、脏话、诱导等多类do-not-answer问题,用于评测和提升大模型的安全性
数据堂(北京)科技股份有限公司提供主题领域:2023-11-15更新
-
-
-
-
-
多领域语音交互大模型高质量语音评测数据集
涵盖26个领域,真实场景音频数据集,可作为模型评测数据集,应用于语音对话与听觉大模型的研究。
数据堂(北京)科技股份有限公司提供主题领域:2023-11-15更新
-
通用场景图像描述基础多模态数据集
120万张图像,图像内容包括但不限于风景、动物、食物、花卉树木、人物、汽车、运动、建筑、卡通动漫、影视剧、商标logo、表格文本、书法绘画、商品展示、生活场景。每张图像至少配备两种不同的简要中文文本描述。
数据堂(北京)科技股份有限公司提供主题领域:2023-11-15更新
-
-
-
印尼语多模态语音视频数据集
多模态模型被认为是目前提高人工智能系统能力的最佳途径之一,而本产品库采用最新采集形式,同时采集录制印尼语native发音人的多人对话的音频和视频数据,共计约84小时的有效对话数据,音频和视频数据采集结果会进行对齐处理,误差在30毫秒以内。在稀缺资源语种的基础上具有非常高的信息丰富度,可提供更加全面的信息输入从而高效提升系统的表现和效率。
数据堂(北京)科技股份有限公司提供主题领域:2023-11-15更新
-