共有 296 个数据目录

  • 商务图片数据集

    有关商务办公、金融等场景的图像数据,包含高清图片、说明、标签等,包含高清图片、说明、标签等


    北京市大数据中心 主题领域:2023-11-15更新

  • 舆情数据集

    涵盖新闻、短视频、微博、微信、APP、自媒体等媒体渠道,每天采集入库的泛舆情数据超过1亿条,在此基础上,精细化数据维度,打标形成正负面数据和六类情绪数据,11个行业数据,“民生问题”“ 涉黑涉暴”“直播乱象”“意识形态”等60种相关敏感规则数据。同时,累积了上百位重点人物、上万个意见领袖,以及几十万个媒体/个人账号。基于社会实时发生的热点事件,每年创建记录万余条舆情专题事件,采集存储上亿条相关信息,并对重点舆情事件撰写形成舆情分析报告,目前累计1万余篇。


    北京市大数据中心 主题领域:2023-11-15更新

  • 肖像图片数据集

    有关人物肖像的图像数据,包含高清图片、说明、标签等


    北京市大数据中心 主题领域:2023-11-15更新

  • 自然风光图片数据集

    有关自然风光的图像数据,包含高清图片、说明、标签等


    北京市大数据中心 主题领域:2023-11-15更新

  • 全网实时舆情数据与社交媒体数据

    中国互联网上公开数据,包含:新闻网站、微信公众号,知乎、天涯、小红书等论坛,抖音快手等短视频平台,资讯类APP等全平台文本内容;包含账号标签及各平台上阅读量、点赞量、转发量等公开平台数据;同时对文本数据进行正负面、情绪判别。


    北京市大数据中心 主题领域:2023-11-15更新

  • 国家政务问答

    面向政务服务大模型-慧政,是中科汇联自主研发的AiGCP智能生成大模型平台,该平台基于LLM110亿参数规模、可信中文数据源训练、国产信创支持、可私有化部署的垂直行业大模型平台。平台支持多模态、大模型指令集微调,实现三大应用·智语(上下文多轮对话)、智画(文本生成图片)、智人(数智人交互)。中科汇联基于AiGCP智能生成大模型平台,推出了面向政务行业大模型-慧政、面向医疗行业大模型-阳明以及面向金融行业大模型-慧金等系列垂直行业大模型产品。


    北京市大数据中心 主题领域:2023-11-15更新

  • 运动图片数据集

    有关健身、运动等人物和场景的图像数据,包含高清图片、说明、标签等


    北京市大数据中心 主题领域:2023-11-15更新

  • 智慧网络数据集

    围绕网元智能、运维智能、服务智能三大方向建设,是业界首个涵盖无线信道、基站、云网、核心网、哑资源等多领域,支持感知、诊断、预测、决策等多类网络AI能力研发的标志性数据集。


    北京市大数据中心 主题领域:2023-11-15更新

  • 问问基础评测集

    动机:(1)市面上的已有评测集存在依赖国外开源数据的问题,翻译过来的题目存在文化bias,涉及语言类的题目缺乏汉语视角,不能忠实反映大语言模型在中国语境中日常问题、日常语言中的表现;(2)市面上的已有评测集中包含大量的语言逻辑题,却未充分体现汉语的特点;(3)市面上的已有评测集分类较为随意,不能有效把握问题反映出来的大模型能力


    北京市大数据中心 主题领域:2023-11-15更新

  • 工业车辆动态监控时序数据集

    本数据集包罗了全国范围内17万工业车辆,尤其是场内物流设备领域的丰富时序数据,为研究者和工程师提供了深入分析和优化场内物流设备运营性能的基础。数据涵盖了场内物流设备在单次作业中的多方面运营细节,从而呈现了一个全面且细致的工业车辆运营画像。


    北京市大数据中心 主题领域:2023-11-15更新

  • 全球药物数据集

    借助药物、临床与专利的关联信息,全方位获取行业研发情报与药品临床信息研发人员可以快速获取当前市场的战略布局,迅速调整策略,做出决策。


    北京市大数据中心 主题领域:2023-11-15更新

  • 北京政务问答

    面向政务服务大模型-慧政,是中科汇联自主研发的AiGCP智能生成大模型平台,该平台基于LLM110亿参数规模、可信中文数据源训练、国产信创支持、可私有化部署的垂直行业大模型平台。平台支持多模态、大模型指令集微调,实现三大应用·智语(上下文多轮对话)、智画(文本生成图片)、智人(数智人交互)。中科汇联基于AiGCP智能生成大模型平台,推出了面向政务行业大模型-慧政、面向医疗行业大模型-阳明以及面向金融行业大模型-慧金等系列垂直行业大模型产品。


    北京市大数据中心 主题领域:2023-11-15更新

  • 北京政务事项

    面向政务服务大模型-慧政,是中科汇联自主研发的AiGCP智能生成大模型平台,该平台基于LLM110亿参数规模、可信中文数据源训练、国产信创支持、可私有化部署的垂直行业大模型平台。平台支持多模态、大模型指令集微调,实现三大应用·智语(上下文多轮对话)、智画(文本生成图片)、智人(数智人交互)。中科汇联基于AiGCP智能生成大模型平台,推出了面向政务行业大模型-慧政、面向医疗行业大模型-阳明以及面向金融行业大模型-慧金等系列垂直行业大模型产品。


    北京市大数据中心 主题领域:2023-11-15更新

  • 植物图片数据集

    有关植物、花的图像数据,包含高清图片、说明、标签等


    北京市大数据中心 主题领域:2023-11-15更新

  • 城市风光图片数据集

    有关城市风光的摄影照片数据,包含高清图片、说明、标签等


    北京市大数据中心 主题领域:2023-11-15更新

  • 建筑图片数据集

    有关城市建筑的图像数据,包含高清图片、说明、标签等


    北京市大数据中心 主题领域:2023-11-15更新

  • 医学图片数据集

    有关医学、病症的图像数据,包含高清图片、说明、标签等


    北京市大数据中心 主题领域:2023-11-15更新

  • 代码数据集

    覆盖多种热门编程语言,Java、Python、C++、Javascript、Ruby、Go等,并且经过严格去重,确保数据集中重复数据最小化,提高大语言模型的逻辑推理能力


    北京市大数据中心 主题领域:2023-11-15更新

  • 中文大模型安全性测评数据集

    中文大模型需符合国家相关安全法规要求,本数据集包括政治、暴力、色情、脏话、诱导等多类do-not-answer问题,用于评测和提升大模型的安全性


    北京市大数据中心 主题领域:2023-11-15更新

  • 中国古诗文数据库

    包含了中国先秦、两汉、魏晋、南北朝、五代、金朝、隋代、唐代、宋代、元代 明代、清代、近代、现代等诗词


    北京市大数据中心 主题领域:2023-11-15更新

找到296项  第2页/共15页     上一页   1  2  3  4  5  6  7  8  9  10  下一页   末页