光轮智能合成数据解决方案
申报单位:光轮智能(北京)科技有限公司
浏览量: 发布时间:2024-07-12
案例背景

传统的自动驾驶、机器人等行业数据采集和标注大量依赖人工, 成本高且质量难以保证,同时真实数据难以跨车型、平台使用,造成了利用率低、存储成本高等问题。同时, 自动驾驶中大量长尾场景难以捕捉,使得自动驾驶的数据获取拉出了超长战线,模型算法 无法突破性提升。此外,AI 发展的下一步方向是通过具身智能(自动驾驶、机器人)进 入物理世界,需要大量高质量的 3D 数据来作为 AI 的燃料,但真实数据的供给远远不够。 针对上述行业痛点,光轮智能开创性地结合生成式 AI 和仿真技术,为企业落地 AI 提供合 成数据解决方案,赋予每个自动驾驶公司、主机厂、机器人企业特斯拉车队量级的数据能 力,为企业提供源源不断的高质量 3D、物理真实、可泛化的合成数据。

解决方案

光轮智能目前的产品主要是合成数据解决方案。该方案以一小部分真实数据为蓝本, 在仿真的基础上融合生成式 AI,全过程通过自研 Sim2Real 模型,自动泛化各类天气、光照、 资产颜色等,目前可覆盖数千个场景,可生成高信息增量的用于算法训练的数据。并基于 自研的端到端真实性评测算法保证数据质量和效能。同时合成数据相对于真实数据而言, 无需在采集、处理和标注环节投入大量资金。综上,合成数据更加可控、更加高效,并且 能批量生产海量数据用于大模型训练 , 从而加速国内人工智能技术的发展。光轮智能根据 客户的需求描述为客户交付高质量、真实、多样化的合成数据解决方案,能够为客户提供 准确、可靠的训练和测试数据。

创新点

技术创新方面,国际首创将生成式 AI 融入仿真,打造引领全球技术创新的 3D、物理 真实、可泛化的合成数据解决方案。具备完备成熟的开发工具链,保障按期高质量交付。 模式创新方面,合成数据在国内尚处于发展的萌芽阶段, 技术要求和市场准入门槛较 高,光轮智能从对数据质量要求最高的自动驾驶、机器人、具身智能领域切入,逐步拓展 多个横向领域,具有较强的先发优势和精准的市场定位。 应用创新方面,光轮智能主要聚焦于为自动驾驶、具身智能、多模态大模型等行业提 供合成数据,能实现 99% 的视觉真实 + 物理真实,覆盖数千个场景,具备高生产效率, 解决对细分领域丰富度的高要求、3D 物理真实的动态场景数据的高需求等痛点。

应用成效

经济效益方面,光轮智能公司通过其创新的合成数据解决方案, 在自动驾驶、机器人 以及具身智能领域取得了显著的应用成效。光轮智能提供的合成数据大大降低了企业在数 据采集、处理和标注环节的投入,显著提高了数据利用效率和企业运营效率。面对市场上 迅猛增长的合成数据需求,光轮智能坚持高质量高效率地交付合成数据,现已交付多家国 内外头部主机厂、Tier 1、自动驾驶公司数千万商业订单,服务量产落地以及端到端算法 预研,累计服务客户几十余家,交付数据上亿帧,积累场景数百万个。社会效益方面,光轮智能的合成数据解决方案不仅提升了人工智能大模型的训练效 果,还填补了真实数据利用率低、长尾场景缺乏的问题, 保证了多样化场景下的数据供应, 从而加速了国内人工智能技术的发展。光轮智能的合成数据解决方案在国际顶级创业赛事 HICOOL 2023 全球创业大赛中荣获二等奖,被北京市政府评选为北京人工智能数据伙伴, 成为唯一的合成数据厂商。2024 年,光轮智能团队与上海人工智能实验室(上海 AI 实验 室) 联合推出并开源自动驾驶 3D Occupancy 合成数据集“LightwheelOcc”,被用于 CVPR2024 自动驾驶挑战赛和 China3DV2024 挑战赛。这不仅提升了公司的知名度,也 推动了整个行业的技术进步和社会认可。

image.png