毫米发布了自动驾驶生成模型DriveGPT的中文名称“雪湖海若”。
自动驾驶大模型DriveGPT雪狐海若通过引入驾驶数据,建立了RLHF(人类反馈强化学习)技术,不断优化自动驾驶的认知决策模型。目前主要用于解决自动驾驶的认知决策问题,最终目标是实现端到端的自动驾驶。
毫米DriveGPT雪狐海若已与有限的首批生态伙伴展开开放合作,北交大计算机与信息技术学院、高通、火山引擎、华为云、JD.COM科技、四维图新、威派新能源、英特尔等高校和企业纷纷加入。
产品方面,全国首个可量产、可再感知的城市NOH将首批落地北京、保定、上海等城市,开启推广测试。到2024年,有序落地100个城市。首款搭载HPilot3.0的全新摩卡DHT-PHEV即将上市,这也是毫米DriveGPT雪狐海若的首款落地车型,充分确保了毫米城NOH的行业领先地位。
生态层面,毫米乘用车6P开放合作取得重大突破,已与三家主机厂签订定点合同,相关项目正在交付。这是毫粉商业化的一次重要飞跃,充分保证了毫粉的高速发展趋势。
毫米之星董事长张凯判断:“2023年,智能驾驶产品将进入全线爆发期,大规模车型将在车端应用,车主的使用频率和满意度将成为产品竞争力的重要衡量标准。数据不断完善所驱动的六大闭环能力,将进一步加快毫米进入自动驾驶3.0时代的步伐,并形成相应的护城河。”
张凯认为,智能驾驶产品正在进入全面快速增长期,2023年是非常关键的一年。首先,2023年城市导航辅助驾驶产品将以量产为主,各大玩家的城市导航辅助驾驶产品将进入真实用户覆盖和多城市落地的竞争。其次,导航和停车的一体化以及终端物流自动配送行业的商业化将成为自动驾驶公司关注的重点。在乘用车领域,搭载集成泊车和停车功能的智能驾驶产品将迎来一波前装量产潮;在末端物流自动配送领域,末端物流自动配送车已经在超市、快递等场景中爆发,2023年将在这些场景中实现可持续商业化的闭环。
首款搭载HPilot3.0的摩卡DHT-PHEV新品即将上市,搭载HPilot3.0的第二款也将于今年发布。HPilot已经装备了近20款。用户辅助驾驶里程突破4000万公里,HPilot2.0辅助驾驶日均里程利用率达到12.6%。在海外布局方面,搭载毫米HPilot的车辆已运往欧盟、以色列等地区和国家,陆续交付用户,并将陆续投放中东、南非、澳大利亚等市场;同时,Hmong HPilot将在墨西哥和俄罗斯量产。
3月,高工智能汽车研究院基于前装量产数据库和指定车库的数据,每年进行一次综合测评。通过对milli前近20辆车的数据研究,授予milli年度高端智能驾驶系统量产份额领先奖。第三方数据证明,米莉是国内量产自动驾驶的绝对领导者。
继《MANA大模型巅峰之战》之后,中国首个自动驾驶数据智能系统MANA架构迎来了全线升级。到2023年4月,MANA将学习超过56万小时,相当于人类司机的6.8万年。毫米DriveGPT雪狐海若已完成基于4000万公里行驶数据的训练,参数规模6543.8+020亿。
三是“NOH百城之战”。中国首个可量产、可再感知的NOH城市,已在北京、保定、上海等城市开始推广测试,即将量产上线,到2024年将有序落地100个城市。最终以“安全第一、用户第一、规模第一”为原则,加速NOH百城战的胜利。
最后是“终端物流自动配送商战”。末端物流自动配送车“小魔驼”已在尚超履约、智慧社区、校园配送、餐饮零售、机场巡逻、高校教育、快递接驳、智慧园区、大气环评等九大场景投入运营,加速商业化闭环能力。2023年3月,小魔驼2.0获得北京亦庄无人配送车车辆代码,开始亦庄运营。毫米也成为《北京智能网联汽车政策先行区无人送货测试规范》升级后,首家允许无人送货车在北京高级别自动驾驶示范区开放道路上测试的公司。
“技术领先是生存之本,鼓励所有技术研发生投入技术创新。”在演讲中,张凯再次强调了Mimo公司投资技术研发的坚定决心。截至目前,米莉已获得164项专利证书,国际顶级学术会议论文6篇。最新的两篇论文入选了计算机视觉识别领域三大顶级会议之一的CVPR和全球首个智能汽车专业期刊IEEE TIV。Millicent已经开放了GitHub中的所有论文,并与业界共享。
现场,张凯还向外界公布了毫米6P开放合作的重要进展。目前已与三家主机厂签订定点合同,相关项目正在交付。“我始终相信,自动驾驶是* * *共进共退,* * *独享成果的前沿产业。只有健康的生态伙伴,才能支撑毫米的快速发展。”张凯说。
此外,米莉一直坚持基于场景的用户体验设计、人工智能技术和技术工程能力的均衡发展,以数据驱动的闭环方式不断提升用户体验。张凯介绍,三个月来,我们在数据驱动的六大闭环体系上取得了多重进展。
在用户需求闭环方面,持续分析驾驶场景数据并改进策略,进行新功能体验反馈;在R&D效率闭环方面,将数据驱动的理念深度应用于产品需求定义、感知、认知算法开发等产品开发流程,整体开发效率提升30%;在数据积累的闭环方面,诊断服务数据场景标签部署在车端,覆盖92%的驾驶场景。
在数据价值闭环方面,大模型在持续挖掘数据价值,解决关键问题;在产品自我完善的闭环中,处理售后问题的速度比传统方式提升十倍,最快可在10分钟定位售后问题。两年时间,产品推广点得到有效挖掘,问题闭环率达到76%;在闭环业务工程方面,我们进一步完善了从收集回收、标签培训、系统校准、模拟验证到最终OTA发布的闭环产品开发流程。
毫米DriveGPT雪狐海若通过引入驾驶数据,建立了RLHF(人类反馈强化学习)技术,不断优化自动驾驶的认知决策模型。它的最终目标是实现端到端的自动驾驶。目前主要用于解决自动驾驶的认知决策问题,未来会继续将很多大模型的能力整合到DriveGPT中。目前,毫米DriveGPT雪狐海若升级了模型架构和参数规模,参数规模达到6543.8+020亿。预训练阶段引入4000万公里量产车行驶数据,RLHF阶段引入5万个人工选择的高难度场景接管剪辑。
DriveGPT海若雪湖底层模型采用GPT(Generative Pre-trained Transformer)模型,不同于ChatGPT使用自然语言的输入输出。DriveGPT的输入是感知融合后的文本序列,输出是自动驾驶场景文本序列,即将自动驾驶场景符号化,形成“驾驶语言”,最终完成车辆的决策调节、障碍物预测、决策逻辑链输出等任务。
DriveGPT雪狐海若的实现过程是:首先在预训练阶段,引入量产驾驶数据训练初始模型,然后引入驾驶接管片段数据训练反馈模型,再通过强化学习利用反馈模型不断优化迭代初始模型,从而形成自动驾驶认知决策模型的持续优化。同时,DriveGPT学虎海若还会根据输入端的提示和CSS自动驾驶场景库的决策样本对模型进行训练,让模型学习推理关系,从而将完整的驾驶策略拆分为自动驾驶场景的动态识别过程,完成可理解、可解释的推理逻辑链的生成。
现场,米莉宣布DriveGPT雪狐海若首款车型为即将量产的新款摩卡DHT-PHEV。顾提到,DriveGPT雪湖可以逐步应用于城市NOH、快捷推荐、智能陪练、浮雕场景。有了DriveGPT雪狐海若的加持,车辆行驶将更加安全;动作更加人性化,丝滑,有合理的逻辑告诉驾驶员为什么车辆选择这样的决策动作。对于普通用户来说,车辆越来越像老司机,用户会对智能产品有更强的信任感,明白车辆的行为是可以预测和理解的。
DriveGPT雪狐海若将与生态伙伴一起率先探索四大应用能力,包括智能驾驶、驾驶场景识别、驾驶行为验证、摆脱困难场景。目前,米莉在使用数据的过程中,已经逐渐建立了一套基于4Clips的驾驶场景识别方案,性价比非常高。在业内,要给出正确的标注结果,一张图需要5元左右;如果使用DriveGPT雪狐海若的场景识别服务,一张图片的价格将降至0.5元。单帧图像的整体标注成本仅相当于行业的1/10。接下来,毫米将逐步向行业开放图像帧和4D剪辑场景识别服务,这将大大降低行业使用数据的成本,提高数据质量,从而加速自动驾驶技术的快速发展。
顾介绍,2023年6月5438+10月发布的中国自动驾驶行业最大的智能计算中心MANA OASIS,从计算能力优化方面升级了三大能力,进一步支撑了DriveGPT雪狐的计算能力。首先,米莉和火山引擎新建立了“全套大型模型训练支撑框架”,实现了异常任务的分钟级捕捉和恢复能力,可以保证千卡任务连续训练数月,无任何异常中断,有效保证大型模型训练的稳定性;其次,开发了以真实数据反馈为核心的增量学习技术,并扩展到大规模模型训练中,构建了大规模模型连续学习系统。自主研发任务级灵活调度器,分分钟调度资源,集群计算资源利用率达到95%。最后,MANA OASIS可以通过提高数据吞吐量来降本增效,满足变形金刚大模型的训练效率。通过引入火山引擎提供的Lego算子库,实现算子融合,端到端吞吐量提升84%。
中国首个自动驾驶数据智能系统MANA经过一年多的应用迭代,全面升级,正式开放赋能。顾郝伟介绍,MANA计算基础服务在参数规模、稳定性、效率等方面针对大规模模型训练进行了专门优化,并集成到OASIS中;其次,将MANA的感知和认知相关的大模型能力融入到DriveGPT雪狐海若中;第三,增加使用NeRF技术的数据合成服务,降低边角案例数据的获取成本;同时,针对多芯片、多车型的快速交付,优化了异构部署工具和车辆适配工具。
此外,MANA的视知觉能力持续提升。一方面可以同时学习三维空间结构和图片纹理,纯视觉的测距精度超过超声波雷达。BEV方案还具有更强的通用性和适应性。另一方面,可以实现单遍和多遍的纯视觉NeRF三维重建,道路场景更加逼真,肉眼几乎看不出区别。通过NeRF进行场景重建后,可以编辑合成真实环境中难以采集到的角点案例。在修改原有全局视角、增加光照/天气效果的基础上,增加了虚拟动态物体合成能力,可以在原有设定的运动轨迹上合成各种硬情况,模拟复杂的城市交通环境,以较低的测试成本提高城市NOH能力边界,更好地应对复杂的城市交通环境。
值得一提的是,面对业内最难的视觉任务之一——单目视觉测量,继特斯拉之后,Millicent还在国内率先验证能否用鱼眼镜头代替超声波雷达进行测距,以满足停车要求。毫米将视觉BEV感知框架引入车侧鱼眼相机,在15m范围内实现了30cm的测量精度,2m内视觉精度高于10cm。在停车场景中使用纯视觉测距代替超声波雷达,将进一步降低智能驾驶的整体成本。
易车超评系统重磅上线!专业、硬核、全面的车评内容汇聚,年度车模榜单新鲜出炉!在易车App上搜索“超评”,等你来看!