(毫末智行CEO顾维灏博士发表《毫末和自动驾驶的3.0时代》主题演讲)
拥抱Attention大模型,持续保持技术领军性,毫末全力冲刺自动驾驶3.0时代
什么是自动驾驶3.0时代?驱动因素是什么?毫末目前处于什么阶段?顾维灏在演讲中针对上述问题进行了分享。
(顾维灏现场演讲)
顾维灏表示,Attention大模型作为当前AI发展的新趋势,其所带来的机遇和挑战,成为自动驾驶3.0时代的重要驱动因素之一。Attention最大的特点是结构简洁,可以无限堆叠基本单元得到巨大参数量模型,随着参数量的增加和训练方法的提升,大模型的效果在很多NLP任务上已经超越了人类平均水平。不过Attention的大模型也面临一大挑战,即由于其对算力的需求远远超出了摩尔定律,这导致大模型的训练成本非常高,在终端设备上的落地非常困难。
(顾维灏表示,Attention大模型是当前AI发展的新趋势)
Attention大模型带来的机遇和挑战,正驱动自动驾驶行业的技术变革。“毫末正在通过低碳超算来降低自动驾驶成本,通过改进车端模型和芯片的设计来实现大模型的车端落地,通过数据的组织让大模型发挥更大效力。”顾维灏表示,在数据层面,基于Attention大模型,自动驾驶需要大规模且多样性的训练数据,而基于大规模真实人驾数据的乘用车辅助驾驶才有能力积累到足够规模和足够多样的数据。“我们有理由认为,辅助驾驶是通往自动驾驶的必由之路。因为只有辅助驾驶,才有能力收集到足够规模和足够多样的数据。”据悉,毫末经过接近三年的发展,目前已是中国量产自动驾驶公司的第一名,目前用户辅助驾驶里程已接近1700万公里,数据规模正在持续快速增加。
(顾维灏表示,辅助驾驶是通往自动驾驶的必由之路)
低碳超算层面,毫末在此次AI DAY上正式官宣了中国自动驾驶科技公司首个超算中心。顾维灏表示:“如何提升训练效率降低训练成本,实现低碳计算,是自动驾驶走进千家万户的一个关键门槛。”毫末超算中心的目标是满足千亿参数大模型,训练数据规模100万clips,整体训练成本降低200倍。
(中国自动驾驶公司首个超算中心——毫末超算中心揭开面纱)
在算法模型层面,顾维灏介绍,毫末早在2021年6月便启动了针对transformer大模型的研究和落地尝试。正是基于过去一年多在训练平台改造升级、数据规格和标注方法的切换准备、针对感知、认知具体任务的模型细节探索等方面的成功实践,为现在毫末在城市导航辅助驾驶场景中的快速发展打下了坚实基础。
(毫末的新技术实践之路)
“以数据驱动的自动驾驶3.0时代已经到来。”顾维灏认为自动驾驶近十年的发展可分为硬件驱动、软件驱动、数据驱动三大时代。数据驱动时代,是完全不一样的时代,大模型+海量数据“双剑合璧”,数据开启自训练模式;感知技术上,多模态传感器联合输出结果;认知技术上,以可解释的场景化驾驶常识为主;自动驾驶里程由硬件驱动、软件驱动时代的百万公里、上千万公里,直接飙升到了1亿公里以上。以数据驱动为核心,以上4个技术条件并行成立才能称为真正进入自动驾驶3.0时代。
“毫末一直在为自动驾驶3.0时代做准备,在感知、认知、模式建设上,都是按照数据驱动的方式建设的。我们所做的一切的,都是为了能够做出数据通道和计算中心,以便可以更高效地获取数据,并把数据转化为知识。”目前特斯拉已领跑全球率先进入自动驾驶3.0时代,而毫末最有可能成为中国公司中第一个进入自动驾驶3.0时代的公司。
“我们对创新充满热情,对新思想,新方法,新技术敞开怀抱,尤其关注能和数据规模增长形成正循环的技术路线。这也是毫末做技术战略决策的第一性原理:能将数据规模优势快速转化为能力优势的技术路线就是好路线。”顾维灏表示,对于前沿技术的探索和落地,毫末会一直保持最极,最敏锐,最开放的心态,努力为用户提供更好的产品体验,促进行业的发展进步。
MANA六大里程碑式升级,领行业之先开启城市NOH“进城”之路
对领先技术的极致追求,不仅让毫末始终走在行业创新前沿,同时也在当下自动驾驶公司集体鏖战的城市辅助驾驶场景中赢得技术探索与落地的先机。
城市导航辅助驾驶场景是当前自动驾驶功能的核心突破点,也是兵家必争之地。然而从道路与交通状况单一的高速场景进入交通参与者众多、道路与交通状况极其复杂的城市场景,自动驾驶系统面临的技术难度可以说是倍数级增长。巨大的挑战也拖住了众多自动驾驶厂商“进城”的步伐,只能持续鏖战技术突破点。作为中国量产自动驾驶第一名厂商,毫末早在2021年底就立下了打赢“辅助驾驶城市场景之战”的Flag,率先在城市辅助驾驶领域开启了技术探索之旅,如今毫末数据智能体系MANA正迎来多项里程碑式的升级迭代。
顾维灏表示,城市道路主要存在“4类场景难题、6大技术挑战”。其中场景难题主要包括“城市道路养护”“大型车辆密集”“变道空间狭窄”“城市环境多样”。解决上述场景难题,技术层面面临六大挑战:如何能更高效地将数据规模转化为模型效果,如何让数据发挥更大的价值,如何使用重感知技术解决现实空间理解问题,如何使用人类世界的交互接口,如何让仿真更真,如何让自动驾驶系统运动起来更像人。
为了应对上述挑战,MANA感知智能、认知智能等方面均迎来更新升级。
首先,MANA通过使用大规模量产车无标注数据的自监督学习方法打造模型效果,相比只用少量标注样本训练,训练效果提升3倍以上,这让毫末数据优势得以高效转化为模型效果,以更好适应自动驾驶各种感知任务需求。
其次,MANA感知能力提升,让海量数据不再被区别对待。面对巨大数据规模下的“数据效率”难题,MANA构建了增量式学习训练平台,抽取部分存量数据加上新数据组合成一个混合数据集。训练时要求新模型和旧模型的输出保持尽量一致,对新数据的拟合尽量好。相比常规做法,整体算力节省80%,响应速度提升6倍。
第三,MANA感知能力更强。通过使用时序的transformer模型在BEV空间上做了虚拟实时建图,使得感知车道线的输出更加准确和稳定,让城市导航自动驾驶告别高精地图依赖。
第四,MANA感知能力更准,让中国没有不能识别的车辆信号灯。MANA通过升级车上感知系统,对刹车灯、转向灯状态进行专门识别,让驾驶员在处理前车急刹、紧急切入等场景中更安全和舒适。
第五,MANA认知能力也再次进化。面对路口这一城市最复杂场景,MANA在仿真系统中引入了高价值的真实交通流场景,与浙江德清、阿里云合作,将路口这一城市最复杂场景引入仿真引擎,构建自动驾驶场景库,通过自动驾驶的真实仿真验证,时效性更高、微观交通流更真实,有效破解了城市路口通过“老大难”问题。
最后,MANA认知智能迎来新阶段。通过对覆盖全国的海量人类驾驶进行深度理解,学习常识和动作拟人化,使得毫末辅助驾驶决策更像人类实际驾驶行为,可结合实际情况选择最优路线保证安全,体感更像老司机。
MANA的再次进化,为毫末城市NOH扫平了“进城”路上的最大障碍。“毫末城市NOH是更懂中国城市路况的导航辅助驾驶。”顾维灏表示,毫末城市NOH采用“重感知、轻地图、大算力”技术路线,在MANA的赋能助力下,具备智能识别交通灯、智能左右转、智能变道、智能躲避障碍物-静态、智能躲避障碍物-动态五大亮点功能,此外“智慧交通流处理”功能也将正式发布。
在演讲最后,顾维灏表达了毫末人对自动驾驶未来的坚定信心和奋斗热情。“1000多天前,我们生于毫末,并亲身见证了中国自动驾驶落地最快的1000天。我们欣喜于已经取得的成就。但1000天,也只是战斗的开始。让自动驾驶真正飞入寻常百姓家,才是我们的星辰大海。在自动驾驶的路上,毫末人将奋斗不息,战斗不止!”