12月23日,毫末智行(以下简称毫末)发布了中国首个自动驾驶数据智能体系MANA,中文名雪湖。毫末喜欢借助《三体》命名,雪湖就来自《三体》第二部《黑暗森林》,这个名字代表了毫末以AI通向自动驾驶梦想的思考。
AI DAY前一日,毫末刚刚宣布完成A轮近10亿元融资,成为中国第一家实现规模量产的自动驾驶独角兽公司。投资方为美团、高瓴创投、高通创投、首程控股、九智资本等。
目前,毫末的小魔盒平台辅助驾驶里程已经突破400万公里,在2年内有5款乘用车、5款无人物流车、2款无人跟随设备搭载了毫末的产品。毫末计划在未来三年,将有超过100万辆乘用车搭载毫末智行辅助驾驶系统。
MANA体系的构成
毫末通过对400万公里用户行驶里程数的沉淀与思考,总结出与数据规模相关的函数:F(x)=Z+M(x),它展示出一条代表自动驾驶能力发展的曲线。
F代表产品力,Z0代表毫末第一代产品,M是一个把数据转化为知识的函数,包括数据获取、表达、存储、传输、计算、验证,以及对成本和速度的影响。
MANA就是这个最核心的M。MANA由TARS(数据原型系统)、LUCAS(数据泛化系统)、VENUS(数据可视化平台)、BASE(底层系统)四个子系统组成。
具体来看:
BASE包括了数据的获取,传输,存储,计算,以及新的数据分析和数据服务;
TARS是一些关于计算的核心算法原型,用于感知、认知、车端建图和验证的实践;
LUCAS是对算法在应用场景上的实践,包括高性能计算、诊断、验证、转化等核心能力;
VENUS是数据可视化化系统,包括软件和算法的执行情况,对场景的还原,以及数据洞察等能力。
而MANA将是毫末AI的底层系统,作为毫末自动驾驶能力进化的核心动力。
数据在MANA中的实践
毫末CEO顾维灏从感知、认知、标注、仿真、计算五个方面,对毫末如何实践作出进一步的分享。
毫末智行CEO顾维灏
感知
目前毫末核心的感知设备是车载摄像头和激光雷达,核心问题是如何实现1+1≧4的效果。相较于过往标准的结果融合方法,毫末做两种数据源的过程融合,这种方法更高效。
系统中,首先把摄像头和激光雷达的数据在backbone中进行计算,然后经过Transformer的多模态融合,把数据映射到tensor space中。再经过一层特征提取后,加入时间的特征,在这个过程中使用RNN和光流SLAM进行时空融合。这样就有了时空一体的模型,在此基础上再进行多Head的计算,计算出所需要的结果。
这种多数据源的时空融合,会快速拉升感知能力,让自动驾驶系统能够更准确的刻画现实世界。
认知
感知要解决的是从传感器信号中重建客观世界的问题,而认知要解决的是从客观世界到驾驶动作的映射问题。
顾维灏提出认知三要素:安全、舒适、高效。安全上,毫末拥有全栈自研安全认知模型CSS,其核心是自动驾驶系统不只局限在从纯机械的角度保证自己不主动犯错,而是充分考虑从数据中学习到的对其他交通参与者行为的理解和超时空的历史经验;
在安全底线之上,从数据中学习舒适和更高效的量化标准,以及这三要素之间的制约关系,让自动驾驶算法可以更好的处理复杂的驾驶场景,制定更符合用户喜好的驾驶策略。
具体方法是把影响我们驾驶行为的细节,从宏观上分成几个影响因素:天气、道路结构、交通参与者、交通流密度、彼此方位、主车路线、碰撞风险和碰撞时距。毫末从已有的数据中挖掘和表达这些属性,然后在进行聚类和分类,形成下图这个结果。它们将驾驶场景做出宏观维度的划分。
将驾驶场景做宏观维度的划分
毫末正在研究一种端到端的模拟学习,就是以过往的事例为指导,从数字化的场景中得到具体的本车动作。模拟学习,需要更大的数据样本,特别是标注好的数据,然后从数据中学习得到规律。
模拟学习是自动驾驶的最好的认知学习方式,最为直接,因为所有的场景都可以被数字化感知,所有的标注都已经在我们自己开车的过程中自动被标注。我们需要做的,就是挑选更符合要求的驾驶行为,并在不同场景下持续的训练。
毫末首先定义好能够得分的目标函数,它是一个概率函数,表征了在某个场景下人类动作和交通规则约束下该做的动作的概率。
根据前面提到的细分场景分类,训练自车动作和全局最优的网络。毫末实践了6种强化深度学习的算法(下图),发现RSAC算法更适用于我们研究的场景,能够更快收敛,得分最高,走的更远。
图右上为6种强化算法
标注
感知的进步需要很多标注的数据。面对大规模量产,尤其要关注这个问题。比如,Tesla标注了60亿个物体,包括精准的3D信息、深度、速度。毫末现在也有几百人在帮助我们做标注,但是如果做到这60亿,达到如此的精度,按照今天的市场价格,这样的方法并不高效也不经济。
所以毫末要做一个高效的标注系统。毫末把闭环的思路用上,把无监督自动标注算法用上。比如车道线识别,目前大部分是通过自动标注完成的,目前性能是市场上其它很多家的几倍。
验证
验证现在有种流行的说法叫自动驾驶元宇宙。毫末的主要方法就是通过仿真制造训练数据,在仿真世界中整个世界的数据都是被标注好的,是天然的数字世界。在仿真世界中可以呼风唤雨,在不同的光照,天气、道路摩擦系数下,也可以快速完善算法的迭代。
MANA超算中心和HSD
人类的数据规模在从文本向图像转变,其规模非常庞大。因此毫末MANA超算中心正在筹备中,主要用于自动驾驶的数据处理、训练、推理和验证等需求。
此外,顾维灏表示,2022年年中,毫末辅助驾驶系统HPilot即将推出“城市NOH”这一全新功能。2022年下半年,毫末将计划交付全场景NOH,并在2023年推出拥有HSD(HAOMO Self-Driving)的车队。
随着毫末智行MANA——中国第一个自动驾驶数据智能体系的建立,相信国内自动驾驶核心技术将迎来更快、更好的发展。相信未来毫末能够在乘用车、无人物流车等领域成为行业的领导者。
【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】