顾维灏称,我们正在进入的时代是一个数据驱动的时代,将更多依靠大数据、大模型,通过让模型学会计算commonsense,使驾驶更安全,更加容易融入社会。
他表示,毫末智行建立了中国自动驾驶第一个数据智能体系——雪湖MANA,分为多个子系统,包括数据获取、数据存储、数据计算等。4月11号,毫末智行发布了应用于自动驾驶生成式模型——DriveGPT,中文名“雪湖·海若”,在大数据基础之上,利用GPT新的技术范式,再加上用户对生成策略的反馈,希望能够让自动驾驶的AI能力产生质的提升。
DriveGPT需要大算力的支持,2022年毫末智行与火山引擎一起构建了自动驾驶领域最大的用于数据大模型训练的智算中心——雪湖·绿洲,算力达到67亿亿次/秒,并量身定做高性能存储带宽,用于毫末智行的训练任务以及自动驾驶产品的迭代。顾维灏表示,“有了这个智算中心,以及智算中心上面训练框架持续的保障、持续的迭代,才能让我们的大模型能够连续、稳定、高效的训练出来。”
DriveGPT大模型对计算能力提出了很高的要求,包括算力资源的弹性调度、底层算子性能、训练稳定性等。作为首个应用GPT模型和技术逻辑的自动驾驶算法模型,“雪湖·海若”助力毫末车端感知架构实现跨代升级,技术栈布局继续保持完整态势,加速进入自动驾驶3.0时代。
目前,DriveGPT已拥有4000万公里量产车驾驶数据,参数规模1200亿。毫末智行与火山引擎共同发力,在算力端做了大量优化,高性能计算、高性能存储、高性能网络并举。基于海量真实人驾数据预训练的大模型,在RLHF加持下,通过不断输入真实人驾接管数据,持续优化自动驾驶决策模型,借鉴海量真实驾驶数据,在不同路况、天气和变量下,做出最优解,将Hardcase通过率提升48%。
顾维灏表示,相信这种GPT的技术范式,可以广泛应用在城市辅助驾驶、高速辅助驾驶、困难场景脱困、智能推荐,智能陪练等多元化场景。同时,随着用户规模和持续的使用里程不断扩大,在大数据、GPT、用户反馈、强化学习等支持下,DriveGPT也将重塑汽车智能化技术路线,让自动驾驶更早到来,让消费者能够更安全的体验到专属司机的乐趣。