该报告由量子位智库发起,结合对科技领域的长期跟踪,以及对近百家初创公司、产业研究院、投资机构的深度交流,提名了2023年度十大前沿科技趋势。
2023年十大趋势涉及六大领域:AI技术、自动驾驶、空间计算、生物科技、太空探索、能源创新。
具体包括:
- 智能体热潮:人机交互新范式已被大模型打开
- 3D生成进入涌现期:新算法新模型爆发,质量效率可控性日新月异
- 分割模型大一统:计算机视觉即将迎来「GPT时刻」
- 具身智能带来新想象:AGI终极场景下的全新终端
- 端到端自动驾驶成共识:BEV+Transformer重构技术路线
- 空间计算定义明确:消费级产品问世,XR全栈链路打通
- mRNA打开新象限:提供精准医疗新解法,开启生物医药新篇章
- 脑机接口试验新阶段:产品可靠性突破,AI提升数据解码能力
- 可回收火箭进入「中国轨道」:工程化难题被突破,商业航天迎来模式闭环
- 可控核聚变里程碑:点火成功,打开商用想象
一、AI技术
1.智能体热潮:人机交互新范式已被大模型打开
今年的大模型研发热潮同样带动了AI智能体的发展,成为其强大的「动力引擎」。
目前学术界许多研究已经将大模型作为AI智能体的认知核心,大模型拥有的推理技术和强大的自然语言理解能力,让智能体具备了强大的学习和迁移能力,为智能体的研究提供了突破性的技术方案。
今年在智能体的架构方面有所突破,以更灵活的思维算法技术替代了原有的思维链和思维树的推理方式。
在智能体交互方面,斯坦福提出的AI小镇也让公众看到了多智能体协同的效益,实现更高效、更智能的决策与行动。
量子位智库预测未来智能体的发展将有两个方向:
自主智能体和智能体模拟,将分别对应B端、C端需求,能够实现复杂流程的效率提升和提供情感情绪价值。在不久的将来,嵌入自主智能体的软件极有可能改变现有的使用方式,从「用户适应软件」变成「软件适应用户习惯」,真正成为「个人助理」。
2.3D生成进入涌现期:新算法新模型爆发,质量效率可控性日新月异
在AGI爆火的今年,基于游戏、影视、XR等产业对3D数据的需求不断增长,3D生成领域出现了不少突破性的**新算法新模型**,在质量、效率、可控性多项关键性能上的学术研究突破日新月异。
今年在SIGGRAPH2023上被评为最佳论文的《3D Gaussian Splatting for Real-Time Radiance Field Rendering》介绍了一种新的可以实现快速高帧率实时渲染的方法——**3D Gaussian Splatting**。
这一新表达和算法的出现是3D生成领域的一大突破性进展,在部分数据集上多项性能(如速度、质量、可控性)均优于NeRF。
在今年10月,字节跳动的研究团队推出了一种全新的多视图扩散模型——MVDream,能够根据给定的文本提示生成几何上一致的多视图图像。这一新模型可以应用为3D生成的多视图先验,通过分数蒸馏抽样极大地提高了现有的2D提升方法的稳定性,大幅改善了3D一致性问题。
同时,今年还有多个3D生成优化模型陆续出现。
3.分割模型大一统:计算机视觉即将迎来「ChatGPT时刻」
分割一切模型(SAM)是Meta在今年推出的AI模型,10月份相关论文获得ICCV 23的Best Paper Honorable Menthion。受SAM影响,CV领域和相关研究在2023年「再度火热」。
在SAM出现之前,我们所能看到的其他图像分割模型,都是专有模型,良好性能在其他领域无法体现。SAM的最大贡献即可以快速分割没见过的图像,将之前零散的图像分割模型统一。有CV从业者认为SAM的出现是计算机视觉领域进入「GPT时代」的原因。
4.具身智能带来新想象:AGI终极场景下的全新终端
今年是人形机器人和大模型同步迸发的一年,具身智能(Embodied AI)已成为AI研究新热点。
2023年,具身智能领域的几项关键性技术都取得了突破性进展。6月,李飞飞团队发布了具身智能新成果VoxPoser,能从3D空间分析出目标和环境障碍,让真实世界中的机器人在未经培训的情况下直接执行任务。
DeepMind在今年发布了新的视觉语言模型Robotic Transformer 2(RT-2),可以自动从互联网及机器人数据中学习,学习成功可转化为机器人控制的通用指令。
全世界范围内涌现出各种突破性的仿生机器人产品,大模型影响之下,具身智能将迈入新阶段。
二、自动驾驶
5.端到端自动驾驶成共识:BEV+Transformer重构技术路线
今年的CVPR最佳论文颁给了端到端自动驾驶,这几乎代表着一种共识:端到端自动驾驶是行业的未来。
随着生成式AI的发展,以ChatGPT为代表的大语言模型的泛化能力有了极大提升,端到端自动驾驶技术也因此受到广泛关注。
端到端自动驾驶技术以全部模块神经网络化为特征,对规则的依赖度低,具备智能涌现能力和跨场景应用潜力。
2023年,城市NOA成为自动驾驶厂商角逐的新方向,基于Transformer模型的BEV技术则成为当下不二的选择。
BEV+Transformer能够直接生成高质量3D数据,且包含更多有用信息,能够生成更加合理的驾驶指令,有望逐步成为自动驾驶感知的主流范式。
此外,基于BEV的物体可以通过自上而下的视图,完成轨迹预测和路线规划,且能避免图像视角下的尺度和遮挡等问题,也是实现端到端自动驾驶的关键。
三、空间计算
6.空间计算定义明确:消费级产品问世,XR全栈链路打通
6月苹果在WWDC2023开发者大会上正式推出了第一款空间计算设备**Apple Vision Pro**,这一代表性消费级空间计算产品的问世,真正将「空间计算」这一概念推向大众并迅速普及。
空间计算使得计算升维,内容变得更加立体,几乎可以将信息100%复原。
空间计算将成为下一代计算方式,彻底变革传统信息呈现和交互范式,已成为大家的共识。
今年AIGC的爆发和快速发展也开始解决数字内容快速生产创作的问题,实现了空间计算领域的闭环,XR全栈链路被打通。
同时,空间计算的两大技术路线VST/OST齐头并。代表性空间计算产品商业化落地后,将带动XR开发者生态、内容生态以及供应链逐渐完善。XR设备也向「空间计算平台」定义转变,将进一步推动**XR**、**数字孪生**和**元宇宙**等领域加速增长。
四、生物科技
7.mRNA打开新象限:提供精准医疗新解法,开启生物医药新篇章
今年,mRNA领域获得令人瞩目的成就,相关技术获得诺贝尔生理学或医学奖。
过去,由于mRNA技术的不稳定性及人体免疫等多原因,无法应用于新药研发。直到脂质纳米颗粒递送技术、碱基修饰技术的突破,解决了mRNA疫苗应用的难题,实现了快速量产。
由于mRNA具有安全性优势、靶点数量优势、疗效优势、制造工艺优势和研发周期优势,可应用于预防疫苗、治疗疫苗、治疗药物等领域。
在分子设计层面,新提出了线性设计方法以解决在众多mRNA编码序列中的搜索问题,通过**动态规划算法**降低搜索范围,实现快速定位mRNA编码。
在递送技术层面,6月,宾夕法尼亚大学Drew Weissman 教授和Michael J. Mitchell 教授团队新合成了一种**佐剂类脂质**,增强了mRNA的递送效率。
8.脑机接口试验新阶段:产品可靠性突破,AI提升数据解码能力
自脑机接口(BCI)概念提出至今,已经有50年历史。当前脑机接口技术已经进入多个医疗场景,并且进入人体临床试验阶段。
今年,我们看到脑机接口领域的进展集中在神经解码速度的提升上,更接近正常人的文字或语音输出速度。
《Nature》连续发布两篇论文报告新的脑机接口装置。Neuralink在5月下旬宣布,该公司已获得FDA批准,将启动其首个人体临床研究;全球首例非人灵长类动物介入式脑机接口试验在北京获得成功,标志着我国脑机接口技术的突破。
五、太空探索
9.可回收火箭进入「中国轨道」:工程化难题被突破,商业航天迎来模式闭环
当前阶段,运载火箭的回收复用已是世界航天的发展趋势,中国众多商业航天企业也正在研制各自可回收复用型号。
航天技术的发展和规模一直受到发射成本的制约。可重复使用的火箭相比于单次发射的火箭在产能有限的条件下可以实现规模更大周期更短的发射。
今年7月,国际上公认的新一代可重复使用火箭发动机技术方向——液氧甲烷发动机实现了工程化突破,蓝箭航天的“朱雀二号”成为全球首款发射入轨的液氧甲烷运载火箭。
4月和11月,公认的「全球最先进的可回收火箭」——星舰进行了两次试飞试验,解决了推进器和火箭的分离等关键问题,具有重大意义。
六、能源创新
10、可控核聚变里程碑:点火成功,打开商用想象空间
今年以来,核聚变领域的突破不断:
- 4月,我国EAST装置实现了高功率温度下稳态长脉冲高约束模式等离子体运行403秒,创造了**托卡马克装置稳态高约束模运行**新的世界纪录。
- 8月,我国新一代人造太阳「中国环流三号」取得重大科研进展,首次实现100万安培等离子体电流下的高约束模式运行。
近年来,核聚变的底层技术不断突破,尤其是高温超导材料的突破,有望加速实现清洁、低成本核聚变能源的商业落地。
核聚变作为一种全新的能量来源,因其自身极高的能量密度、清洁等特性,已被产学界定义为人类的「终极能源」。一旦核聚变能够实现规模化发电,将颠覆人类社会的能源供给形式。
除此之外,还有这些提名技术领域值得关注:先进算力、卫星互联网、合成生物学、量子计算等。
这也是量子位智库连续第三年《年度十大前沿科技趋势报告》,目前已经成为前沿科技领域的年度参考之一。
完整报告下载地址:https://jkhbjkhb.feishu.cn/wiki/W5D7wuDcbiPXDLkaRLQcAJpOn8f