算法构成的AI
许多人把一些新的高科技概念想得遥不可及,普通人将这些高新概念当作谈资,拒不深究,认为自己理解了其表象,其实是事务繁忙或大脑懒惰,抑或是觉得离自己过于遥远,懒得将其刨根问底,而一些朋友更是在一知半解的情况下盲目投资,结果可想而知。在21世纪,任何一个新概念都是基础理论层层包装的产品,只要我们将这些概念背后的基础理论挖掘出来,理解这些概念并不困难,当今时代科技换代迅速,而作为生活在21世纪的人,我认为理解新概念的能力是一道进阶阅读题,而其中一些概念更是常识,信息技术的进步正在缩短知识与个人之间的距离,这也是近年来民科风涌现原因,我挑选其中一些常识性概念来做一个系列文章,有兴趣的可以关注订阅。
现在的人工智能技术最接近强人工智能方向的部分是神经网络技术,也就是说这两者之间属于同向但有距离。现有的人工智能技术,所谓的机器学习其实都是被动学习,也就是在算法指定的方向上从大量数据中寻找特征值,在不断优化这个特征的过程中得到更加精准的特征识别率,因此需要大量的数据作为支撑,深度学习训练的数据越多,对特征值的分析越准确。
例如现在的图像识别技术,已经非常成熟了,这些年的AI技术比赛几乎都是以图片识别技术为主要项目和基准来衡量技术团队和技术框架。其中人脸识别技术尤其成熟,特别在我国得到了大规模的应用,无论在行政层面还是商业层面,人脸识别几乎是现在各大应用都会考虑接入的身份认证功能,这得益于我国对个人信息采集的全面与个人隐私意识的淡薄,大量的人脸信息被采集入库并可以被用来训练人脸识别技术,现在的AI对人脸的识别率超过了99.9%,不仅超过了人类肉眼的识别准确率,更具优势的是AI可以同时处理巨量的图像识别任务。
在我国的行政层面,人脸识别技术已经被应用到公共交通/银行开户/公安刑侦/网络实名认证等生活中的各个方面,迅速地取代了不久前的芯片认证技术,也淘汰了各大车站的取票机,你现在只要携带身份证/手机和一张脸,就可以通过公共交通去中国的任何城市,可以说在不久的将来,身份证不用随身携带也会变为可能,因为只要你的没有整容,那么你的面部信息就会绑定着你的ID/手机号/银行账户/信用/行为轨迹… ,现在国家准备发行数字货币,作为拥有最完整的居民信息的国家机器来说,也许以后付款都不需要掏出手机,直接刷脸就能付款,甚至你去超市买东西可以拿了就走,因为在你出门的那一刻,摄像头就已经识别了你的面部,并在你的信用账户中直接扣款了。这是在未来完全有可能发生的。
为何一些AI领域出现了应用级的进展
除了在图像识别上的成就,文字识别和语音识别同样有相当的成就,语音识别,语音翻译,扫图识别文字等等,这些应用对跨语言交流提供了跨专业的便利性。可能有人会思考为什么是这些领域出现了应用级的进展,而不是其他领域,不是万众瞩目的机器动力学也不是股票预测。
其实我们只要回顾一下过去20年多以来互联网的发展,就能找出一个清晰的脉络。在最开始的MSN时代,人们发送消息的方式主要是文字,那时候最流行的是符号表情,因为最开始的图片内容并不繁荣,并非每个人都有相机,从以前运营商发一条彩信的价格就知道图片信息的稀缺了。后来博客开始流行,携带图文的blog成为了热门的信息展现方式,网易/搜狐等门户网站应运而起,独占鳌头。语音信息则是在进入了智能手机时期才开始的,智能手机和电脑不同,每个手机都有麦克风,这为语音消息的普及提供了条件,像微信这类社交应用则抓准时机快速进入市场,第一个通过语音消息解决了不会打字的人群使用手机社交软件聊天的问题,称霸了社交应用市场。
图片来自AppStore
在3G普及之后,图片内容开始更加普及,各种表情包从那时候起开始爆发,形成一种表情包文化,这恰恰也是图片信息繁荣的佐证,随着这一波繁荣,涌现出一批优秀的分享型社交软件:
Facebook/instagram/Twitter等,和一批优秀的图片处理类软件:美图秀秀/camera360等,而到了4G时代站上浪峰的则成为了视频类app,从快手到美拍到抖音,那些年直播类平台之间的竞争更是犹如武林争霸,各位看官好不过瘾。
不知道读者们看到这里有没有切实地感受到通讯技术发展的威力。从1G到4G的过程里,我们的信息应用场景从文字--图片--语音--到视频/直播发生了巨大的变化,从而也积累了大量的文字/图片/语音/视频信息,所以最早发展起来的人工智能技术都是以这几类积累了大量基础数据的领域。
出现应用级增长的都是拥有大量对应的基础数据的领域。
到这里我们就需要自问一个问题,5G时代就要来了,哪一种传播方式会站上浪头呢?很可惜新的订阅号无法开启留言功能,有兴趣的读者可以向订阅号发送私信留言。
图片来自AppStore
出现应用级增长的参考指标
我为大家提供一个思考的脉络。
从仿生学的角度来讲,文字/语音/图片是人类认识世界的最基本的窗口,它同样可以作为人工智能认识世界的窗口,我们换个角度想想的话,认识世界的窗口对人类个体来说属于五感的应用范畴:
视觉:分析图像信息,观察空间;
听觉:分析音波信息,判断距离;
嗅觉:识别气体信息;
味觉:识别液体信息;
触觉:识别固体信息。
文字和语言,分别属于视觉和听觉分析的高级应用,这是文化诞生的标志,文字即是符号学的应用,每一个符号背后都隐藏着暗示,所谓的暗示就是逻辑或信息,用多个简单的符号组合来表达一个复杂逻辑信息,这就是符号学的本质,人工智能理论派中的符号主义归根结底就是秉承了符号学的应用,说简单点,所有的编程语言都是符号学应用的体现,一个简单的if语句,就可以构造二叉树的逻辑体系,可见其强大之处。
既然说到了符号主义,有必要在此补全一下目前人工智能理论派的三个流派:
人工智能的三个流派理论流派:
- 符号主义(symbolicism),又称为逻辑主义(logicism)、心理学派(psychologism)或计算机学派(computerism),其原理主要为物理符号系统(即符号操作系统)假设和有限合理性原理。
- 连接主义(connectionism),又称为仿生学派(bionicsism)或生理学派(physiologism),其主要原理为神经网络及神经网络间的连接机制与学习算法。
- 行为主义(actionism),又称为进化主义(evolutionism)或控制论学派(cyberneticsism),其原理为控制论及感知-动作型控制系统。
不用去为上面抽象的的名称感到烦恼,这三大流派其实并没有什么分歧,从人类设想的强人工智能的结论来讲,这三大流派都是实现强人工智能的必经之路,缺一不可。(对强人工智能概念感兴趣的朋友请点击:人工智能到底能否超越人类(一)AI的真实现状)
符号主义
大家不妨想一想,把强人工智能计划理解为人造人计划的话,仿生对象是不是就是人类本身?那么要创造一个人类,首先需要了解的必定是人类本身。人类的第一特征是思考,理解思考这种脑部活动,最基本的就是逻辑,人类的任何一个思考都是有逻辑可循的,你看到了一扇门,就会想象门背后有什么,看到一则党头条写着:【xx女明星被粉丝xx羞愧难当】,你就会浮想联翩,因为【女明星/羞愧难】当这些词在男性的大脑中都是与荷尔蒙联系在一起的,结果点进去发现什么内容都没有,想想还不如看看Leo的文章。符号主义解决的主要问题就是大脑思考的基础逻辑,例如现在游戏里的电脑人,就拿王者荣耀来举例的话,游戏里人机模式中的电脑人就是基于这种规则所创建的。
连结主义
但是人类不光有表意识,也有潜意识和本能反应,并且人类的思考有个参考物:经验,怎么去理解经验就很有意思里,当人初次见到一个猴子的时候,大脑的识别中心将猴子定义为未知物种,人会通过各种信息途径去了解猴子,分析并存储它的外形特征/名称/习性/纲目,形成一个叫做“monkey”经验神经元,归属于动物分支,当人类多次见到过猴子以后,便不会再好奇并仔细的观察它,因为经验告诉他:这就是只猴子。这里的经验就是一个在大脑中已经归属分类的神经元,你通过眼睛输入猴子的图像,大脑会迅速并准确地检索到猴子的神经元,将以前存储的信息反射到识别中心,当识别中心判断猴子的信息属于【已知】标签时,便不会做出更多反应,直接给表层一个“这是猴子”的结论就一带而过,人就不再好奇,喜新厌旧就是这个道理。
神经元的运作模拟
也就是说这个经验神经元的作用就是一个微型的数据库+解析器,在经过了头几次的学习训练之后就可以形成完整的识别程序,大脑可以从这个神经元中直接得到结论,而不需要重新进行演算。这种做法会大大缩短程序的能耗,提高反应的速度,这就是连接主义主攻的方向,通过神经网络的模式建立起一个快速反应单元,这正是现在的图像识别/文字识别/语音识别的AI程序所做的工作,其实这些AI程序就是一个神经元,在通过训练之后,你只需要输入一个图片/语音信息,就能反馈给你一个结论。
图片来自波士顿动力官网
行为主义
既然叫做人造人,那么光会进行数据分析肯定算不上一个强人工智能,2017年BD公司的机器人翻跟头视频在人工智能背景下爆红,Boston Dynamics公司研发的机器狗和机器人正是行为主义的代表,行为主义的攻克方向就是机械动作,可以描述为:在地球重力环境下适应复杂地形与动作的机器行为学习。可惜的是BD在他们的机器人算法中并没有用到很多机器学习,但不妨碍他们的对机器动力的研究成果为以后真正的机器行为学习做下铺垫。BD公司因为盈利能力问题,先后被DARPA/Google/软银Softbank收购,直到去年被韩国现代以9.2亿美刀缩水三成拿到,算是捡了个宝。对于机器动力学这个领域,我想应该在深度学习和动力学发展更加完善的未来会迎来高速增长。
除了这些之外,要在未来实现强人工智能,对其他不同领域的依赖也非常大,我觉得距离最远的应该是生物科技,其次是材料学,芯片技术,距离最近的是能源领域,这些年电动汽车的爆发式增长其实就是红利之一,因为电池能源领域的发展也将为机器动力学铺平道路。
说到底,现在各种走在强人工智能必经之路上的行业,都将在其实现的道路上走上风口,不是现在也是在不久的将来。