深度学习获得图灵奖,它跟我们的生活有多少关系

【编者按】北京时间3月27日晚,ACM(计算机协会)宣布把2018年度图灵奖颁给了深度学习“三巨头”——Yoshua Bengio、Geoffrey Hinton和Yann LeCun,以表彰他们在深度学习神经网络上的工作。图灵奖被认为是计算机领域的“诺贝尔奖”。

本文节选自特伦斯·谢诺夫斯基(Terrence Sejnowski)的最新作品《深度学习:智能时代的核心驱动力量》,特伦斯·谢诺夫斯基与本届图灵奖得主之一Geoffrey Hinton共同发明了玻尔兹曼机。

特伦斯·谢诺夫斯基

什么是深度学习?

如果你在连接了互联网的安卓手机或谷歌翻译平台上使用语音识别功能,你其实是在与经过深度学习训练的神经网络进行交流。深度学习是机器学习的一个分支,它根植于数学、计算机科学和神经科学。深度网络从数据中学习,就像婴儿了解周围世界那样,从睁开眼睛开始,慢慢获得驾驭新环境所需的技能。深度学习的起源可以追溯到20世纪50年代人工智能的诞生。

深度学习与每个人有什么关系?

AI医疗

随着机器学习的成熟并被应用于可获取大数据的许多其他问题,服务行业和其相关职业也将发生转变。

基于数百万患者病情记录的医学诊断将变得更加准确。最近的一项研究将深度学习运用到了囊括超过2000种不同疾病的13万张皮肤病学图像中,这个医学数据库是以前的10倍大。

计算机对新患者医学影像的诊断与21位顶级皮肤科专家的结论基本一致,甚至在某些情况下还要更准确。

在不久的将来,任何一个拥有智能手机的人都可以拍下疑似皮肤病变的照片,并立即进行诊断——而现在要完成同样的过程,我们需要先去看医生,耐心等待病变被专家筛查出来,然后再支付一大笔账单。

这一进步将大大扩大皮肤病护理的范围,提升护理质量。如果个体可以很快得到专家诊断,他们会在皮肤病的早期阶段,也就是更容易治疗的时候就开始就医。借助深度学习,所有的医生都将更准确地诊断罕见的皮肤病。

不单是皮肤病,借助深度学习的诊断,医生可以将癌症诊断的准确度从0.966提高到0.995。误判的情况将大大减少,更多生命将被挽救。每个人都将是AI医疗的受益者。

自动驾驶

不久之前,人们还常说,计算机视觉的辨别能力尚不如一岁大的孩子。如今看来,这句话要改写了。计算机不仅能和大多数成年人一样识别图片中的物体,在马路上驾驶汽车的安全性还高过16岁的青少年。更神奇的是,如今的计算机不再是被动按照指令识别和驾驶,而是像自然界的生命由数百万年前开始进化那样,自主地从经验中学习。

自动驾驶汽车不久将扰乱数百万卡车司机和出租车司机的生计。最终,如果一辆自动驾驶汽车能够在一分钟内出现,将你安全带到目的地且无须停车,在城市拥有汽车就显得不那么必要了。

今天,汽车行驶时间平均仅占4%,这意味着它其余96%的时间都需要停放在某个地方。由于自动驾驶汽车可以在城市外围维修和停放,城市中被大量停车场占用的空间得以被重新高效利用。城市规划者已经开始考虑让停车场变成公园了。街边的停车道可以成为真正的自行车道。

其他汽车相关行业也将受到影响,包括汽车保险业和修理厂。超速和停车罚单将不复存在。由醉驾和疲劳驾驶导致的交通事故死亡人数也会相应减少。通勤浪费的时间也将被节省下来做其他事情。

可以预见的是,卡车会在10年内实现自动驾驶,出租车要花上15年,15~25年后,客运无人车将全面走入我们的生活。

智能翻译+语音识别

语言翻译是人工智能的一只圣杯,因为它依赖于理解句子的能力。

谷歌最近推出了基于深度学习的最新版谷歌翻译(Google Translate),代表了自然语言翻译质量的重大飞跃。几乎一夜之间,语言翻译就从零散杂乱的拼凑短语,升级到了语意完整的句子。之前的计算机方法搜索的是可以被一并翻译的词汇组合,但深度学习会在整个句子中寻找词汇之间的依赖关系。

也许有一天,机器能够通过整合莎士比亚的所有诗歌来翻译他的作品。

人工智能的另一只圣杯是语音识别。

这一突破性成果将在之后的几年逐渐影响我们的社会,计算机键盘会被自然语言接口取代。随着数字助手,如亚马逊的Alexa、苹果的Siri以及微软的Cortana先后进入千家万户,这种取代已经在发生了。就如随着个人电脑的普及,打字机退出了历史舞台,有一天电脑键盘也将成为博物馆的展品。

语音识别和语言翻译结合到一起时,实时的跨文化交流将有可能实现。《星际迷航》中那种万能翻译机将触手可及。

社交机器人+情绪识别

电影经常将人工智能描述为像人类一样走路和说话的机器人,目前人工智能的进展主要集中在感官和认知方面,运动和行为智能的进展相对缓慢。

加州大学圣迭戈分校神经计算研究所机器感知实验室的教员和联合主任哈维尔.莫维兰发明了一个著名的社交机器人Rubi。Rubi的头可以旋转,眼睛是相机,嘴和眉毛都十分富有表现力。Rubi头顶上浓密的光纤会随着它的心情而改变颜色。18个月大的幼儿通过Rubi腹部的平板电脑与Rubi进行互动。

你的面部表情是你脑内情绪状态的窗口,深度学习现在已经可以探进这个窗口了。

艾克曼是世界著名的面部表情专家,是美剧《别对我撒谎》(Lie to Me)系列中卡尔·莱特曼(Cal Lightman)博士在真实世界中的原型。艾克曼开发了面部动作编码系统来监控面部44块肌肉的状态。

面部表情是动态的,可以延续若干秒,但是艾克曼发现,有些表情只持续了几帧。这些“微表情”是受到抑制的大脑状态的情感泄漏,常常很能说明情感状态,有时会揭示无意识的情绪反应。例如,在婚姻咨询环节中出现的细微的厌恶表情,就是一个预示婚姻会失败的可靠

迹象。

在不久的将来,你的智能手机可能不仅会问你为什么不高兴,还可能帮助你冷静下来。

深度学习的其他深度影响

法律

深度学习刚刚开始影响法律界。技术辅助审核或调查将被人工智能接管,它可以浏览数千份文件以获取合法证据,且丝毫不会感到厌倦。自动化深度学习系统将为现在无法负担律师费用的普通人提供法律建议。法律工作不仅收费会更便宜,也会更高效,这一点通常比费用更重要。

投资

机器学习正在推动算法交易,它比传统的长期投资策略更快速,比股票市场中的高频交易更加慎重。许多不同类型的机器学习算法被组合运用以获得最佳回报。

竞技

一个名为“DeepStack”的深度学习网络和33名德州扑克职业选手进行了44852场比赛。令扑克专家震惊的是,在这种诈唬、欺骗的技巧和拿到的牌一样重要的游戏里,它以相当大的优势击败了最出色的扑克玩家。

如果这一成就能复制到其他基于不完全信息、需要人来做判断的重要领域,比如政治学和国际关系,其影响可能是极其深远的。


读书推荐

读书导航