它将是你的第二大脑 接入深度学习系统的谷歌 能帮我们做决定吗
本篇文章8385字,读完约21分钟
杰弗里·海顿说:我需要知道你的背景。你有理科学位吗?
在加州山景城的谷歌校园办公室里,海棠站在白板前。2013年,他以杰出研究员的身份加入公司。海顿也许是世界上最早研究神经网络系统的专家。在20世纪80年代中期,他是人工智能技术的先驱(他提到他从16岁开始思考神经网络)。此后,基于模拟人脑原理的神经网络被认为是解决计算机视觉和自然语言等难题的一种很有前途的方法。但是渐渐地,一些人失去了耐心等待,人们开始质疑他们是否应该继续。
杰夫·辛顿。照片:Michelle xiu/back channel
大约十年前,在多伦多大学韩丁的实验室里,他和其他研究人员取得了突破,突然使神经网络成为人工智能领域最热门的话题。不仅是谷歌,还有其他一些公司,如facebook、微软和ibm,都开始疯狂地追逐这一领域的一些科学家。他们擅长建立多层模拟神经元结构,使整个系统可以训练或自训练,然后预测随机输入值的相关性。
这更像是一个婴儿,他学会组织流入他最初感官的数据。这种新的有效的处理方法被称为深度学习,以及一些长期的计算问题(如计算机的视听能力等)。)都解决了。我们期待的智能计算机系统突然出现在我们面前,然后谷歌搜索将变得更加有用。
深度学习的突破对于谷歌搜索的下一个跨越式发展至关重要:理解现实世界,在为用户提供准确答案和信息方面向前迈出一大步。为了保持搜索的活力,谷歌必须变得更聪明。
这正是谷歌想要的。在公司的早期,创始人认为谷歌是一家人工智能公司。它不仅在搜索中使用人工智能,尽管其搜索引擎与人工智能正相关,而且还将其用于广告系统、自动驾驶汽车和计划将纳米粒子注入人体血管进行早期疾病监测。正如拉里·佩奇在2002年告诉我的:
我们并不总是生产人们想要的东西,这是我们工作的难点。为了实现这个目标,你必须足够聪明,你必须了解世界上的一切,你必须知道如何提问。我们正在努力的是,搜索引擎最终会非常智能,所以我们正在努力实现这个目标。
当杰弗里·海顿取得这一突破时,谷歌准备走上这条路。多年来,该公司一直在使用机器学习作为一种更传统的方式,使搜索引擎更强大,它在这方面遥遥领先。
几年后,公司雇佣了一群人工智能工程师和科学家,他们让搜索引擎像同义词一样学习。当数百万用户使用一个可替换的词(比如狗和小狗)时,谷歌可以快速地利用知识来更好地理解问题。当谷歌承担网站翻译工作时,它的科学家会将大量翻译后的文档和来源输入系统。通过这种方式,谷歌搜索引擎学会了如何将一种语言与另一种语言进行匹配。
深度学习被视为超越那些更直接的机器学习的关键一步
深度学习的追随者声称它基于人类的大脑结构。以前,基于计算机特征实现智能几乎是不可能的,或者至少是非常困难的,但深入的学习为其提供了可能性,这就是为什么辛顿的突破对谷歌以及其他拥有搜索或类似业务的公司如此重要。在过去的几年里,谷歌一直在努力将搜索引擎塑造成一个吸引人们讨论的话题。然而,有必要拓展人工智能的前沿研究,使计算机获得初级的、类人的智能。深度学习是完成这项任务最流行的工具。
神经网络是模拟大脑在生物学中的学习方式。当你试图执行一项新任务时,一组特定的神经元会被激活。你观察结果,然后用反馈来调整哪些神经元应该被激活,从而训练大脑。很多次之后,一些神经元之间的联系会变得更强,而另一些会变得更弱,这就形成了记忆的基础。
模拟神经网络本质上是通过编码复制这个过程。然而,与复制人脑复杂的神经元结构相比,模拟的神经网络更小,神经元排列整齐、层次分明。第一层(或初始基础层)是特征检测,一种人类感官的计算形式。当计算机将数据输入神经网络时,例如图像、语言或文本文件的数据库系统,它通过检测特征值来学习。例如,如果任务是识别垃圾邮件,神经网络研究人员可能会将大量信息输入系统,并将其标记为垃圾邮件和非垃圾邮件。该神经网络将自动检测某些单词的复杂特征和模式,并能确定电子邮件是否是垃圾邮件。
在早期的神经网络实验中,计算机不能设计自己的特征,所以这些特征需要手工添加。辛顿的开创性贡献是开发了一种称为反向传播的技术,这是一种反馈机制,允许系统更有效地从错误中学习,并定义自己的特征。回到1986年,我们首先开发了反向传播算法。我们很高兴它能学习多层特征检测。我们认为我们已经解决了这个问题。但是,韩丁说,在解决实际问题上没有大的突破,这很令人失望。我们完全算错了所需的计算资源和标记案例的数量。
然而,尽管许多研究人员多年来不再相信神经网络,但辛顿仍然强烈地认为它们会有实用价值。1995年,他和他的学生试图放弃手工标注,至少在学习过程的早期阶段。这项技术被称为无监督预训练,这意味着系统可以计算如何组织自己的输入值。然而,韩丁说,这项工作的核心是数学技能,这是一种节省计算时间的近似方法。当信息通过各级神经元时,它将触发更多的迭代来改善网络。正如经常遇到的,速度可以改变,这使得学习神经网络以前不能完成的行为成为可能。这就像一个人突然平静下来说,我可以在十分钟内完成五个小时的滑雪。
随着无监督学习的出现,人类专家只需要在后期阶段干预机器,即标记更多期望的结果,并为成功的结果提供奖励。辛顿说:想象孩子。当他们学会识别奶牛时,他们不需要看数百万张由母亲标记的奶牛照片。他们只是了解奶牛长什么样,然后问:这是什么?妈妈会说:这是一头牛,他们会学的。深度学习与此相似。
当辛顿团队测试这个模型时,他们只是受益于超高速图形处理器(gpu),这在神经网络启动时是不可用的。虽然这些芯片最初是为了导出高级图像的计算公式而设计的,但它们也非常适合神经网络的计算要求。韩丁为实验室买了一堆图形处理器,并让两个学生操作这个系统。他们进行了一项测试,看神经网络能否识别语音中的音素。这自然是包括谷歌在内的许多科技公司试图掌握的技术。因为在即将到来的移动时代,语音将成为输入模式,计算机必须学会更好地聆听。
杰夫·辛顿。照片:Michelle xiu/back channel
系统如何运行?
他们取得了令人兴奋的结果。辛顿说,最初的结果几乎和当时的技术一样好,而后者已经被调试和开发了近30年。显然,如果我们在最初的尝试中取得如此好的结果,我们的最终结果会更好。在接下来的几年里,韩丁团队做了更认真的尝试。结果发布时,辛顿说该系统已经能够匹配现有商业模型的最佳性能。重点是,它是由两个学生在实验室里做的。他说。
深度学习诞生了。
2007年,在项目过程中,韩丁在谷歌上做了一个关于山景城深度学习的技术演讲,极客们踊跃参加,在youtube上也很受欢迎。这有助于传播神经网络将成为强大工具的观点。这也引发了一波招聘该领域技术专家的热潮。辛顿的学生去了ibm、微软,当然还有谷歌。这是处理这个领域的四大公司中的三家(另一家是nuance,苹果的技术供应商)。
每个人都可以自由使用欣顿实验室的结果来改进他们自己的系统。我们对此基本上没有保留,因为我们专注于证明我们技术的优势。辛顿说,有趣的是,微软研究院和ibm比谷歌更早获得这项技术,但谷歌在将技术转化为产品方面比任何人都快。
辛顿的加入只是谷歌在该季做出的一系列重大任命之一。就在几个月前,乐观的人工智能哲学家雷·库兹韦尔(ray kurzweil)刚刚加入了包括彼得·诺维(peter norvig)和塞巴斯蒂安·特隆(sebastian thrun)等人工智能传奇人物在内的团队。
目前,谷歌痴迷于深度学习,显然认为这将导致下一代搜索的重大突破。移动计算的出现迫使谷歌改变了搜索引擎的本质特征。为了走得更远,它必须采取一种与人类对世界的认知相一致的方式,当然,另一方面,它也必须执行非凡的使命,即了解世界上的一切,并在不到半秒钟的时间内找到它。因此,杰夫·迪恩介入只是时间问题。
构建谷歌大脑
迪恩是谷歌的传奇。早在1999年,当他加入谷歌的时候,他就已经在计算机科学界很出名了。迪安的任命对谷歌来说是一个里程碑。当时,谷歌是一家只有两位数员工的互联网公司,相对来说并不知名。在接下来的几年里,迪恩成为了构建谷歌软件基础设施的领导者。在这个过程中,迪安的粉丝们组成了一个极客团体,他们用恶搞来表达他们对迪安令人眼花缭乱的才华的崇敬,这就是所谓的“杰夫·迪安的真相”。其中大多数涉及超级极客的编码之谜,但有些相对容易理解,例如:
杰夫·迪恩可以在四子连珠中打败你。只需要三步。
有一天,杰夫·迪恩外出时,他把蚀刻草图(用户通过控制两个旋钮来控制画笔在画板上的移动的画板)误认为是笔记本电脑。在回家拿笔记本电脑的路上,他给画板编程玩俄罗斯方块。
杰夫·迪恩仍在等待数学家们解答他隐藏在数字中的笑话。
迪恩现年46岁,已经知道了神经网络,并将其用于本科论文项目。然而,在接下来的几年里,他和大多数同龄人得出了类似的结论:神经网络的黄金时代还没有到来。神经网络有着光明的未来,但是因为我们没有足够的计算能力让它一鸣惊人,神经网络一度消失了。”院长说道。
但是在2011年,杰夫·迪恩在谷歌的茶室里遇见了安德鲁·吴。斯坦福大学人工智能教授、人工智能领域的巨人吴恩达每周在这家搜索引擎公司呆一天。迪恩问吴恩达他在干什么,吴恩达的回答令他吃惊。我们试图训练神经网络。吴恩达告诉迪恩,风头已经变了。随着深度学习领域的突破,神经网络表现良好。如果谷歌能够掌握培训大型网络的技能,奇迹就会发生。
杰夫·迪恩。照片:talia herman/backchannel
迪恩认为这听起来很有趣。六个月后,他开始相信建立一个巨大的神经网络系统可以很快取得实质性的成果。所以他和吴恩达把它变成了一个独立的项目。(吴恩达已经离开谷歌,最近加入百度,开发百度自己的人工智能项目。(
这个项目,通常被称为谷歌大脑,花了大约一年的时间才在谷歌X的前瞻性研究部门建立起来。这是我们内部的笑话,我们尽量不去宣布。毕竟,这听起来有点奇怪,迪安说。2012年,在研究积累了一些成果后,项目团队从纯实验部门谷歌x转到了搜索部门。项目团队也开始避免使用大脑这个词。在对外宣传中,他们更喜欢谷歌深度学习项目这个名字。虽然这个名字听起来对大脑没有意义,但不太可能有人会在谷歌总部前抗议。
迪恩说,项目团队的最初尝试是无监督学习,因为世界上脱离监控的数据远远多于受监控的数据。这反映在迪恩项目组的第一篇论文中。在这个实验中,谷歌的大脑(覆盖了超过16000个微处理器,创建了一个拥有数十亿个连接的神经网络)观看了数千张youtube图片,试图看看系统是否能学会定义它所看到的。这并不意外,根据youtube上的内容,该系统可以自动识别猫,并且非常擅长搜索猫星的视频,这是许多普通用户通常做的。在训练期间,我们从未告诉它(谷歌大脑)那是一只猫。迪恩告诉纽约时报,它基本上发明了猫的概念。
这只是测试系统能做什么的测试之一。很快,深度学习项目建立了一个更强大的神经网络,并开始承担类似于语音识别的任务。我们的研究项目收藏相当不错。在一些中短期项目中,系统非凡的理解事物的能力可以快速提高产品性能。有一些中期和长期的目标,对此我们没有一个具体的产品,但我们知道这些将是非常有用的。
在我采访迪恩后不久,一个例子出现了。四位谷歌深度学习科学家发表了一篇名为《展示与讲述》的论文。这不仅标志着科学上的突破,也催生了谷歌搜索下的应用。本文介绍了神经图像标题生成器(nic),其目的是在没有人工干预的情况下为图片列出标题。可以说,这个系统充当了报纸的图片编辑器。这是一个涉及视觉和语言的大规模实验。该系统的特点是将视觉图像学习系统建立在能够用自然语言造句的神经网络之上。
没有人会说这个系统比人类有更好的照片分类能力。事实上,如果一个基于这种神经网络的人被雇来为一张照片写标题,这个新手可能不会持续到午餐时间。但是这个系统在机器上运行得出奇的好。一些最准确的例子包括:一群年轻人玩飞盘游戏;一个男人在泥泞的路上骑着摩托车;一群大象正在穿越干旱的草原。该系统可以产生自己的概念飞盘,道路和一群大象,这是足够令人印象深刻的。因此,当这一体系错误地将极限运动自行车骑士视为滑板者时;或者把淡黄色的跑车误认为校车,这是可以理解的。毕竟,这个系统还处于理解复杂世界的萌芽阶段。
这只是谷歌大脑的初级阶段。迪恩并不打算宣称谷歌拥有世界上最大的神经网络系统,但他承认自己是这个领域的领导者。
游戏、神经科学和图灵机
辛顿的聘用和迪恩的智慧是公司推动深度学习的重要举措之一,最重要的是谷歌在2013年斥资4亿美元收购了伦敦人工智能公司deepmind。基于对大脑的深入研究,这家公司对深度学习有自己独特的看法。谷歌击败其主要竞争对手完成了收购。就像谷歌花了17亿美元买youtube,花了5000万美元买安卓(一种新兴的开源移动操作系统)一样,我们完全有理由相信deepmind是谷歌的又一笔大交易。
首席执行官、创始人之一德米斯·哈萨比斯是一位38岁的男子,黑发,身材矮小。快速思考和快速说话就像播客一样以两倍的速度快速向前播放。“我的整个职业生涯都在为人工智能做准备并铺平道路,”他在伦敦市中心高耸的总部大楼里休息时说,该大楼位于圣潘克拉斯火车站旁边。Deepmind刚刚从布鲁姆斯伯里一栋不起眼的办公楼搬进这座新大楼。这座建筑与众不同,因为它建在一所旧医院的附属建筑旁边,给人一种不和谐的感觉。大楼里的会议厅以一些著名的哲学家、作家和画家的名字命名,因为他们代表了人类智慧的一次飞跃,如列奥纳多·达·芬奇、哥德尔和玛丽·雪莱。
最近,这个团队开始接管由deepmind收购的两家公司,以牛津大学为实验基地。一个是深蓝实验室,利用深度学习解决自然语言理解问题;另一个是视觉工厂,开发对象识别技术。
哈萨比斯14岁时是一名狂热的电脑游戏程序员,也是一名象棋天才。他师从彼得·莫利纽克斯,在《黑白》和《主题公园》的里程碑式的作品中扮演了重要角色。然后他在20多岁的时候开始经营自己的游戏公司,大约有60名员工。但是他说,游戏是实现一个目标的一种方式,这个目标就是开发一个具有一般智能的人工智能机器。直到2004年,他觉得自己在游戏智能方面已经尽了最大努力,但他过于仓促地成立了一家人工智能公司,因为他需要的计算能力既不够,也不划算。所以他在伦敦大学学院获得了认知神经科学博士学位。
2007年,一篇关于记忆的神经基础的论文被科学评为年度十大突破之一,他也是作者之一。他成为伦敦大学学院盖茨比计算神经科学组的成员,并与伦敦大学学院、麻省理工学院和哈佛大学合作。但在2010年,他觉得是时候成立一家公司来做高级人工智能了。他与盖茨比的计算神经科学小组的同事谢恩·莱格和穆斯塔法·苏莱曼(mustafa suleyman)一起创业,后者是一位19岁时从剑桥辍学的连续企业家。投资者还包括彼得·泰尔(peter theil)的创始人基金和埃隆·马斯克(elon musk),杰弗里·辛顿(geoffrey hinton)也是顾问之一。
Deepmind一直在秘密运行,在谷歌收购它之前,只发布了一个公开结果。这足以引发一场炒作狂潮,但也伴随着一些无知的嘲笑。本文描述了deepmind通过被动训练神经网络在玩雅达利游戏中的成功。神经网络系统通过自身的深度学习来学习游戏规则。该系统直接尝试乒乓、太空入侵者、游侠等经典游戏数百万次,甚至超过了自学精通游戏的青少年。更有趣的是,它的许多成功策略超出了人类的想象。哈萨比斯说,这是这种技术的特殊潜力。我们灌输给它像人类一样从经验中学习的能力,所以它可以处理我们不知道如何编程的事情。非常令人兴奋的是,该公司在项目之外为雅达利游戏提出了一个新策略。
这是朝着哈萨比斯伟大目标迈出的又一小步。他想象中的模拟大脑不仅知道很多事实,还知道下一步该做什么。
Deepmind并不满足于开发一个只能在有限领域使用的工具,比如雅达利游戏、通勤或处理约会。他们想创造一种流行的人工智能机器,它可以随时随地处理信息,并且做任何事情都很漂亮。他说:我们现在研究的流行人工智能指的是将非结构化信息转化为有用且可操作的知识。我们有一个人脑的模板。我们可以系鞋带,骑自行车,处理建筑的物理问题。因此,我们知道这是可能的,我们研究项目的概念正在慢慢扩展现有的应用领域。
这听起来可怕吗?哈萨比斯期待着一个超级人工大脑,它可以吸收来自世界各地的信息,将其构建成一种可以理解的形式,然后采取行动?至少他承认,由他的团队领导的这项先进技术可能会导致一个问题,即人工智能超出了人类的控制,或者至少它会变得足够强大,以至于它的一些功能会受到限制。这就是为什么在谷歌收购deepmind后,哈萨比斯和其他创始人要求谷歌成立一个外部咨询委员会,以监督该公司在人工智能方面的进展。Deepmind已经决定永远不把它的技术授权给军方和间谍组织,他们已经让谷歌同意了这一点。
不幸的是,哈萨比斯没有透露委员会的组成,只是提到了计算机、神经科学和机器学习领域的顶尖教授。因为deepmind的工作还处于早期阶段,它离所谓的奇点还很远,他告诉我们现在没有必要宣布委员会的成员。他说:目前不存在的问题可能在未来五到十年内出现。所以,事实上,游戏才刚刚开始。
但是游戏进展很快。去年秋天,deepmind发表的另一篇论文描述了一个新项目,它整合了神经科学中的一些记忆理论,建立了一个具有图灵机性能的神经网络,就像一个通用计算设备。这意味着系统可以在足够的时间和内存中计算任何东西。本文着重于实际应用:记录信息然后提取信息的能力就像是对人脑工作记忆的人工模拟。图灵机比以前的神经网络具有更快的学习能力,可以处理更复杂的任务,更重要的是,在训练系统外具有良好的泛化能力。这并不一定让我们觉得我们已经朝着hassabis的通用人工智能工具的梦想又迈出了关键的一步。
事实上,到目前为止,谷歌的深度学习成果还没有在搜索和其他产品上做出很大的努力。但这种情况即将改变。
自从杰夫·迪恩深度学习项目的研究方向从谷歌x转移到知识部门(包括搜索)后,他的团队一直在与一些相关的搜索团队进行密切合作,包括语言和图像识别。谷歌大脑已经成为公司的人工智能工具。迪安说,这就像内部服务。如果小组中的人对某个特定的问题感兴趣,他们会通过它找到正确的解决方案。他接着说,谷歌现在有35到40个团队在使用它。除了搜索和语言,这项技术还可以应用于广告、街景和自动驾驶。
杰夫·迪恩。照片:talia herman/backchannel
至于长期项目,迪恩说,他们正在努力制作一个更好的实时翻译软件,这是最近的一个热点。除了谷歌高度关注的现有系统之外,微软的skype也给观察者留下深刻印象,这个系统通过远程语音完成翻译。但是迪恩对他的团队努力推进这个项目感到兴奋。他说这是一个只能通过神经网络实现端到端语言翻译的模型,你可以训练一对用两种语言表达但意思相同的句子。在英语和法语中,你一个单词一个单词地输入英语句子,然后传递一个以英语结尾的标志,这个模型会立即将它们翻译成法语。
迪恩对神经模型和谷歌现有的系统进行了深入的比较,结果表明他的新的深度学习系统在识别语音细节方面具有优势,而语音细节被认为是语义表达的关键。迪安说:如果这项技术得到推广,将来会有更多令人震惊的事情发生。
Deepmind也为产品化做好了准备。哈萨比斯说,他们的技术需要大约六个月的时间才能找到与谷歌产品连接的方法。他的组织分为几个部门,其中一个部门与谷歌密切合作,致力于人工智能的实际应用。该部门由联合创始人穆斯塔法·苏莱曼领导。
Hassabis希望deepmind的技术能够帮助人们提高生活水平。他认为,一个更活跃的搜索引擎不仅能为人们提供答案,还能帮助人们做出决策。它可能成为一个价值提供者,它将为人们提供最宝贵和稀缺的商品时间。例如,哈萨比斯说,世界上能找到的有趣的书比人们在有限的生命中能读到的书还要多。在这种情况下,为什么你每次在长途飞行或在某个地方的一个难得的假期都要考虑读哪本书呢?这永远不会发生,因为许多类似的事情会更好地自动化。
按照这种思路,hassabis认为deepmind可以以自己的方式参与谷歌更具开创性的项目,比如自动驾驶汽车,甚至是致力于延长人类寿命的calico公司。
最终,deepmind、谷歌大脑和韩丁的深度学习团队将共同组成谷歌搜索,这是最重要的事情。许多年前,拉里·佩奇和谢尔盖·布林半开玩笑地说,语言将被植入我们的大脑,但现在没有人谈论植入。谷歌开发人脑不是为了让搜索变得更好,而是为了建立自己独特的大脑。
标题:它将是你的第二大脑 接入深度学习系统的谷歌 能帮我们做决定吗
地址:http://www.iqulvyou.com/mqhy/5656.html
免责声明:全球名企网是集资讯和商务为一体的食品行业实用型资讯媒体,部分内容来自于网络,不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2031@163.com,全球名企网编辑将予以删除。