全球名企网立足企业资讯传播,解读企业政策,传递企业相关经济资讯,交流最新商业信息!为所有中国企业服务的专业资讯网站!

当前位置:主页 > 行业 > 百度余凯:收集数据需要时间 跑在前面的永远跑在前面

百度余凯:收集数据需要时间 跑在前面的永远跑在前面

来源:全球名企网作者:卢子班更新时间:2020-08-28 06:34:06阅读:

本篇文章4335字,读完约11分钟

老虎嗅注:极客公园创新大会今天在北京开幕。百度深度学习研究院(idl)副院长余凯发表演讲,阐述了大数据时代人工智能和深度学习的发展。老虎嗅探编辑了一些内容:

以下是余凯演讲的记录:

亲爱的朋友们,早上好!在我演讲之前,让我给你看一个有趣的视频。

看,这辆车正驶进我们的会场,从我的左边开到我的右边。上面没有人。它走起路来很平衡,看起来有点奇怪。

为什么我们制造如此有趣的自行车?这是一辆真正的自行车,但是以前的自行车不会自己走路。为什么要做这个事情,这涉及到我今天演讲的主题,也就是百度大脑思考的人机关系。

你可能会想,什么是人工智能?这是一个非常严肃的学术话题。今天,我认为我们对科学技术充满热情,所以我们不需要这么认真。每个人都像我一样是科技迷。看完这样的电影,这个小机器人有很高的智能。首先,这个小机器人有感知能力。他有眼睛,能感知环境:路在哪里,障碍在哪里。

百度余凯:收集数据需要时间 跑在前面的永远跑在前面

在感知的基础上,它会思考和理解。它会理解什么?例如,这个地方是平的,它能走,这个地方是向下的斜坡,它不能走,这是理解。在理解的基础上,它说它将控制并做出决定。所以,你看,从感知、理解到决策,它都生动地反映在一个小机器人身上,这是一种非常直观的感觉,涉及到人工智能的几个方面。

百度余凯:收集数据需要时间 跑在前面的永远跑在前面

智力的本质是学习

今天的市场充满了智能设备,包括智能手机、智能手表和智能水杯。在上一段,谷歌(微博)说是智能勺子,而我们正在制作智能筷子。为什么它们被称为智能产品?他们真的聪明吗?让我们考虑一下。我们把所有的产品放在一边,另一边是60年代和70年代的旧收音机。他们之间的区别是他们都在人的控制下完成一些任务。从这个角度来看,他们似乎没有太大的不同。

百度余凯:收集数据需要时间 跑在前面的永远跑在前面

思考这个问题实际上可以帮助我们区分哪些智能产品不一定是智能的。例如,如果你和我同龄,你在小学学了一篇课文,讲了一个长凳的故事。爱因斯坦做了一个小板凳,做得非常粗糙。根据这种情况,我们能说他不聪明吗?与同龄的孩子和小板凳相比,你可以断定这个人没有那么聪明。在爱因斯坦做这个长凳之前,他每天都做很多长凳,并且每次都在改进。根据他过去的经验和教训,他改进了他的下一个。如果你动态地观察它,你会发现它是一条不断学习和成长的曲线。

百度余凯:收集数据需要时间 跑在前面的永远跑在前面

智力的本质是什么?这取决于你是否在不断进化,并随着经验不断进步。正如我们的主题叫做觉醒和进化一样,进化实际上是智能的本质。这里的经历是什么?经验就是数据。有了过去的经验和数据,你可以不断学习和提高。今天你可能不聪明,但明天你会变得更聪明,这是智慧的本质。所以学习是智力的本质。

百度余凯:收集数据需要时间 跑在前面的永远跑在前面

经验数据和深度学习

这里提到的一个非常重要的方面是经验。在计算机科学和人工智能中,我们称之为经验数据。经验就是数据,数据就是经验。这涉及到我们今天经常提到的所谓大数据,因为我们现在迎来了一个伟大的时代,也就是大数据时代。让我们看看移动互联网给我们带来了什么样的深刻变化。

百度余凯:收集数据需要时间 跑在前面的永远跑在前面

例如,这是2005年圣彼得教堂入口处的广场,许多信徒都在等待教皇的选举结果。八年后,新一代教皇再次当选,他们是同一批信徒。我们看到了移动互联网是如何改变世界的,每个人都连接着自己的设备,这些设备一直在产生数据。今天在座的每个人平均都连接着两三个像我这样的设备,而我的口袋里有两部手机。

百度余凯:收集数据需要时间 跑在前面的永远跑在前面

然而,到2020年,这一数据将呈现爆炸性增长趋势,甚至比这一预测更为夸张。不久前在乌镇大会上,孙正义说,到2020年,每个人都应该连接1000台设备。这并不一定夸张。每个按钮都可以是智能连接设备。在移动互联网时代,一切都是相互联系的,随之而来的是数据的爆炸式增长。大量的数据给我们带来了前所未有的机遇。因此,从物联网到大数据时代,大数据时代之后是无处不在的智能。

百度余凯:收集数据需要时间 跑在前面的永远跑在前面

近年来,我们经常听到人工智能领域最引人注目的领域是深度学习。大数据时代悄然而至,有其深刻的时代背景。让我们看看这条曲线。我们的横轴是数据刻度。在传统的人工智能算法下,数据不会有一定程度的改善。对于深度学习,我们看到它是什么样的曲线。随着数据的不断增长,效果将不断改善。因此,深入学习可以帮助我们吸收数据带来的红利。从技术的角度来看,如果从商业的角度来看,你会发现如果你的商业模型也是一条像陈兴国·伊恩那样的曲线,随着数据的增长,这意味着什么?我想祝贺你,你有一个很好的障碍,一个竞争的障碍。

百度余凯:收集数据需要时间 跑在前面的永远跑在前面

为什么?因为收集数据需要时间,其他人获得同样的能力需要更长的时间,所以你总是跑在前面。搜索引擎就是这样一个模型。基于大数据的商业模式有很好的竞争壁垒。

百度深度学习的着陆点

过去两年,百度在深度学习领域做了大量工作。到目前为止,百度大脑项目已经取得了相当大的进展。它始终是一个学习、进化和进化的系统。两个月前我向你们介绍时,我介绍了世界上最大的深度神经网络的构建,它有数百亿个参数。今天,我把数百亿变成了数千亿,这可以在更大的范围内建立一个更深的神经网络。

百度余凯:收集数据需要时间 跑在前面的永远跑在前面

具体着陆是什么?深度学习始于大脑结构的启发。今天,我们从统计和计算的角度来看这个问题。此外,许多学者从模拟脑生物学的角度对这一领域进行了研究。这两种方式应该齐头并进,互通有无,互相帮助。

至于百度深度学习的内部领域,我们可以在搜索、广告、图像识别和语音识别方面看到相当大的进步。例如,当我们看搜索而不使用深度学习时,绿色是我们在搜索满意度方面领先竞争对手的比率。经过深入学习,我们过去一年的进步比例是这样的。从另一个角度来看,它也是将深度学习技术应用于自然语言的最成功的例子。

百度余凯:收集数据需要时间 跑在前面的永远跑在前面

当然,在广告领域,整个百度封超广告系统已经进入了一个深度学习的时代,广告的点击率也明显提高。具体数字是一个商业秘密,我不能说是两位数的百分比增长,这是对公司收入的巨大贡献。

在语音方面,可以说我们的语音识别率在过去的两年里不断提高,我们是移动搜索中文语音识别的世界领导者。在图像领域,去年,我们的单一模式是世界上最好的,谷歌是第二。

在过去的几年里,你可能会关心图像分类领域的技术发展是如何从定量转变为定性的。让我们举一个图像分类的例子。在这里我向你展示近年来世界上最好的成绩是如何变化的。2010年,世界上最好的成就就在那里,整个深度学习向前发展。我们可以看到它每年都以非常快的速度向前发展。2014年底,结果是5.9%的错误率,这是百度实现的,也是目前世界上图像识别准确率最高的。与人类相比,人们可能非常关心它的能力。人类在这个地方的水平,误差率几乎接近5%。

百度余凯:收集数据需要时间 跑在前面的永远跑在前面

我们刚才谈到的图像和声音反映在我们的产品百度翻译应用中,可以用中文语音说出,并立即自动翻译成英文。它也可以拍照。当外国人来上海看到这样的菜单,拍照后可以认出图片并翻译成英语,他们就能明白这道菜是什么了。

百度余凯:收集数据需要时间 跑在前面的永远跑在前面

使用人工智能技术可以帮助孩子们有一个更快乐的童年,在暑假有更多的时间玩耍。这不是直接帮助你,而是告诉你知识点在哪里。

至于人脸识别技术的发展,我也会向大家汇报最新的成果。在最常见的人脸识别测试中,facebook宣布最佳结果为97.35%,百度同事取得了更令人兴奋的进展,最佳人脸识别准确率为99.62%。斯坦福大学的研究人员最近对人进行了测试,人数达到了99.2%。

百度余凯:收集数据需要时间 跑在前面的永远跑在前面

我必须向大家澄清,机器的算法接近人类水平,事实上,它只意味着数据水平达到人类水平。总的来说,机器智能水平和我们仍在努力工作之间仍有差距。

当你年轻的时候,你可能会用图片说话。当你看到图片时,你应该用自然的语言来描述图片的故事。对于左边的图片,如果用自然语言把它描述成一辆黄色的公共汽车,对于另一幅图片,我们用自然语言的句子来描述这样一个场景,“午后的阳光照进了房间”。这些语言实际上不是由人写的,而是由机器生成的。

百度余凯:收集数据需要时间 跑在前面的永远跑在前面

许多人工智能算法都在不断积累其潜在能量,并改变着人们生活的方方面面。例如,在机器人领域,具体的例子是高度自动化驾驶。这是百度深度学习学院学生团队正在改装的各种汽车。这是我们其中一辆车上的传感器演示,集成了雷达、红外线和摄像头。每个传感器涵盖不同的方面,各有优缺点。如何整合它们以了解路况?

百度余凯:收集数据需要时间 跑在前面的永远跑在前面

基于这些传感器,我们对道路有一个三维的理解,这比人类更精确。例如,今天的导航系统只知道你在哪个道路上,但不知道你在哪个车道上。我们可以使用更先进的传感系统在车道上定位汽车,精确度为10-20厘米。我们可以预见,在未来1-2年,导航系统将经历翻天覆地的变化。当你想去北京街道上的立交桥时,有时会有三五个分支机构在你面前,所以如果你去那里,你会失明,技术会立即帮助你。

百度余凯:收集数据需要时间 跑在前面的永远跑在前面

这是我们的针头系统,它使用深度学习来开发图像识别技术,并使用低成本相机来帮助您完成任务。无人自动驾驶根本不是我们的目标,这很难实现,但也许十年后就能实现,中间是逐步实现的过程。它从辅助驾驶开始,并通过传感器告知驾驶员发生了什么。整个系统是为了让人们享受交通系统带来的便利和安全,但它不能代替人。我们强调的是人和车辆驾驶的结合,这让我回到了我演讲开始时的话题——思考人机关系。

百度余凯:收集数据需要时间 跑在前面的永远跑在前面

伟大的技术之所以伟大,是为了让每个普通人变得更伟大

让我们回顾一下人工智能发展的起源。这个起源在很大程度上是由于图灵测试。人工智能是开发能够代替人的机器。不管这是好是坏,我们都应该有自己的一些想法。我们可以反思一下百度过去的产品。有两种产品。第一个是大杯咖啡。一个普通人给自己拍了一张照片,发现了一颗非常相似的星星。非常欢迎用户。每个普通人都有成为明星的梦想。另一个产品是拍照和写诗。经过图像识别后,不仅是识别,而且生成一首诗,这是更复杂和先进的。但是从用户的反映来看,用户对拍照和写诗不太感兴趣。为什么?因为这款产品只显示了机器有多棒,以及与每个普通用户的关系。

百度余凯:收集数据需要时间 跑在前面的永远跑在前面

让我们看另一个例子。左边是人工智能历史上的一个里程碑--IBM的深蓝。它下棋的能力可以达到人类冠军的水平,而在IBM什么也没发生。另一面是人工智能技术,即搜索引擎。只要有互联网,搜索引擎就能让北京的孩子和偏远山村的孩子拥有同样的获取知识的能力。山村里的孩子也可以获得知识和梦想。这项技术实际上对社会有很大的影响。

百度余凯:收集数据需要时间 跑在前面的永远跑在前面

让我们回到开场视频。这辆自行车能跟着你。当你跑步的时候,你可以穿上衣服,在上面浇水,这样你就可以轻松地跑了。或者当你吹口哨时,它会跟着你进房间。你怎么想呢?这是一辆汽车吗?我想你的答案和我的一样。它就像一匹黑色的小马。因此,这就是我们对人机关系的思考。

百度余凯:收集数据需要时间 跑在前面的永远跑在前面

我们认为伟大的技术是伟大的,不是让机器变大,而是它最重要的意义是让每个普通人变大,变得更有创造力,过上更好的生活。

最后,我修改并引用了毛泽东同志的一句话:世界是我们的,它也是一个机器人。但归根结底,它属于那些能够创造机器人、与机器人和谐相处并使用机器人为我服务的人。谢谢你。

向作者提问并加入语料库

标题:百度余凯:收集数据需要时间 跑在前面的永远跑在前面

地址:http://www.iqulvyou.com/mqhy/4680.html

免责声明:全球名企网是集资讯和商务为一体的食品行业实用型资讯媒体,部分内容来自于网络,不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2031@163.com,全球名企网编辑将予以删除。

返回顶部