地址: 深圳湾科技生态园5栋D座1302室
客服电话: 4008400488
邮箱: bd@rainxn.com
墨客星球
友情链接
© 2019 深圳雨本信息技术有限公司 | 粤ICP备17123203号 | 网站建设:中企动力 深圳
联系我们
腾讯机器人实验室张正友:机器人要想普及,仍需6大技术突破 | 院士论坛
12月17日,在深圳新一代人工智能院士高峰论坛上,机器人和多媒体领域的技术专家、腾讯机器人实验室主任张正友为大家做了一场主题为机器人产业发展的演讲。
张正友以自身30多年的机器人研究经验为依托,表示我们不用担心人工智能会消灭人类。
进一步地,他表示目前机器人与人工智能技术虽然取得了可喜的进展,但距离真正能够大规模使用其实还有很长的路要走:人脸识别目前还不容易识别出真人还是照片、语意识别依然很难区分中文里的多义词。
而在机器人方面,张正友虽然认为人类即将进入人与机器人共生的时代,但机器人要想普及,至少还要攻克AI、本体、控制、情商、灵活操控等7大难题。
以下为张正友的演讲原文(有在不改变原意基础上的删改)
张正友:各位领导、各位院士、各位同学,大家好!在这里,我会跟大家分享一下我对人工智能和智能机器人的一些想法。
在此之前我想介绍一下我自己,因为我是最近才回到国内的,我从1986年就离开了祖国。我是1985年从浙大毕业的,当时第一次接触计算机,用的是大型计算机,当时用的是打孔的卡片与电脑交互。毕业以后就去了法国,在法国之后用的电脑就越来越小,刚开始我学的是语音识别,但觉得语音识别太简单,只有一维性,于是后面转学了计算机视觉。
我参与开发了世界上第一个三维视觉机器人导航技术。然后我还参与了欧洲Mars Rover,也就是航天机器人,还有海底机器人。在法国十几年之后,我去了日本,在日本待了一年,开发了世界上第一个用人工神经网络做人脸表情识别的设备。1998年加入了微软研究院,在微软工作了20年,开发“张氏标定法”,就是摄像机标定的方法,现在全世界都在用这个方法,我也开发了Kinect深度传感器。
我介绍这些,主要是讲我为什么有现在的这些想法,这是和我的经历有关系的:
我加入腾讯其实是想创建机器人实验室,为什么我要参与这项工作?因为我觉得在不久的将来我们将进入人与机器人共生的时代。
为什么人机共生时代即将到来?
为什么我这样讲?一是从计算演变来看,计算从最初的大型计算机到PC的普及,到互联网的兴起,到智能手机的普及,到现在可穿戴式或者陪伴设备的兴起,这些都说明了计算能力从最初的固定的时间、固定的程序、固定的地方慢慢变得移动化、无处不在、连续化。
另外,从感知技术上看,我们的智能手机上除了摄像头以外,还有很多其它的传感器,现在设备变得越来越主动、个人化和多模态。但我们现在还没有充分地把这些感知技术用起来,充分发挥这些传感器的作用,这是我们以后需要追求的机器人的方向。
所以我觉得随着技术发展和感知技术发展,机器人必然会出现。但是目前还不够,所以我们还要继续研发。
机器人的发展趋势判断
接下来讲一下机器人的现在与未来。我们可以把机器人分成6个部分:
第一部分是机器人本体,可能很多人都忘记了。说到人工智能,很多人以为就是一个算法就够了,但它还要一个本体,这样才能实现真正的智能,本体包括它的手臂、腿等等。
第二是感知,因为机器人需要了解周围的环境,才能做决策。
第三是执行器,如果没有执行器的话,机器人本体动不起来。
第四是动力系统。
第五是交互系统,机器人需要跟机器人交互,还需要和人交互,所以交互系统也是非常重要的。
第六是决策,机器人要识别、规划,还要学习。
讲到机器人,大家都会想机器人很早就存在了,以前我们讲的是工业机器人,它更多的是有关自动化的,预先设计好了之后做重复的运动,现在我们开始慢慢往自主方向发展。
我们把自主分成两部分,一部分是反应式自主,它不需要很多深度思考,比方说我们走路的时候可能绊了一跤,我们很快获得平衡,或者是机器你踹它一脚,它马上获得平衡,这是反应式自主。第二个是有意识的自主,需要你决策路径。
机器人本体目前有6个趋势,第一个是仿生的机器人,比如说蛇形机器人;第二是灵巧的操控;第三个是触觉技术;第四个是多机器人协同;第五个是人机交互,包括安全交互和物理交互;第六是医疗辅助。
刚才讲到,我认为我们在不久的将来能够进入到人和机器人共生的时代,但是目前的技术还没到那个地步,所以无论是在工业界还是学术界,都需要努力地做更多的研发。我认为机器人领域有一些技术需要突破,才能使得机器人真正能够为人服务。
关于这些技术突破点我总结成了A2G理论。
A2G是什么理论呢?就是ABCDEFG刚好对应了英文的几个字母,A代表的是AI,B是body,C是Control,D是Developmental,发育学习,E是EQ,F是Flexibe Manipulator,G是Guardian Angel。A、B、C是代表了人工智能的集合能力,D、E、F、G是相当于它们需要更高的智能或者是系统。
A就是AI(智能),因为机器人必须要能看、能说、能听,能够理解,这样才能跟外界交互,实现它要做的事情。B是Body(本体),这是非常重要的,不同的本体决定了机器人的能力,比方说蛇形机器人,它能够穿过很狭窄的通道,到一个很复杂的环境,所以本体也是需要研究的,C是Control(控制),这是比较清楚的需要继续努力的方向。
这里还想讲一下本体,因为机器人领域里面很多人都强调是人形机器人,对这个问题我有一点思考,人形机器人是不是我们需要追求的机器人的目标?人之所以有直立双足,是经过几百万年演化出来的,是要在荒野里面、大草原里面生存下来,所以我们有了直立双足,但是目前机器人的生存环境,大部分情况下都是一个平的地方,再加上几个台阶,所以我们现在去研究机器人,不一定是一个人形机器人,而是应该思考不同环境下什么样的机器人本体才是最佳的。
下面就讲一下D—G。D是进化学习,目前尽管人家说我这个机器人是通过深度学习出来的,但是学习出来的能力还是固定的,放到一个机器人身上,它永远是这样的,但是我们人从出生开始就跟父母、跟周围人交互,能力越来越强大,所以我们怎么让机器人也具备进化的能力,这是我们需要研究的。
E是EQ,因为人和机器人是要共存的,它必须对人有一个深刻的理解,包括感情的理解,同时要用适当的方式把这个感情表达出来,让人理解,所以情感交互是非常重要的。
F是灵活操控,我们看到电视、电影里面都是高科技的钢盔铁甲的机器人,但是在人和机器人共存的时代,这些机器人往往对人造成伤害,所以我们要研发不会对人造成伤害的机器人,所以这里面有人造皮肤,或者是高精度触感的传感器,这样能够灵活操控。
G是Guardian Angel(守护天使),机器人最终的目的是要服务人、保护人,不能把它当做一个独立的个体,它应该跟周围的环境和周围的传感器结合,同时还要和云结合,这样即使你的家庭成员或者朋友不在边上,你也能够很快地跟他们取得感情的交流。
前途光明但路长且艰
前面讲了很多机器人,现在我要给大家泼点冷水,人工智能和机器人还有很长的路要走,现在仅仅是人工智能和机器人的初春,我不想讲寒冬,否则有人肯定不高兴了,初春这个描述还是比较符合实际的。
举个例子,几周前在宁波街头的一个街头的系统识别到“董明珠过马路闯红灯了”。但事实上董明珠并不在那边,而是卡车的车身广告上有董明珠的头像,公交车从旁边经过,识别系统误认为是董明珠闯红灯了。这说明它的识别率是很高的,认出了这个图片是董明珠,但是也说明它是很傻的,它不知道这个不是真人。现在很多东西都非常单一,不接地气,这里面还有很大的工作要做,这是从计算机视觉方面举的一个例子。
第二个例子是自然语言的,“前门到了,请从后门下车”,我们都明白,但我用谷歌翻译,它将“前门”翻译的是“Frond Door”,它的翻译是错的,我觉得可能谷歌不懂中国的国情,所以我用了百度的翻译,它还是翻译“Frond Door”,所以百度对中国也是不了解。即使我改成了“前门车站到了,请从后门下车”,百度的翻译仍然不对。
还有机器人方面的例子,大家知道有一个叫索菲亚的机器人,被阿联酋封为他们的荣誉公民,他们说可以和人交互,但是它还远远达不到这样的水平,它的对话都是通过预先设计好的场景来对话的。
人家说人工智能会消灭人类,我已经从事了30多年的人工智能研究,我觉得是不用担心的。