地址: 深圳湾科技生态园5栋D座1302室
客服电话: 4008400488
邮箱: bd@rainxn.com
墨客星球
友情链接
© 2019 深圳雨本信息技术有限公司 | 粤ICP备17123203号 | 网站建设:中企动力 深圳
联系我们
360颜水成谈AI研究:学术界是谈情说爱,工业界是结婚生子 | 院士论坛
12月17日,在深圳新一代人工智能院士高峰论坛上,360集团的副总裁、360人工智能研究院院长、新加坡国立大学的教授颜水成做了一场专题汇报,为我们分析了人工智能技术发展的新方向,并谈到了学术界与工业界在人工智能研究上的区别。
颜水成认为学术界做研究就像是谈恋爱,并不着急“生孩子”,但却认为自己的“孩子”外来一定会很优秀,自我感觉良好。但在工业界,必须考虑的一点就是如何尽快地“孩子”生下来,然而,你会发现这个“孩子”并没有自己想象中的那么好,你必须花无数精力对其进行“教育改造”。
另外在技术上,颜水成还指出了Global Reasoning(全局推理)可能会是人工智能下一步研究值得关注的方向。
以下为黄晓庆的演讲原文(有在不改变原意的删改):
非常高兴今天有机会在这里做一次很特别的分享,因为我的背景比较特殊,我在学术界待了大概8年的时间,进入工业界已经有3年,今天一方面我想跟大家分享一下360的人工智能的布局是什么,另一方面我想对人工智能的方向谈一点感受,特别是对于端上来说,这是一个非常有价值的方向,之后我会根据我在工业界待的3年,谈谈对人工智能研究,或者说更多是智能视觉的研究的两点感悟。
360的布局
360在初期把安全当做我们的核心,现在我们把安全的概念从网络空间拓展到了物理空间,这样我们既关注在网络空间的问题,也希望通过AI的能力,能把这个安全的能力从网络空间拓展到物理空间,当前我们更多的主要是专注在家庭的安全的部分。
360在今年5月份的时候发布了一个360安全大脑,安全的问题和视觉、语言是不一样的,它要对数据进行标注,对专家的要求是非常高的,所以说在360安全大脑里面,人的作用是一个非常重要的部分,所以我们把它当做一个人机协同的系统。我们有安全的产品带来流量的情况下,我们去支撑公司的互联网业务和新的IoT的业务,这一块是由我在带领建立360的人工智能的平台。
总的来说,我们主要是打造4个引擎,运动引擎,交互引擎。视觉引擎,决策引擎。
人工智能新方向:Global Reasoning
回到今天的重点,今天我主要聚焦在视觉引擎里面,最近在深度学习方面有一个新的工作,或者一个新的方向非常有意思——Global Reasoning(全局推理)。
我们今年有一个工作刚刚出来,我们发现有不少人在思考这个问题,就是当我们用深度学习做Reasoning的时候,无论你用深度学习还是增强网络,或者是其它的方式,都是用卷积神经的网络进行推理。对视觉的理解,比较远的像素或者比较远的语义,在第一层是没有办法相互知道的。
这样带来一个弊病,当我们对于要求效能非常高的场景,比如说我们要在手机上、只能硬件上做的话,一般我们的网络层数都比较少,如果要做比较大的图象的分析,意味着在浅层的网络里面,它们很难让比较远的区域产生一个比较好的效果。
有没有一种方式可以让你更早地在很低的网络层就去做这种很好的识别?
因为我是1×1卷积的推动者,所以我在想尽量用1×1的卷积来干这件事情,我们有一个想法是说有没有可能在任意的网络,插入一个模块可以做学习,我们最近的工作就是基于这种思想,我们提了一个思想叫Global Reasoning Unit,你可以用1×1的卷积来实现跨区域的交换,我们在原来的一层上再建一个Interaction Space,我们的做法就是先用一个1×1卷积把这个层降低,减少它的计算量,这一层可以有,可以没有,接下来的1×1卷积就是产生一个图,在原来的Space上抽象出一个更加高层级的Reasoning,然后可以再上面进行信息的交换,你用一个1×1的卷积就可以轻松实现,在这上面再进行一层抽象,可以再往前走一层,这一层也是一个1X1的卷积,这就有点像Graph Convolution的过程。下一步再用刚才得到的这个图,可以把它传递到原来的Coordingate space,通过这样5个1×1的卷积,可以实现在这个Space里面实现信息的交换。
我们做了很多实验,它的精度更好,同时我们发现做的层级越多,它的效果越好。我们在前面有一个一般性的结论,你用一个50层的ResNet,再加上30层的Global Reasoning,它就能达到200层的网络取得的分类的性能。
我们在今年相关的会议上也发现有其它的团队有这样的思想,希望在网络的更低层,当你的比较远的像素之间还没有发生连接的时候,希望用类似的形式让它能知道对方的信息的存在,可以进一步提升这种网络的性能。所以我觉得这种Global Reasoning,无论是在手机端还是在只能硬件设备上将会有不错的价值,所以今天在这里我特别跟大家做一次分享。
工业界做研究要考虑闭环
接下来我将跟大家分享一个在工业界做研发要注意的事情。我们在工业界做研发一定要回归商业本质,因为我们要做的事情跟在学校做的事情是不一样的,我们必须把我们的研发放在这个价值闭环和数据闭环里面,去不断地思考和不断地推进。
什么叫价值闭环?我估计可能有朋友读过一本书,叫《创新者的窘境》,里面思考的问题是说为什么有一些好的技术在大的公司里面并不能够很好地被利用起来,其中分析一个主要的原因是因为这些技术可能对这个技术创新者来说,他觉得是一件非常嗨的事情,但是这些技术可能对于产品方,对于最终的用户,和对生态里面帮助你销售的公司,它可能并没有给他带来价值的提升。这个大概的意思是说,如果你对你所在的闭环里面的其他人没有正确的价值,技术落地是非常难的。也就是说当我们在工业界里面做研发的时候,我们的核心任务已经不再只是进行炫技,我们必须对我们闭环所有的维度有正向价值,才能保证我们的技术落地和最终的应用。
在《创新者的窘境》里面提了四个维度:技术、产品、客户和企业。但是我觉得做视觉的智能的研究,其实还有一个非常重要的维度,叫社会价值观。当你的技术变成一款产品,它本身的社会价值观是不正的话,不能产生正向的推动作用的话,这款产品迟早会失败,所以我把它的价值闭环列成了5个维度,同时在这里面不同的维度是相互依存的,它们彼此通过驱动的方式提升价值。
另外在工业界里面做视觉智能的研究,特别是跟视觉智能有关的产品的时候,数据闭环也是非常关键的。因为有一点非常明确,就是永远没有完美的算法,这个时候场景下的数据就变得非常的关键。
为什么中国有那么多做人脸识别的公司,而这些公司都生存得还非常不错,核心的原因是什么呢?其实一个核心的原因是每一家公司他们都有特定场景下的数据的优势,有的可能是在银行,有的可能是在交通监控,有的可能是在公共的监控,这些特定场景下的数据让他们可以不断地优化他们的模型,让他们在特定的场景下有可能比对方做得更好。
正因为这个原因,在工业界做视觉智能的研究,数据闭环就变得非常重要,用户的反馈才能让我们发掘真正用户的痛点和需求是什么,如果只是想的话,永远是不可能的。
学术界和工业界做研发的不同
无论在学术界还是在工业界做智能视觉的研究还是挺辛苦的,大家经常加班、经常熬夜,所以今天我想用一个比较轻松的方式来跟大家总结一下在学术界和工业界做视觉智能研发的不同特点:
在学术界做视觉智能研究更像恋爱中的男女,每天一点小小的进步都会让你感觉非常激动无比,而且不停地希望有新的进步,然后达到一个新的高度。看到的全是对方的优点,你们总是不停的憧憬,因为暂时没有人催你“生孩子”。你们憧憬生一个孩子一定是非常美好的,觉得肯定会非常棒,认为这个孩子一定是世界上最聪明、最乖巧的,就好象你们拿一个BP跟VC说的一样,因为反正不用把它真的生出来。
但是在工业界不一样,工业界的研发更像结婚后的男女,你会发现生娃成了你最重要的任务,父母天天催着你生孩子,你们以为孩子生出来很乖巧,但是生出来以后才发现一堆的问题、一堆的毛病,社会也不喜欢他,于是你就不停地根据经验和用户反馈来进行调教,最后孩子变强大了,你的头发也白,脊椎也坏了,但是看着孩子还是一脸的幸福。