谁将从在中国的美国科技巨头实验室AI研究中受益?_ResNet
作者:admin浏览数:2020-05-14 19:53:47
谁能从美国人工智能(AI)公司在中国的研究实验室取得的研究突破中获益?
就在五年前,这个问题几乎没有出现过,如果有人问起这个问题,答案往往围绕着全球研究的共享利益。今天,很多事情已经发生了变化。机器学习领域取得了重大进展,中国的技术市场及其监控设备蓬勃发展,技术竞争已经移到了中美关系的中心。
所有这些变化对于美国领先科技公司的海外研究实验室意味着什么?为了回答这个问题,我们可以把目光放大到某项具体的研究突破上,研究其中的理念、机构和人物。通过追踪这些因素,可以更好地评估这些研究的利益流向何处,以及政府政策和企业实践如何才能更好地塑造这些利益流向。
我在这里研究的案例是过去五年来人工智能研究中被引用最多的一篇论文。Deep Residual Learning for Image Recognition。这篇论文通常被缩写为 "ResNet",2015年的论文不仅是基于Google Scholar指标的被引用次数最多的AI论文。在2014年至2019年7月期间,这篇论文的被引用次数达到25,256次,是这段时间内所有学术领域中被引用次数最多的论文。
ResNet有什么重要的意义?
ResNet的核心贡献是在神经网络上堆叠更多层的技术--当今许多机器学习的引擎。通过堆叠更多的层(使其 "更深"),神经网络的性能可以在不同的任务中显著提高:面部识别、自然语言处理、语音识别以及许多其他领域。
该技术被证明是如此成功,以至于在2015年,该论文背后的研究团队在两项全球最重要的图像识别竞赛中获得了第一名。到了2017年,该技术成为阿尔法狗AlphaGo Zero背后的核心进展之一,这套具有里程碑意义的DeepMind系统通过与自己对弈,将自己变成了世界围棋冠军。
阿尔法围棋(AlphaGo)是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能机器人,由谷歌(Google)旗下DeepMind公司戴密斯·哈萨比斯领衔的团队开发。百度百科
是哪个实验室制造出了ResNet?
ResNet是美国科技巨头微软亚洲研究院(MSRA)的一个小型研究团队的产物。
该实验室成立于1998年,位于清华大学旁边,很快就成为了一个研究强队,为学术研究和微软的全球产品做出了重大贡献。2004年,《麻省理工学院技术评论》(MIT Technology Review)将其誉为 "世界上最热门的计算机实验室",以表彰其在机器学习领域的研究进展,特别是在自然语言处理、语音合成和图像识别领域的研究进展。
MSRA实验室的研究直接为Windows的软件创新和微软Xbox的图形学进步提供了支持,同时也为中文等基于字符的语言的输入法带来了重大改进。
然而,与此同时,MSRA也许是过去二十年来中国人工智能生态系统诞生和发展过程中最重要的一个机构。该实验室曾是中国当时还处于萌芽阶段的人工智能生态系统的许多未来领导者的训练场,其校友包括阿里巴巴的CTO、百度的总裁、Bytedance的技术战略负责人以及多家独角兽人工智能创业公司的创始人。中国媒体甚至将MSRA比作 "中国互联网的黄埔军校"。
谁在突破的背后?
ResNet论文由四位2015年在MSRA工作或实习的研究人员撰写。何开明、张向宇、任少卿和孙健。(注:作者的名字在姓氏之前,以符合他们在国际刊物上的介绍方式。)
这四位作者都是在中国大学获得本科和博士学位。他们似乎都没有在ResNet出版之前在中国以外的地方生活或工作过(何凯明在香港中文大学读博士)。在发表ResNet之前和之后,作者们都获得过顶级会议的最佳论文奖,并在全球计算机视觉竞赛中获得了第一名。
而在发表论文后,他们四人都已经离开了MSRA。
何凯明是该组的主要作者,也是最著名的作者,2016年加入了加州的Facebook AI Research。张翔宇和孙健加入了Megvii,这家中国计算机视觉初创公司最近因参与大疆监控被列入美国实体名单。孙健现在担任该公司的首席科学家。而任少卿则与另外两位MSRA校友一起,共同创办了Momenta,这是一家位于北京的自主驾驶汽车初创公司,已经取得了独角兽地位。
要明确的是,ResNet是被引用次数最多的论文,并不意味着这四位是过去五年来最杰出或最重要的AI研究者。这篇论文之所以被广泛引用,部分原因在于它对已经流行的方法做了一个关键性的补充,这意味着它在后来的工作中相对容易复制。但其背后的研究人员对人工智能领域做出了重大贡献,他们正在美国和中国的新公司中运用这些技能。
谁受益,谁损失了?
回到我们的核心问题--谁从MSRA这样的研究突破中获益最大?
MSRA团队的论文标志着整个人工智能领域的一个重大进步。即使该领域的其他研究人员最终也会偶然发现类似的发现,但目前还不清楚什么时候会出现这种情况。自2015年以来,全球各地的研究人员已经将ResNet技术应用到AI系统中,这些技术既有害又有益。
微软本身也从这篇论文中受益,尽管方式略微没有想象中那么戏剧性。就商业上的实际好处而言,微软从内部开发该技术中享受到了一些先发优势,但这种优势很可能是短暂的。研究团队在2015年的ImageNet竞赛中获胜后,研究团队立即在网上发表了ResNet论文,并迅速被包括微软的竞争对手在内的大部分领域所采用。
公司最实质性的收获可能来自于支持微软建立研究人员人才管道的能力。ResNet背后的研究人员都已经离职,但他们在那里所做的工作提高了MSRA在下一代计算机科学毕业生中的可信度。
除了微软之外,Facebook在挖走ResNet的主要作者时获得了最大的奖励,但Megvii和购买其产品的中国监控机构也从两位作者的加入中获得了巨大的收益。而中国的自主汽车生态系统也从任少卿共同创办的Momenta中得到了推动。
另类的历史和可能的未来
但任何对净影响的正确评估,也必须考察一些反事实。追溯到1998年,很显然,如果微软从未创立过MSRA,那么中国的AI生态系统的崛起将被大大推迟。鉴于二十年前的技术是多么的原始,而且当时中国作为技术落后国家的名声,美国政策制定者对中国未来在AI领域的能力并不担心。
但是,如果这些担忧同样导致美国政策制定者在2012年迫使微软关闭实验室呢?
那时候,论文的四位作者中的两位(何凯明和孙健)已经合作研究了三年。他们很可能会调到西雅图以外的微软总部,并在那里发表ResNet。在这种情况下,孙坚有可能会继续为美国公司工作,而不是加入Megvii。
但也有可能他们会在中国的机构继续进行这种研究。2013年,百度成立了其深度学习研究院----这在中国尚属首家----它将成为这些研究人员的潜在目的地。如果ResNet是在那里(或在中国大学实验室开发的),它很可能仍然会被公开发表。但是,如果它是在政府或军方实验室开发的,而不是在一个政府或军方实验室开发的,一个没有开放源码合作的实验室呢?
这些问题没有一个能给出明确的答案。但是,它们可以指向一个更有成效的方向。在机器学习的人才流动方向和驱动力方面,需要收集更多的细化数据。因此,对中国不同机构的研究文化也应该有更好的了解。希望这些数据和分析的结合能够帮助制定出更好的政策,使其更多地依靠手术刀而不是锤子。
写作者站在美国立场,分析美国该怎么看待这事。该文部分内容通过机器辅助翻译,阅读请谨慎。 Matt Sheehan
热门评论