南风娱乐网致力于优质软件,活动线报,游戏辅助,绿色工具等资源共享,好货不私藏!
精品资源,免费分享

华为诺亚方舟实验室(华为诺亚方舟实验室待遇)

作者:南风

12月6日至8日,为期三天的“2019世界创新者年会”在北京成功举办。本次大会由中国企业联合会指导,由亿欧EqualOcean和工业和信息化科技成果转化联盟联合主办。大会以“科创4.0:构建全球化新未来”为主题,汇聚了美国、英国、印度、新加坡、印度尼西亚、尼日利亚、巴基斯坦、日本、以色列等10多个国家或地区的6000名创新者,总结2019年世界科技和产业创新成果。

本次论坛邀请了华为诺亚方舟实验室计算视觉首席科学家田琦教授、宇信科技创始人兼CEO朱铭捷博士、文安智能创始人兼CEO陶海教授、幻幻幻科技创始人兼CEO柴金祥教授、MINIEYE创始人兼CEO刘国庆博士、联想创投董事总经理王广西博士、大观数据创始人兼CEO陈云纹博士、塔奇智行创始人兼首席科学家于归真教授。小鹏汽车股份有限公司首席科学家郭延东博士探讨分享了企业家作为科学家在创业道路上的收获和感悟,探索科技与商业化结合的机遇,推动产学研协同发展。

其中,华为诺亚方舟实验室计算视觉首席科学家田琦带来的主题是“科学创业者,双重身份下我眼中的创新者是什么?”演讲,演讲的核心要点是:

学术界和工业界是相辅相成的,学术界对工业界的价值将不断供给人才,为工业界提供主导方向。同时,学术界对性能的终极追求将为工业应用奠定坚实的基础。对产业的价值在于回馈学术界人才的回归。 与行业关注的焦点不同,学术界更注重方法的理论化、普适性、探索未来性和启发式识别水平。然而,业界更关注方法的商业价值和可用性。 创新要以人才为核心,人才的培养是最大的中心。 以下是这次演讲的记录:

华为诺亚方舟实验室田奇:学术界和工业界具有互补性,人才培养是核心

女士们先生们,早上好。非常感谢组委会的邀请。我今天报告的题目是“双重身份下我眼中的创新是什么?”我来自华为诺亚方舟计算视觉实验室。这是我的报告目录。第一部分是我的学术和产业背景以及诺亚周放实验室的介绍。第二部分为“前沿创新研究与业务落地的AI赋能差距”,通过三个实例进行说明。最后,从学术和产业的角度思考什么是创新。

就在刚才,我2002年从伊利诺伊州厄巴纳-香槟毕业,获得博士学位,2012年加入德克萨斯大学。我从计算机系的助理教授到副教授再到教授,做了17年的老师。

2008年至2009年,我利用学术假期,担任微软亚洲研究院院长一年多。2010年至2015年,应清华大学张华老师邀请,回到清华大学神经病学与认知中心担任客座教授。2011年至2014年在NECChina担任顾问;2016年授予IEEE2017年教育部江学者。这些是我在学术界的一些经历。

2018年夏天,我利用学术假期加入了华为诺亚方舟计算视觉实验室。今年9月,我辞掉了在美国的终身教职,现在全职加入华为,所以现在在工业界。当然,大家也看到了,我大部分时间都是在学术领域,但是在工业领域的时间不算,所以在这里只能说一些个人浅薄,可以算是抛砖引玉。

我在诺亚方舟计算机视觉实验室工作。诺亚方舟目前有几个小组:计算视觉、自然语言处理、搜索、推荐、决策推理、机器学习和人机交互模拟。支持产品部门、企业智能、网络智能、终端功能、终端智能手机在大屏幕上拍照,以及一些信息服务,比如无人驾驶,这也是微传感传感器对我们的集成。

华为的AI赋能差距。通过与世界各地25所大学的**,许多研究人员加入了这一**。诺亚方舟的愿景是打造具有AI赋能差距、世界一流产出的顶级AI大学,帮助公司实现AI战略转型。

我们在欧洲、伦敦、巴黎、莫斯科、多伦多、加拿大和蒙特雷都有布局。我在中国的深圳、上海、北京、安徽、香港都有相关的研究同事。

先介绍一下我们前沿创新研究和业务落地的差距,找到所谓的AI赋能差距。我举几个例子:

首先,学术界和工业界的侧重点不同。众所周知,学术界更注重方法的理论性、普适性、未来探索性和启发式认知水平。而行业更注重商业价值,所以更注重方法的可用性,针对特定问题,提升用户体验,带来实用价值。因此,学术界和工业界的优化目标是不同的。事实上,华为可以利用华为的大计算能力和大数据平台,通过使用华为AI芯片来支持我们的前沿视觉研究。

我们的视觉研究分为六个方向:底层视觉、语义、理解三维视觉、数据生成、视觉计算和视觉多模态融合,这是我们重点关注的基础研究方向。应用场景包括自动驾驶、安全城市、终端视觉等。因为前沿研究和应用场景的优化目标不同,所以存在AI赋能的差距。

我来说说AI赋能的差距,以及业界如何在安全城市中,通过自动驾驶目标检测、行人站识别、终端识别等方面的轻量级网络设计来应对。

首先以自动驾驶检测为例。左边是学术界研究的目标检测。它的数据标注相对干净、准确,但工业部门的场景比较复杂,标签比较嘈杂。例如,右边的汽车被标记为公共汽车,左边的公共汽车被错误地标记为汽车。

有两种方法可以处理有噪声的数据。一种是直接处理有噪声的数据,设计一种惯性算法对响应上升的标签进行自动分类,从而进行修正或丢弃。二是设计半监督和无监督的方法,使我们的模型可以更好地推广到这个弱标记或无标记的样本上。

从目前应用最广泛的角度来看,品类之间分类清晰,图像清晰,一般有相对较好的光照条件,精度可能是独一无二的。但在工业自动驾驶中,我们采集到的数据类别可能分布不均匀,即打标成本相对较高,想象层较多,因此灯光、交通锥等目标打标样本较少。

同时,不同应用场景的语义有时很难确定,因此需要组合标签。比如载人三轮,先标记人,再标记三轮,最后形成组合标签。

采集数据时,要采集一些图像数据模糊、光照条件差的图像。比如暗光和误报,以便更好地训练我们的算法,提高系统的性能。

在评价标准方面,我们主要看一些具体的应用,比如检测一些关键的障碍来制定我们的产出、存量和评价标准。

在学术目标检测中,最常用的目标检测模型没有考虑数据分布的不平衡和任务之间的依赖关系。我们的解决方案是设计一些计算量较小的网络模块,采用多目标多分支设计来解决目标检测。

在第二个例子中,我以平安市启用站的识别为例。左图为学术界对人行站的识别,其场景较为简单,即城市或上空。行人站识别的两个最大的图像数据集是两个多场景、多时间段的数据集,这是我们近年来做的工作。

然而,工业赋能站的识别是针对城市群的大规模复杂场景,其条件很难约束成为理想条件。然后以这个多场景、多时间跨度的数据集为例,包含4101个行人,用15个摄像头标记约12万平方米的行人,采集室内外场景,行人的假设可以很好的解析,准确性是唯一的评价指标。

在实际的工业场景中,针对校园、社区、街道等各种场景,我们要面对数十万个这样的行人id,数千甚至上万个这样的摄像头,数十亿甚至更多的行人智能图像。我们园区也有**,经常会出现检测不准确或者非常严重的错误,所以不仅要考虑精度,还要考虑模型的大小和速度。

这是行人识别中非常常见的一种识别模型,它基于人体、部位等。这是我们2018年的工作,主要是将一张图片整体划分为多个模块,这样可以区分不同的id,从而提高系统的区分能力。

在工业场景中使用这种方法是很危险的,因为工业数据量极大,不同的id之间有非常相似甚至相同的模块。如果相似模块完全分离,特征提取会受到破坏,导致系统性能急剧下降。

此外,如果我们将预训练系统部署到新场景,该系统的性能将会迅速下降。一个解决方案是场景迁移,所以在2018年,我们华为同学提出了一个缩短数据差距的方法。这个算法提出后,当然会提高系统性能,但如果应用到实际工业场景中,生成的图像质量还是比较差的。同时引入了大量噪声,在一定程度上提升了系统性能,但其天花板效应仍然比较低,无法满足工业部门的要求。

我们的解决方案是如何在新的场景中探索和部署新的系统。以前侧重于跨摄像头标注,因为人被不同的摄像头捕捉,做了更多的标注。但是我们的解决方案将跨摄像头的标注改为单摄像头单摄像头的训练模式,我们只标注另一个摄像头下行人的数据。因为在一个摄像头下,行人检测会变得高速自动化,从而大大降低数据标注的成本和时间。

最后,以华为面向终端视觉的轻量级神经网络为例,学术界的轻量级网络关注如何在保持精度的同时减少计算量或模型的参数和大小。但是在行业中,需要考虑真实硬件的一些指标,比如能耗、速度、内存等,很难用理论指标。

然后是学习计算机网络的方法,比如计算量和模型参数,虽然计算量和模型参数减少了,但实际速度相当悲观。现在,业内一些轻量级计算专注于谷歌和V2等引入深度划分的模型。这就提出了消费和混合的操作,并利用NASS技术搜索A3中的网络结构。但是也存在一些问题,要充分利用特征之间的融合,适应具体的硬件。

2018年年轻剂量水平模型的共同思路是跨通道。可以更好地应用交叉通道之间的信息,但是交叉操作对硬件实现不友好。这种操作对内存和存量有不连续性,会导致硬件运行效率下降。

今年我们提出用廉价的线性变换换取更多的特征,这样对计算资源的需求以及因为廉价的线性变换对硬件友好,这个目标可以更好的实现。

最后,我主要从学术界和工业界的角度来看什么是创新。学术界和工业界明显是互补的,学术界对工业界的价值将为工业界提供源源不断的人才,为工业界提供引领方向。同时,对性能的学术追求将为工业应用奠定坚实的基础。

对行业的一个价值就是回馈学术人才的回归。我认为人才的相互流动是正常现象,在实践中给学术界带来了新的方向。最后,学术界的系统整合提供了全球布局。因此,学术界和工业界应该形成互补互利的状态。

领域内也有很多双重身份。我想分享一下学术界和工业界人士的想法。颜水成是新加坡国立大学的终身教授,也是前360AI分校。现在他是易图科技的首席技术官。他认为学术研究的成功取决于技术。此外,我们需要细化问题的解决方案。学术圈可以慢一点。一个产出需要几个月甚至半年,但只要行业能解决问题,就是好的人工智能。

香港中文大学的唐晓鸥也是上唐科技的创始人,他说中国的人工智能要做好三件事:第一,一定要坚持,打好基础;二要创新,打造新东方;第三,要把东方的浮在上面,搞工业化。香港中文大学的贾加是亚腾优图的杰出科学家。他的观点是“技术要上天,工业要落地”。

大家更熟悉的李是斯坦福大学教授,前谷歌云人工智能首席科学家。她认为科技和产品就像一场4×100的接力赛,每一项都有其特殊的功能。4×100里学术第一,工业实验室第二,工业和**第三第四。

最后,他是纽约大学图灵奖的获得者,现在他也是脸书大学的科学家。他认为,学术界和工业界的双重联盟可以为学术界和工业界都做出贡献,不仅推动了云识别、图像识别、文本理解和语言翻译技术的进步,也带来了理解智能的基础科学进步。

这是业内其他具有双重身份的人的洞察。在我看来,创新的核心要素是什么?我认为创新要以人才为中心,人才的培养其实是最大的中心。从三大要素中的计算视觉算法、计算能力和数据来看,学术界在算法设计上更有技巧,但工业界在计算能力和数据方面更有优势。大计算能力和大数据为行业带来更多创新可能。

人工智能行业对人才的需求非常旺盛,产业技术对学术界人才的吸引力主要体现在计算能力、平台、数据、机会、**、介入、成功和落地等方面。行业人才竞争变得激烈,中美两国都能看到人才的竞争。

行业需要哪些人才?主要有几点,第一是专注自己的领域,有创作天赋;第二类是在很多领域都有了解,有**能力的人才;第三是真正能把技术落地,了解人工智能产品的人才。比如从客户的角度,人和社会需要什么?从应用场景来看,人工智能能做什么?技术和产品双重驱动,要了解产品需求,了解用户体验,要充分发挥算法、数据、计算能力。

行业也要能发现新的商业方向,一些舵手要结合商业场景、商业模式和具体应用(如自动驾驶、智能家居、安全城市等产品)带来商业价值的成功。

最后,AI的应用要以人为本,要寻找理想的、经济的人才。在功能完善的基础上,要考虑人的精神文化需求,比如陪伴机器人陪伴老人和孩子。

学术界需要什么样的人才?先做基础研究。从源头做起,着眼长远,注重技术创新。问题应该来自工业,结果应该在工业中付诸实践。

比如在学术领域,我提供一个新的算法,交给别人去提炼新的方法。对于行业来说,主要集中在寻找最适合的方法来解决问题。但共同点是需要理论基础扎实、工程能力强、**创新性好的AI人才。因此,有必要利用这种双重身份,将学术界和工业界紧密联系起来,提供培养AI人才的最佳途径。

对于华为来说,我们的工作就是利用其跨界的地位,将学术界的高水平研究与工业界的高质量产品实践相结合,找到一种创新的人才培养模式,帮助我们实现上至天空、下至根的全站研发。

我们的人才培养策略是探索与大学联合培养学生的科学方法,与大学学者进行学术交流和内部交流。在工程能力培训方面,定期邀请专家对员工进行培训,AI课程以***的形式分享,让我们的员工在温暖的房间之外接受培训。最后,在公司强大的数据资源和计算平台的支持下,我们经常传播企业文化,就像今天这个活动一样。

最后,对高校人工智能人才的培养提出了一些建议。既要培养高专业素质,又要有较强的工程能力;课程AI变化快,要注意课程内容的及时更新。开设跨学科专业,鼓励本科生乃至高中生尽早接触前沿;在人工智能方面,应鼓励学生参加编程课程,与行业**,鼓励学生参加工程实践。最后,鼓励学生创新、产品孵化和AI创业。

我已经谈了一些关于创新的看法,谢谢。

免责声明

本站提供的一切软件、教程和内容信息仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络收集整理,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑或手机中彻底删除上述内容。如果您喜欢该程序和内容,请支持正版,购买注册,得到更好的正版服务。我们非常重视版权问题,如有侵权请邮件与我们联系处理。敬请谅解!

最新评论