人工智能人物访谈(20)
王锦博士为计算机视觉(CV)和视觉人工智能(AI)的技术创新、产品化和大规模应用做出了突出贡献,为行业和全社会创造了巨大价值。在全球智能手机、数码相机、功能手机、相机等所有关键AI、CV技术的研发和产品化方面起到了开拓和指导作用,带领团队成功将相关技术应用于近百亿移动智能终端设备。
获奖者介绍
ArcSoft首席技术官兼首席科学家王锦毕业于CAD & CG国家重点实验室,一直专注于计算机视觉、人工智能、计算机图形学、嵌入式平台优化、终端+云智能平台等领域。王锦博士领导的相关技术已成功应用于近100亿台智能和嵌入式终端设备。他领导研发的手机主要多媒体和AI技术,如单多摄像头技术、智能美容技术、各种摄像头、图像和视频质量增强等,在全球手机(不包括苹果)中占有80%以上的市场份额。20多年来,王锦博士一直对CV&感兴趣:AI为智能和嵌入式终端的研究和产业化做出了重要贡献,为相关行业创造了可观的价值。2017年,王锦博士带领完成首个离线免费开放的可视化人工智能开放平台,打破了AI的技术壁垒,使行业能够使用CV & AI技术也为数据独立性和安全性提供了重要保障,从质量上提高了产品性能和健壮性,为产业升级和创新增添了新的动力。2018年,王锦博士领导的“ArcSoft智能相机图像优化解决方案”荣获人工智能领域最高荣誉——吴文俊人工智能科技奖。
人工智能人:为什么ArcSoft选择视野作为核心业务方向?
王锦:ArcSoft的创始人,包括我们的总裁兼首席执行官邓辉先生,都是计算机视觉专家。ArcSoft的成立致力于将视觉技术深入到人们的生活中。ArcSoft的核心技术主要是计算机视觉和人工智能,两者就像孪生兄弟,不能孤立。因为它们自然包含了相对较难的理论和技术要点,需要逐一打破。几十年来,这个领域吸引了很多研究人员,其中ArcSoft无疑是最好的一个,这让我们可以吸引更多优秀的人才加入我们。20年来,ArcSoft聚集了一大批顶级甚至世界级的视觉AI人才,他们和我一样热爱视觉AI领域。在这样的团队和氛围中工作,充满了享受和成就感。
另一方面,视觉AI研发的特点是难度大、耗时长,这也导致公司的生命力随着时间的推移而持久,依赖于在这个领域建立的高门槛。这些因素使我们能够对数码相机、功能手机、智能手机等嵌入式设备所需的关键视觉AI技术的开发和产品化起到引导和引领作用。
此外,大量积累的经验和技术,以及构建的技术能力,帮助宏软快速将技术切入更多领域,如智能驾驶、智能家居、智能零售、物联网物联网等智能设备,也快速设定了高门槛。
人工智能人:作为视觉人工智能技术应用的龙头企业,你对人工智能技术的应用和产业化有什么看法?
王锦:人工智能不是一个新事物,几十年来它一直是一个老话题。它的发展经历了几个里程碑。目前,它之所以引起人们的关注,是因为当前的深度学习架构已经将它推向了一个更高的层次,它可以在一些领域产生切实有效的应用效果。
然而,人工智能不是一个简单的“窗口”,它无疑将是一个长期的进步过程。目前,研究成果仍存在诸多理论局限,不能盲目“跟风”。作为一个从事AI方向的企业,要尽可能从外行变成内行,千万不要求解决。关键是理论和实践都要成为“专家”,这样才能在分析具体的垂直细分方向后选择正确的力点,开发出实用的AI技术和产品。
人工智能人:能介绍一下ArcSoft现有的产品吗?
王锦:根据CV&的说法:AI的整个系统可以把ArcSoft现有的产品分为以下几个部分:
视频和图像采集产品包。基于公司20多年来在数字图像和视频领域的技术积累,ArcSoft针对单摄像头(单色、彩色、红外)、双摄像头、多摄像头和深度摄像头有不同的Capture解决方案,其主要功能是捕捉质量更好的原始视频和图像;ArcSoft在获得原始数据后,可以提供一套完整的提高视频和图像质量的解决方案包,核心目的是解决噪声、模糊、亮度和视野四个问题。这些解决方案包括许多适合不同设备、平台和环境的方法和模式。凭借之前的基础技术,ArcSoft还可以提供最完整的一套与人相关的云和设备端检测识别包:人脸检测、识别、人脸20多个属性的识别;身体检测与跟踪、骨骼检测与跟踪、动作识别与驾驶、造型、饰品与服装识别;手势检测与识别、动作识别与驱动、骨架识别与驱动;这三个子包都支持2D和3D。对于物体和场景的检测识别,我们总结了日常生活中常见的2000多种物体,可以实现检测识别;基于深度相机和彩色相机的三维物体重建。
ArcSoft是世界上第一家引入面部美化(美容)技术的公司,现在拥有一套完整的2D和3D美容技术包。拥有成熟的产品化SLAM引擎和三维图形绘制引擎。
从逻辑应用的角度来看,ArcSoft已经实现了手机、汽车、无人零售、智能家居、VR & amp;AR,面向机器人、直播、安全、保险、物流、制造、农业和畜牧业的工业视觉AI解决方案。
人工智能人:能介绍一下你的团队吗?
王锦:我非常自豪和幸运拥有一支非常特别的R&D队。我的管理很少,很简单。至于团队成员,其实我很少叫他们员工。他们可以比作一支“特种部队”队伍,这才是本质,人品过硬!大家亲如兄弟姐妹。随着时间的推移,这种内心的情感和友情越来越深。同时团队有很深的积累,有CV &:AI领域各级丰富的经验和代码、库、规范的积累;可以快速开发新方向,快速落地,做产品。
人工智能人:你认为获得“吴文俊人工智能科技奖企业技术创新项目”后,对ArcSoft的强有力支持和影响会是什么?
王锦:获得这个重要奖项无疑是对软银的一种肯定和鼓励。它将鼓励ArcSoft在人工智能和计算机视觉领域再接再厉,坚持创新的心态,努力尽快解决目前仍然存在的各种理论和技术问题。未来,ArcSoft将继续保持其在视觉AI行业的技术优势,为行业提供更多的地基视觉人工智能技术,使行业发展更加健康。
同时,鉴于该奖项的巨大影响力,相信各行业的企业会对ArcSoft有更多的了解,希望与ArcSoft有深入的合作。他们还将与我们在硬件、光学、机械、IC、数据等方面进行相互交流和学习,共同推动CV & AI结出更多果实,推动行业的赋能和升级。
人工智能人:ArcSoft未来的研究方向是什么?最新进展如何?
王锦:在过去的24年里,ArcSoft在多媒体和人工智能领域积累了许多技术和产品,现在其业务正在蓬勃发展。接下来,我们将以开放技术为核心,尝试以平台的形式进一步拓展ArcSoft的使能领域。未来,ArcSoft可视化人工智能开放平台的开发环境将进一步巩固和完善,功能将不断丰富。同时,ArcSoft将努力开放更多免费资源,降低图像处理、摄像技术、计算机视觉技术和人工智能技术的使用门槛,使技术使用逐步达到平民化发展。现在,ArcSoft的人工智能平台向大家开放才一年。我们免费开放了人脸识别、活体检测、人脸角度检测、人脸属性分析、证人验证等各种SDK,取得了不错的效果。
另外,在合适的时候,我们会涉足CV&:更多与AI相关的应用领域。业界会一点点看到。
人工智能人:你的获奖感言是什么?
王锦:我真诚地感谢评委们对ArcSoft技术的认可和肯定,感谢他们给我们这个重要的奖项。它将激励我们为CV再接再厉,更加努力,取得更好的成绩&为AI的研发做出更多的贡献。真心希望吴文俊人工智能奖越来越好,能长久,成为AI行业发展的动力。
获奖项目成果
由于智能手机等移动智能终端物理特性的限制,很难通过单个摄像头上的镜头光圈实现景深效果、前/背景模糊等高要求的成像功能。ArcSoft的获奖解决方案,用原来的AI算法为智能手机解决了这个问题。采用一整套解决方案,可以在现有相机硬件能力的基础上,全面提升相机的成像质量,深化和拓展智能手机相机的成熟应用。
该解决方案由单摄像头图像包软件和多摄像头图像包软件组成。其中单摄像头图像包软件通过高性能算法自动检测不同拍摄场景,然后调整原摄像头参数和公司的多帧拍摄合成技术,达到最佳拍摄效果。多相机包软件利用多相机硬件工作的优势,将相机拍摄的不同照片与ArcSoft先进的图像融合算法相结合,在噪声、亮度、色彩和细节等图像质量以及整体处理性能方面达到最佳平衡,使多相机拍摄能够发挥最大的作用,完美实现前景模糊、背景模糊、自动对焦和增强现实等功能,从而获得类似单反成像效果的照片。
在整个方案中,宏软件开发的图像精度对齐算法和图像合成算法及时填补了空这一领域的空白。该图像对齐算法能够在非视差区域准确对齐具有视差的长焦图像和广角图像,为下一步的图像融合算法保证了融合效果。图像合成算法可以在视差区域和非视差区域自然连接,使整个结果图像完整。
目前,智能相机优化解决方案已被国内外80%以上的手机厂商采用。该方案的成功研发,意味着智能手机无损光学变焦的实现成为可能,同时手机相机的部分拍摄效果也达到了单反的质量,这是智能手机摄影整个领域的一大变革!因为这不仅推动了智能手机摄像头的产业化发展,也推动了智能手机向新时代的发展。
获胜者的留言
王锦:借此机会和同事分享一下我参加一个活动的内心感受:十天前我参加了一个金融领域的交流观察活动;活生生的人和事都是我亲眼听到的,我的眼里有好几次充满了泪水。在边缘省份,一线工人有时为了一场事故要跑几千里,一些微不足道的小因素甚至可能导致生命损失。其实很多损失都是可以避免的,只要用的是真正的技术,不需要虚幻的争论。
目前人工智能是个可爱的宝宝,少炒作,给他一个喘息的空间空,呵护他健康成长。
1.《arcsoft 吴奖人物丨深耕视觉AI领域,赋能产业升级——访ArcSoft虹软CTO兼首席科学家王进》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《arcsoft 吴奖人物丨深耕视觉AI领域,赋能产业升级——访ArcSoft虹软CTO兼首席科学家王进》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/fangchan/1175378.html