视觉计算已经渗透到日常生活的方方面面:机场刷脸通关、手机人脸识别开启金融账户、停车场车牌自动识别和收费……清华大学《人工智能发展报告2018》显示,中国人工智能市场中,以生物识别、图像识别、视频识别等技术为核心的计算机视觉市场规模最大,占比达到34.9%。同时,视觉计算也受到资本市场的青睐,高额估值体现出投资机构对该领域未来发展的信心。
视觉计算的火爆,很大程度上是因为其易于落地应用,并能迅速提升效率,推动生产力的发展。尽管AI视觉计算发展还处于起步期,但已展现出巨大的应用价值和广阔的发展前景。
当下人工智能行业正处于从感知智能向认知智能进阶阶段,前者已部分领域趋于成熟,后者尚待突破。尤其是计算机感知领域的计算机视觉和语音识别技术,不仅在技术层面取得了突破性成就,更是在产业层面有着广泛的应用。而深耕计算机视觉领域的旷视、商汤、WiMi微美全息等企业,纷纷获得市场上、资本上众多的关注度。
计算机视觉,听起来似乎很遥远的一个名词。但它的应用,你一定不会陌生。比如,今天在某些城市,如果乱闯红灯,就可能被路口的摄像头捕捉到。从美颜自拍,到增强现实(AR)、虚拟现实(VR)游戏,还有用无人机在人迹罕至的地区检测高压线路,背后都有计算机视觉的参与。
其中包括商汤科技与完美世界基于3D国风武侠手游《新笑傲江湖》合力打造的Avatar互动体验演示、与腾讯合作的 AR探索手游《一起来捉妖》手势互动体验演示,以及商汤自主开发的多人互动AR云体验游戏《黑羊守护者》。商汤科技凭借领先的原创技术实力,进一步将“AI+AR”赋能游戏产业,为游戏开发者及合作伙伴带来全新原动力,共同推动中国原创AR游戏及应用的创新与发展。
SenseARAvatar是商汤科技推出的3DAvatar驱动工具,通过领先的RGBD方案,可以实现高精准度、高稳定性和低延时的实时动态追踪,精准捕捉人脸、人体和手势等动作位姿,从而更加自然和流畅地实现对3D虚拟形象的驱动。即便在复杂的背景、光照环境和动态场景下,SenseARAvatar也能具备良好的鲁棒性表现,为用户带来完美的互动体验。
作为全球领先的人工智能平台公司,商汤科技SenseTime是中国科技部指定的“智能视觉”国家新一代人工智能开放创新平台。同时,商汤科技也是“全球最具价值的AI创新企业”, 总融资额及估值在业内均遥遥领先。
商汤科技以“坚持原创,让AI引领人类进步”为愿景。公司自主研发并建立了全球顶级的深度学习平台和超算中心,推出了一系列领先的人工智能技术,包括:人脸识别、图像识别、文本识别、医疗影像识别、视频分析、无人驾驶和遥感等。商汤科技已成为中国最大的AI算法提供商。
旷视在算法研究上希望能将传统人工参数设计等转移到深度神经网络,把研究人员的能力消耗大幅降低。在此基础上,旷视也在不断探索让机器自动生成神经网络,这也就是当下的自动网络结构搜索。随着自动网络结构搜索研究的不断推进, 下一轮算法革命即将到来,届时旷视将在其中继续发挥行业引领作用。
值得一提的是,旷视自主研发了人工智能框架Brain++,立足于旷视Brain++,旷视实现了云、端、芯的深度神经网络算法全面覆盖,形成了旷视的算法基因。基于此,旷视将持续打造以城市传感器为核心的城市大脑、以智能制造、智能物流、智能零售为核心的供应链大脑、以手机为核心的个人设备大脑,以推进人工智能及物联网技术与实体经济加速融合,实现前沿科技规模化商业落地。
其中,在城市大脑IoT场景,旷视城市管理AI解决方案已在全国260余个城市落地运行,已智能升级改造3000余个楼宇园区,实现人车通行智能化。
微美全息WIMI专注于计算机视觉全息云服务。据介绍,微美全息覆盖从全息计算机视觉AI合成、全息视觉呈现、全息互动软件开发、全息AR线上及线下广告投放、全息ARSDK支付、5G全息通讯软件开发、全息人脸识别开发、全息AI换脸开发等全息AR技术的多个环节,是一家全息云综合技术方案提供商。其商业应用场景主要聚集在家用娱乐、光场影院、演艺系统、商业发布系统及广告展示系统等五大专业领域。
微美的全息图像处理功能定期进行优化和改进,包括两项核心技术:全息AI面部识别技术和全息AI面部变化技术。由于视频处理和识别技术的发展,微美基于图像检测、识别、模板匹配、图像动态融合和替换的全息AR广告和全息成像服务目前在行业中处于领先地位。
全息AR广告软件使用户能够在视频片段中插入真实或动画的三维(“3D”)对象,和场景片段无缝集成,主要用于将全息AR广告嵌入由中国领先的在线流媒体平台托管的电影和节目中。2019Q1,使用微美软件制作的全息增强版广告共产生约23亿次观看,2018Q1观看次数约为12亿次,同比增长91.7%。2018年全年使用公司软件制作的全息AR广告共产生约66亿次观看,2017年观看次数约49亿次,同比增长34.7%。
通过微美专有的图像和视频识别技术,微美的软件使用户能够在像素级别分析底层视频片段,以识别可由3D对象增强的广告空间。广告商及其代理商通过与微美的系统集成的应用程序编程接口或API购买这些广告空间,指定其目标受众和预算,并通常提供嵌入视频中的3D模型。当检测到广告空间并生成3D对象时,3D对象将根据微美软件确定的批处理自动嵌入到基础流视频中。此外,在2018年,微美推出了 233 Game Platform,一个在线游戏发行平台。该平台为游戏开发人员提供技术支持和增值服务,可帮助他们定位、覆盖并通过其受众获利。2018年已有超过150个应用程序发布于233游戏平台上,年活跃会员超过200,000人.。
计算机视觉的任务不是能够观察世界就可以了,研究的目的是解决计算机的感知、认知问题的同时,让机器能够与世界实现交互,解决人工智能中手眼协调的连续决策问题;以及在一些涉及生命财产安全的应用中(如无人驾驶、AI驱动的新金融和新医疗领域等)做到无限接近 0 风险。
5G时代,更多物理设备链接到高可靠、低延迟的网络空间,越来越多的场景需要更高效的视觉计算、更低延时的体验,更好的隐私保护。5G是人类一个基本通信方法的技术进步,它并没有任何大家想象的政治因素。中国从2G、3G、4G、5G一路发展下来,在互联网、移动互联网产业方面受益非常大,整个生活效率、生产效率都大幅度提升。
|