今年年初,谷歌推出了一项名为“谷歌大脑”的深度学习项目,能够把只有64个像素(8X8)的模糊图片,变成更清晰的图片。这项被称为“黑科技”的技术惊艳了很多人,带动了AI图像学习的热潮,也使得人们对视频有了更多新的想象。
11月29日, 第五届中国网络视听大会在成都召开,作为中国网络视音频领域规格最高,被称为“年度风向标”的行业盛会,本次会议以“新使命·新视界·新动能”为主题,邀请了网络视听业界和学界的领军人物共聚一堂,共同探讨中国网络视听行业的现在与未来等热点话题。金山云高级副总裁、合伙人梁守星受邀出席本次会议并发表《AI,让视频更有温度》的演讲,对人工智能与视频行业结合的新技术以及未来发展进行了分享。
金山云高级副总裁、合伙人梁守星在中国网路视听大会现场演讲
梁守星表示,人工智能作为一项具备高度信息识别能力的创新技术,已成为社会进步的主旋律,并受到越来越多行业的关注。据有关统计数据显示,目前AI领域创业的企业中,有一半以上都专注在计算机视觉、服务机器人以及语言和自然语言处理等方面,并在不断向电商、金融、教育、医疗等各垂直行业渗透。“AI在自身技术迭代并向各行业渗透的过程中,一个新的富媒体时代也随之而来,并将助力用户体验升级,成为视频的终极演进。”梁守星补充道。
“AI画质+”还原高清让媒体 “富”起来
自19世纪中叶,人们初次接触视频影像起,视频技术一直在围绕如何让画面更清晰、传输更稳定的方向进步。进入移动互联网时代后,AI技术丰富了人们对视频的想象。它将不再扮演单一载体形式,可以与各行各业结合,以智能穿戴设备屏幕、医疗影像等各种形态,帮助教育、医疗、安全行业实现全面升级。
不过,在AI出现之前,这种升级面临较大技术难度。一方面受限于编解码技术能力和网络环境,另一方面网上的图像和视频越来越多,存储与传输这些图像和视频的成本也就越来越高。如何在片源不清晰,或者经过压缩后还能呈现出高清效果,成为大家亟需解决的问题。
梁守星表示,基于深度学习能力的超分辨率算法和画质修复算法,可为视频提供商和用户大幅节省存贮成本与传输带宽,化解成本压力。目前,金山云已推出基于这两项算法的“AI画质+“图像增强技术,并实现在移动端将高清视频压缩成低分辨率视频进行传输。
据了解,金山云”AI画质+”图像增强技术能为不同分辨率、不同类型的视频训练出不同的模型及模型参数,再通过搜索其他类似经过压缩的高分辨率视频图像,寻找图案、颜色的相似关系,进行视频还原和修复。这样,在接收端将低分辨率视频还原成高清视频时,可以做到实时进行,完全不会影响到用户的视觉体验。
270p视频帧经普通的双线性插值(左)和金山视频云算法放大四倍的效果(右)
如果说超分辨率技术解决的是高清图像在传输过程中的高成本问题,那么对那些由于硬件设施较差、网络环境欠佳、拍摄时间久远、画面抖动等等导致画质损伤的片源,金山视频云则可以通过视频修复算法进行修复,它可应对各种突发情况导致的画质损伤,将视频中的马赛克,毛刺,重影,噪点等实时修复为较好的画质,提升用户的视频体验。
金山云火眼“金睛” 守护网络洁净安全
视频行业高速发展,在带给人们丰富信息的同时,危害社会健康和安全的涉黄、暴力、诈骗等信息业蜂拥而至。如果只靠人工审核来保持网路环境的洁净安全,这将是一项耗时耗力的巨大工程。
为此,金山云基于KDL深度学习算法,借助每日千万级海量图片库训练出精准AI算法模型,打造出业内领先的一站式AI内容安全监管平台——金山云金睛。它可提供快速智能图像识别,支持“鉴黄” 、“暴恐” 、“ 涉政” 、“广告识别”等多种图像智能识别服务,同时提供“直播实时AI安全监管服务”,“短视频AI安全审核”解决方案,准确率高达99.9%以上。人工审核万张图片成本要几十元甚至上百元,而使用金山云金睛平台只需要几块钱,能带来80%以上的成本节省。
梁守星表示,移动互联网视频的最大特点是更新快,实时性强。实时性方面,金山云通过图片、声音、文字等多层识别监督,可以保证监管无死角。在准确地识别各种不合规视频方面,金山云在强大的计算能力外,沉淀了海量图片,目前拥有1.2亿海量数据标注,并每天24小时不间断识别。
随着苹果、谷歌、高通等巨头在AI芯片领域的发力,视频将会迎来一个高速发展阶段。未来,金山云将基于深度学习能力,充分打造视频超分辨率和视频修复技术,满足人们对4K视频高清的体验的观看体验追求,同时将会增强包含声音、图片等多层实时视频鉴别监控技术能力,为视频和各行业的发展保驾护航!
|