硅谷网讯 据科技博客TechCrunch报道,根据Facebook近期获得的专利,脸部识别、地标识别甚至是语音识别可让Instagram视频服务(Instagram Video)智能地为用户推荐短视频封面和标签。该技术还能够将每个视频导向相关的合适人群,展示最佳的静态图封面。
封面的重要性
目前,在Instagram拍完视频之后,你要用手指滑动时间轴来选择视频的缩略图。这是发布Instagram Video过程中额外多出的一个麻烦步骤,也会让人觉得它比Vine迟钝。
挑选视频封面的过程也许是比较繁琐,但它非常重要。相比看照片,看视频是一项要大得多的时间投资。用户也许能够迅速欣赏到一个经典Instagram视频的美妙,这个过程也有可能会很缓慢。虽然视频最长也只是15秒钟,但在移动领域,如果内容无趣乏味,那可是很长一段时间。
看视频的投资是否值得取决于三个因素:作者的名气、视频简介和封面。视频并不是每一帧都能够进行分析,体现场景,及展示视频中的重要时刻。现在Facebook是让用户在视频的15帧里挑选出封面,默认选择第一帧,并没有任何的提示。
但有了上述专利技术,Facebook和Instagram可以帮助挑选出视频中最有趣的时刻,确定视频中的人和物,推荐标签以及封面。
识别表情与语音
那些专利于2011年10月提交申请,2013年4月正式授予。本质上,它们描述了一种将视频中的每一帧当作是照片的技术。利用脸部和模式识别技术,相关检测算法能够用于识别出人、书面语、品牌和地标。
“图像采集过程可以分析视频中每一帧,识别出地方(如埃菲尔铁塔、金门大桥、约塞米蒂国家公园、好莱坞)、商家组织(如咖啡店、旧金山巨人队)或者品牌产品(如可口可乐、LV)。”
这能够让Facebook依据人、地点和品牌信息,在用户给视频加上标签时进行提示,或者就是记录这些信息用来确定向动态消息中向哪些人呈现视频。例如,视频针对附近特定人群的展示会更加显著,如喜欢所涉地标、品牌的人,或者在视频中出现的朋友。
那些信息还可以用于推荐最好的视频封面,例如展示人或者著名景点的画面。上述专利还涉及通过检测光照明亮,甚至是通过检测脸部表情挑选出最佳封面。如果拍了沙发上一大群朋友的视频,那Instagram会向你推荐一张大家都开怀大笑的封面。
然而,最令人兴奋的是,Facebook通过麦克风确定视频最有趣时刻技术的潜在使用。“图像选取过程中会分析语音内容(例如通过语音识别算法),从而判断各帧的重要性(如‘笑一笑’、‘笑一个!’、‘好美啊!’、‘太神了!’)”。
这意味着Instagram在你的摄像头瞄向漂亮的日落、地平线或者笑貌的时候,能够听到你的惊叹声,之后也会简化视频封面的选择流程。
随着Instagram、Vine等产品之间的社交视频领域之争日趋白热化,像这样的重大技术将会是决定成败的一个关键因素。
对于Instagram来说,幸运的是其母公司Facebook已经花了多年的时间来设想如何使得媒体采集和分享体验更加流畅。该社交网络公司似乎早就预见技术最终会使得视频录制变得跟拍照一样简单。如果上述专利能够在Instagram奏效,视频消费也将会变得更加简单,人们也许将能够看到更多朋友拍摄的精彩时刻。
|