(图1:12.21科大讯飞发布会)
人工智能技术领域的翘楚科大讯飞,其年度发布会在12月21日北京国家会议中心圆满落下帷幕。纵观2015年,人工智能技术达到前所未有的高度,包括近期刚结束的第二届互联网大会上,习大大也对中国的人工智能发展表示了高度关注和看好。
只有技术创新才能带来激动人心的产品。智能硬件的蓬勃发展,离不开人工智能技术的突飞猛进,包括语音、图像等多模态的交互,而讯飞抓住了语音和图像这两种人机交互模态的核心,发布会给现场观众带来不少震撼。那么就从语音和图像两个角度,谈谈可能会与讯飞三分天下的另外两家人工智能公司。
语音企业:科大讯飞VS思必驰
同样具有十多年技术研发基础的讯飞和思必驰,同样以技术创新为特色,是国内高校联合实验室与产业紧密联系成功对接仅有的两家范例,都具备长期的基础性原创技术研发能力,这几点就明显将讯飞和思必驰与其他语音公司区别开来。不同的是,讯飞与思必驰专注的发展方向略不一样。以车载领域为例,讯飞在前装市场里是不可撼动的霸主,而思必驰目前看来更专注在后装市场,今年的多款车载合作产品都获得了不俗的市场反响,预装量第一,成为了后装市场的领头羊。
(图3:互联网大会上的思必驰)
在发布会上,讯飞展示了最新的“超脑2.0版本”和录音笔产品,实时同步转译所有演讲内容,现场大屏幕投影文字。无独有偶,思必驰在今年早些时候7月份的发布会上也展示了“语音输入板”APP,并在最近的互联网大会上分享了AIOS对话操作系统。因此在国内目前的语音企业里,作为技术范的代表,思必驰应该是最有能力放到与讯飞类比的地位。
(图4:思必驰的语音输入板展示)
语音识别上,讯飞的优势在于对方言的支持力度更大,包括四川话、河南话、东北话、山东话、天津话、湖南话、武汉话及合肥话多种方言识别,而思必驰是第一个推出实时连续输出并可根据上下文纠错的输入法APP,体验效果上,似乎在语境上的纠正和实时识别速度更好一些。讯飞的文字转译,应该也是借鉴了思必驰的做法,精进了不少,发布会现场的文字同步转译速度惊人,推出的录音笔值得关注,虽然价格尚未透露,但按讯飞刘庆峰的话来说“方案是成熟的,只要有钱就可以拿走”。
(图5:思必驰纠正哥截图)
交互上,思必驰在7月底的发布会上,于业内首发可打断可纠正、基于上下文理解的自然语言多轮交互,也是第一个解决了“纠正哥”难题的语音公司。讯飞也在发布会上重点介绍了相关内容。可以说,在自然语言交互这个层面,思必驰的优势比较明显。但在方案的后端内容上,讯飞的发布会上现场展示了叮咚音箱,除了普遍支持的语音点歌和联动设备控制外,还能通过音箱搜索票务信息并直接订票,体验比较流畅。思必驰的AIOS方案目前集成的功能也在逐步添加,或许当两家交互体验相差无几的时候,比的就是后端的内容服务了。
(图6:思必驰的专注领域)
另外在专注领域上,讯飞的业务范围更广一些,包括移动互联网、教育、智能硬件、安全及建筑方面都有涉及,并且还有自己的toC产品:叮咚和录音宝。相对来说,思必驰的战略方向更专注一些,早前将其口语教育业务剥离出去(驰声科技,后被网龙全资收购),目前就只专注于智能硬件领域,包括车载、家居、机器人及穿戴。作为体量较小的公司,这个战略很正确,专注蓝海市场,快速垂直深入,将技术和体验做透,才能实现差异化竞争。
图像识别:科大讯飞VS旷视科技
在讯飞发布会的当天,李开复去了旷视科技体验他们的技术和产品。而去年今日,讯飞在深圳发布了人脸识别方案,并在其开放平台上也推出了人脸识别的SDK,号称识别率高达99%,而旷视科技主打“Face++”,自成立以来就一直受到业内的高度青睐,国家领导人也到访过多次。那么,比较讯飞和旷视科技而言,他们具有什么样的差异。
(图7:李开复到访旷视科技)
就目前讯飞的布局而言,人脸识别只是其中一环,从语音技术到图像识别,讯飞走的是人工智能全技术研发的道路,打造“超脑计划”,提供全模态交互的解决方案,而旷视倡导的是“机器之眼”,让机器看见并看懂世界,实现机器与人的交流。旷视的战略分三步: Face++,目标是识别人; Image++,识别万物; Brain++,机器之眼,让机器看见就能理解、看懂。讯飞从整体布局着手,再做细分领域,而旷视相反,从单点技术开始,逐步深入再拓宽领域。
(图8:支付宝的刷脸)
图像识别,必须基于海量的数据基础。旷视科技依托多年的项目经验,尤其是和阿里的合作,具备海量的标注数据,最近的互联网大会和支付宝的刷脸,也是采用了旷视的技术,反观之讯飞,讯飞的主要投入不在这里,但因为市场对智能化的刚性需求,选择与高校共研借力发展底层技术,符合其基础技术驱动产业升级的理念。
(图9:旷视科技的Megivii C1智能摄像机)
产品研究方面,人脸识别技术应该是作为图像识别的一环,讯飞目前还在专注研究人脸,包括表情识别、性别识别、年龄估算等各种技术的研发,旷视已经走在远远的前方,今年还推出基于安防的智能摄像机Megvii C1,获得市场高度认可。但讯飞把他们的专长——“语音技术”和人脸识别打包,第一个推出“人脸+声纹”的统一生物认证,这是旷视尚未开始的产品领域,也是借助体量和先发优势采取的正确战略。
(图10:旷视科技的项目案例)
合作领域方面,目前讯飞的人脸识别技术,多运用在还属于弱需求的智能硬件领域。而旷视科技的应用案例则广泛得多,尤以刚性需求的金融、安防、商超等为主,今年也开始对智能硬件领域的合作客户敞开了大门。但讯飞凭借其资源的广泛性,不排除未来会在教育、建筑等领域做大力拓展。因此现目前来看,旷视拥有更大的市场占有量,随着双方的发展,未来在交叉领域的竞争在所难免。
2015年, “去中心化”、“人机交互”、“认知智能”等热词被频繁提起,这是所有产品智能化的发展方向,不管是BAT这样的互联网巨头企业、还是诸如科大讯飞这样的大型科技领军企业,抑或是旷视科技、思必驰等垂直技术的新兴创业公司,都专注着自己的方向前行。从来没有一企独大的成熟市场,也只有当技术在较量和挑战中被弄潮儿们不断的使其落地的时候,才能诞生真正伟大的人工智能时代。
|