硅谷网讯 人机交互技术简称HCI(Human-Computer Interaction),即人与机器之间的智能交流互动,举例来讲,就像《钢铁侠3》主人公托尼·斯塔克用意念召唤装备一样,当然,这暂时只是电影的夸大之说,但现实中一些人机交互技术已确实应用于人们的日常生活中——比如天行听书APP的语音合成与识别技术。
天行听书是一款小巧易用的手机APP软件,自上市至今,在百度移动应用的下载量已迅速突破100万。纵观安卓市场、苹果商店的听书APP应用,懒人听书几乎在有声读物领域占领了听书市场的大半江山;而听书市场的另一半江山——txt听书(不依靠有声读物),却在不到一个月的时间内已被天行听书揽入己怀。用芒果卫视某娱乐节目知名女主持人的一句经典台词试问:“何德何能呢?”
天行健,地势坤
天行听书的成功并不是偶然,了解背景的人或许都知道它的核心技术——语音合成技术(简称TTS)来自捷通华声语音技术有限公司,这是一家在国内HCI(智能人机交互技术)领域起步较早的研究公司之一,经过一二十年的科研积累,自主研发的灵云开放平台融合了多项HCI技术,其中语音合成技术已经应用在高铁、机场、奥运会、世博会等重大项目领域,形成自己稳健的风格。因此,在大数据、大背景的支持下,天行听书的特色功能——男女声、娃娃音、地方方言阅读就显得与众不同,逸趣横生,而且颇具中国地方人文特色的设计满足了不同地区听众的个性需求;最重要的是稳定、自然的音色输出体验才是天行听书最终夺得TXT听书领域桂冠的杀手锏。
随着APP的盛行,已专注于HCI领域数十年的捷通华声与时俱进,和众多企业合作将灵云能力应用到直接面对社会大众的应用产品上,将灵云的技术能力散播到生活中的各个角落。而这一路走来,也正是秉承着朴实、追索的清华遗风,坚持“天行健,君子以自强不息;地势坤,君子以厚德载物”的精神才得以在中国HCI领域乘风破浪,将之前应用到商务领域的大技术应用到为社会制造便利的生活小助手身上——天行听书、天行输入法、小唐龙语音助手……这些产品都是灵云HCI技术能力的体现。
更新才是王道
随着天行听书被大众追捧的热度越来越高,天行听书幕后技术人员也在马不停蹄地日夜更新维护,保证天行听书最佳的运行状态,给予大众最舒服的听书体验。
目前的电子书市场已被炒得如火如荼,有关书籍的电子应用也层出不穷。懒人听书、91熊猫看书等APP也是在日益加快研发步伐,努力追赶,弥补TXT听书这一领域的缺失。一时间语音合成技术成为了电子书软件应用炙手可热的抢夺品。作为已经在该领域占有一席之地的天行听书也继续发挥自己的长板,积极研发新的语音合成技术。
据悉天行听书后续将加入账号功能,大幅度完善书城书籍数目和种类。为了满足大家更丰富个性的需求,在技术日益成熟的将来特色音库或许还将融入郭德纲、赵本山、单田芳等大师的模拟发声;此外自定义音库的设想是,可以使用户随意模拟任何一位身边人的语调,比如录入女朋友的一段话,那么经过后台技术处理后,您在接下来的听书过程听到的朗读声将是女友的发音,神奇而又新鲜的体验,当然,从目前的技术来看这些还只是设想,但是相信随着HCI技术的飞速发展与突破,也一定会很快实现的。
对于账号功能的加入,将实现不同终端设备的云同步,即在手机、ipad、电脑甚至智能电视之间自由切换收听,从而避免重复的上传和下载。
听书APP的次世代畅想
随着HCI技术的不断突破与发展,将来很可能达到语音随意模拟的状态,不仅仅可以识别并合成人类的语言,还有可能在宠物的身上得到实现,比如汪星人、喵星人的每一句叫声是不是都有特殊的含义,而通过这样的一个随身携带的听书软件就可得知自己宠物的感情需求。当然这需要不同行业之间的专家强强合作,需要研究宠物的专家提供长期研究的数据,同时需要语音识别和合成领域的专家予以嫁接实现。
就像《白宫陷落》电影里演的那样,次世代武器一出场,我和我的小伙伴们就惊呆了!让我们一起期待次世代的天行听书早日到来吧!
天行听书
天行听书应用捷通华声“灵云”平台语音合成、语音识别技术能力,是一款专业的阅读听书软件,让您轻松体验“所读即听”的语音阅读世界,从此阅读不再只靠双眼。
|