2019「甲子引力」大会(2019中国科技产业趋势暨科技产业融合大会)于11月9日在北京富力万丽酒店盛大召开。大会以聚焦“科技产业化、产业科技化”议题,以趋势、数据、痛点、反思、真相和旋律为基调,求真务实,探索人工智能发展真相。作为国内一线AI数据采集标注服务商,Testin受邀参加本次盛会,并以“数据迭代,定调人工智能”为主题进行了分享,与科大讯飞、依图、寒武纪、云知声、地平线等行业代表企业建立共识、巅峰论道。
在人工智能发展历程中,数据、算法和算力是人工智能迭代发展的基石。Testin数据标注业务总经理贾宇航在会上表示:“由于当下人工智能落地应用场景众多,复杂程度不一,根植于小场景的数据的要求愈发精准重要,但AI数据的发展是从几个阶段演变而来。”
互联网数据阶段
在人工智能发展的初期阶段,人工智能产品仍处于“识别猫还是狗”的程度,在绝大多数时候并不能解决实际问题,此时的人工智能正处于“可行性研究阶段”。而人工智能企业单位也通常会选择沉淀在互联网上的公开数据进行算法训练,就可以满足应用需求;
通用数据集阶段
随着人工智能“可行性”得到验证,人们希望人工智能能够真正的解决一些问题,此时业界最主要的如同机器视觉、语音识别、自然语言处理等几个大的应用领域开始集中爆发数据需求。这时,针对AI固定领域通用数据集出现了,这些数据集可针对不同场景重复使用,满足了人工智能发展初期绝大部分应用领域的数据需求;
众包数据阶段
众包数据是基于用户的激励,采集各类场景数据。事实上,众包数据采集早在人工智能发展的最早期,甚至在“AI数据”被发明之前就已经出现。这里的“众包数据阶段”实指2015年到2018年上半年。数据众包模式集中爆发的原因是人工智能厂商发现,使用通用数据集可以解一时之忧,却并不能使得自己在行业竞争中保持领先。人工智能厂商开始尝试通过众包方式获取更丰富且大量的数据;
定制化数据阶段
时至当下,在使用AI数据训练算法的过程中人们意识到——同一批规范的数据能释放的“能量”并不一样,且这种“能量”同时决定着人工智能产品的“上限”和“下限”。而在另一方面,随着人工智能商业化落地,人工智能产品也朝着精细化和专业化的方向发展,例如“驾驶员疲劳监测”这专业性较强的应用场景就需要定制化的方式进行采集,进而精细化标注定。
数据生产的迭代历程,印证着人工智能产品的落地程度。AI数据采集与标注作为AI领域的底部基建工作,直接掣肘着AI技术应用落地的效能。从行业竞争环境来看,AI公司或AI部门将独自拥有数据视为构建自己的核心竞争力之一。而Testin一直以来都将“精准高质”“安全独立”作为AI数据业务发展的核心,保证AI数据的唯一性、场景化,推动AI产业化落地进程。同时,Testin也在AI数据服务行业中拓荒、经历和坚守。
关于Testin:
Testin成立于2011年,作为一家以人工智能技术驱动的综合性企业服务平台,在助推AI产业化落地方向,一直致力于提供优质的AI数据服务。经过不断的成长和发展,Testin基于自建的数据场景实验室和数据标注基地,为智能驾驶、智能家居、智能安防、智慧城市、智慧金融等领域提供了数据支持服务,在文本、语音、图像、视频等类型数据采集标注能力已达到国际领先水平,持续为人工智能的相关行业的产业化、智能化贡献着力量。
|