以成本为导向的数据采集和标注已经难以满足当前高精度的数据需求,专业高质的数据将成为AI服务行业新的爆发点。
近五年,随着神经网络、深度学习等技术的高速发展,人工智能应用层面出现爆发式增长。人工智能连续三年被写入政府工作报告,其推动经济增长与时代进步的“新引擎”角色已经成为共识。
人工智能产业的发展离不开数据服务业的支持,目前阶段,人工智能算法的训练主要依靠大量数据来完成。数据对于算法就像汽油对于发动机,从车辆自动化驾驶到AI聊天机器人,从医学成像与诊断到农作物监测,数据在其中扮演着“幕后英雄”角色,发挥着不可或缺的作用。数据越多、越精准,算法训练后获得的模型也就越智能、越好用。
与人工智能行业的蓬勃发展和对数据量更大、质更高的要求相适应,近两年国内涌现出一大批专业从事AI数据采集与标注的服务公司,借助大量技术投入和近千万专职、兼职数据采集标注人员,持续为不同行业AI落地输送新鲜数据血液。国外AI数据服务业也成投资热门,今年3月上市公司Appen以高达3亿美元的价格收购了同行业另一家数据标注公司Figure Eight。
作为移动互联网的先行者,Testin云测早在2011就为互联网、AI、大数据、IoT等技术在各行业中的应用保驾护航。Testin有数是Testin云测旗下的AI数据服务品牌,是先进的AI数据服务解决方案提供商。Testin有数坚持自建数据标注基地和定制化搭建的数据采集服务,为AI企业提供全流程一体化的数据服务解决方案。
Testin云测有必要有使命 提供AI数据服务
2011年,正值移动互联网时代到来,Testin云测从手机APP测试起家进入企业服务领域。移动互联网的本质是用户数据驱动,即产品推出—用户使用并反馈—产品优化—再投入市场的过程。Testin云测提供产品质量测试、自动化测试、安全测试、兼容性测试等服务,并结合A/B测试等工具及服务,帮助企业获取优质用户及快速反馈,加快移动互联网产品迭代周期。
但随着人工智能对用户交互方式的改变,在移动互联网产品中的嵌入和落地,人工智能变成企业研发的重要一环。数据作为人工智能算法模型中不可缺少的部分,对企业而言与质量测试面临着同样的痛点。一方面,企业自建团队进行数据采集和标注耗费大量时间成本、人力成本。另一方面,企业要构建核心壁垒,必须独享数据,保证数据不被其他企业共享或轻易获得,这对数据安全的保护提出了更高要求。
“随着企业对数据定制化采集的需求增加,相对应的数据标注维度也愈加丰富,这对数据的精准度、安全性又提出了新的挑战,市场急需一批高能力、高素质的数据服务团队,Testin云测有必要也有使命,为加速产品的迭代周期提供人工智能数据服务。”Testin有数负责人表示。
搭建定制化采集场景和数据基地 把控数据质量和安全
希鸥网了解到,作为先进的应用服务平台,Testin云测以“让应用更有价值”为使命,基于自主知识产权的人工智能数据服务、移动互联网测试服务、用户增长服务,为企业提供与应用相关的全生命周期服务。
以Testin云测为背书,Testin有数为企业提供定制化的数据采集和高精度的数据标注服务。针对数据采集业务,Testin有数搭建了定制化采集场景,基于客户算法模型定制化搭建采集场景,以达到覆盖尽可能多的实际场景及边际场景的目的,保证采集数据契合算法模型,为客户提供高精度的采集数据。
备采样本覆盖全国及海外的数据采集体系,涵盖各类型图片、视频、音频和文本数据,同时配备了专业的备采人群样本,可依照客户实际需求快速采集合适的数据样本。
在高精度的数据标注服务上,Testin有数自建数据基地,所有标注员统一管理、规范生产,在保证数据准确率的同时有效保证标注作业的信息流转,提升标注效率,保证标注质量;自研标注平台,平台聚合各种数据标注应用场景,配置灵活,可满足各种数据标注需求,保证标注作业高质量输出。
提及Testin有数的核心优势,可总结为三点。一是专业团队的支撑。目前,Testin有数主要服务于智能驾驶、金融、智能生活、安防四大领域,每一领域由不同的项目经理组负责。项目经理都经过包括AI基础、作业管理、场景搭建、突发事件处理等至少350小时的职前培训,每一位项目经理都能够为客户梳理项目需求文档,并为客户提供专业咨询服务,从源头保证高质量输出。
二是强大的工具支撑。Testin有数配备专业的软硬件设备,并针对客户不同的定制化需求持续优化工具、迭代产品,满足技术要求高、采集难度大的采集任务。
三是对数据质量和安全的把控。Testin有数进行严格的质量风险评估、过程质量控制、质量审核、质量验收,输出高质量的数据作业;自建数据中心,员工按照流程协同作业,将采集后的数据传输至数据中心,项目交付后直接清毁数据,杜绝员工接触数据的机会,提升数据安全性。
从前沿角度出发 建立行业最高标准
就像婴儿吃一段二段三段奶粉一样,数据服务也分为三个阶段。第一阶段是基于互联网数据及开源数据集进行的数据训练。数据本身易获取,可做立项、算法初期验证;第二阶段是通过互联网运营,付费主动获取,为满足样本多样性;第三阶段则是从实际落地场景出发,需要高精度、高质量以及更多维度的数据,此阶段数据的获取也是最难,且必要的一环。
相比当前的众多数据服务商,Testin云测从2011年开始做企业服务,积累了大量的企业客户使用Testin云测服务和产品。以Testin云测为支撑,Testin有数在华东、华北、华南设有数据交付中心和数据采集基地,了解客户需求、满足客户需求、引导客户需求、超越客户需求,不断优化服务态度、提高产品品质、降低服务成本,助力客户最大效益的完成数据采集和标注,已为数百家AI企业提供AI数据采集与标注服务。
“Testin有数希望建立数据服务行业最高标准,那些场景非常难、无法通过其它企业完成的需求,我可以选择Testin有数。但凡上升到高难度、高精度的数据需求,企业首先选择Testin有数。”相关负责人表示。
数据是推动AI前进的燃料。AI产品落地已成为不可阻挡的趋势,产品落地需要经得起检验,其中交互以及处理的准确性离不开高精度的算法,精确的算法模型又离不开强大数据量的支撑。以成本为导向的数据采集和标注已经难以满足当前高精度的数据需求,专业高质的数据服务将成为AI服务行业新的爆发点。
经历了从量到质的改变,数据越来越成为引领人工智能发展的重要战略窗口。从社会问题出发,从前沿角度出发,以客户需求为导向,不断打破行业天花板,重新定义AI数据服务。Testin有数,未来可期。
|