今天,人工智能无处不在,深刻改变着人们生产和生活方式,在医疗健康、教育、交通、金融、零售等各个领域不断创新,展现出广阔的应用场景。但是在实际推进落地的过程中,AI领域科技公司遇到的挑战之一,即是数据质量的问题。
AI发展迫切需要高质量数据
人工智能应用场景的落地,离不开海量的、高质量的有效数据进行支持,数据质量直接影响算法效果,而数据质量除了取决于原始数据质量之外,更为重要的则是数据加工过程中数据标注的质量。
一般来说,数据标注的数据类型包括文本、图像、音频和视频等,数据标注人员会根据客户需求及专业标准对不同类型的数据进行分类、标记、注释等加工处理,这些标记过的数据会用以训练算法。可以说,数据标记工作的质量直接影响数据结果的准确率和精细化程度,也正因此业内人士一般认为数据标注这一工作是“容易又复杂”,所谓“容易”在于该工作可依据既定规则标准进行,通过一定训练的标注者即可操作;但所谓“复杂”则因为真正有价值的高精准数据标注,门槛还是相对较高。也正因此,标注质量较高的有效数据,是行业内迫切需要的。
高质量AI数据如何“炼”成?
2017年起,亿达信息开始为国内AI领域技术公司提供数据服务,两年多的时间里业务规模不断壮大,在2018年10月24日于北京召开的“数据智能生态系统峰会”上,亿达信息荣登“2018数据智能生态百强榜单”,并获得“AI行业应用方案商”称号。仅仅两年时间,亿达信息AI数据服务迅速发展,受到AI企业及行业专家认可,这其中有何“秘密武器”?在与亿达信息AI数据服务核心团队的深入沟通中,我们找到了一些答案……
专业数字化运营管理体系,打造高水准标注团队
当前数据标注工作离不开人力的投入,而专业标注团队的打造,则离不开对标注人员的选拔、培训与管理。亿达信息自2006年成立以来,在为国际客户提供服务的过程中,积累了丰富的经验,建立了完善的运营管理体系与组织管理体系,为人才的筛选、培养与管理提供了保障。在AI数据服务人才管理方面,亿达信息建立了全方位专业培养机制,注重对数据标注人员专业技能、职业素养的持续提升,不断扩充标注人员行业知识储备,在不断的项目实战中积淀技术与服务经验,使得高准确率有所保障。
自主研发AI数据服务平台,实现数据质量全流程管控
亿达信息作为数字化运营专家,公司内部重视数字化技术的研发,不断培育数字化创新项目,以导师专家与资金资源进行扶植,推动优秀项目竞相绽放。在服务客户的过程中,亿达信息数据标注团队深入梳理标注流程中存在的难点,聚焦如何高效对接客户需求,如何保证数据清洗、标注、交付等环节及时性、准确性,如何减少标注过程中重复性操作,如何提高标注人员工作效率等核心问题。工欲善其事必先利其器,正适合结合了工作中存在的重重难题,亿达信息数据标注团队充分利用数字技术,创新性地自主研发AI数据服务平台,为AI数据标注工作赋能。
2018年10月亿达信息AI数据服务平台正式上线,该平台整合数据需求、人力资源和业务流程,通过AI数据处理工具集的技术支撑,完成AI数据的采集、清洗、标注、训练,实现高标准的AI数据交付全流程服务,目前该平台可面向多领域AI研发组织提供文本、图像、语音、视频等数据的采集与处理服务。
亿达信息AI数据平台,可实现从任务分发、标注对接、培训分配、监督管理、结果整合、质量检查、交付验收等全流程精细化管理,对项目进展和质量实时监控。该平台的质检流程可帮助标注团队了解影响质量原因,并可提供调整优化方案及相关报告。通过标注人员自检及交付团队质检后,可向客户提交直接用于训练模型的高质量数据。目前亿达信息已为互联网、智能家居、零售业、汽车、医疗、智能制造等行业客户AI应用场景落地进行数据服务。
亿达信息作为亿达控股旗下中国领先、国际化的数字化运营专家,聚焦医药大数据、AI平台、IT智能化平台、互联网产品运营、智能设备五大领域,通过创新的技术和专业的解决方案,在企业运营、客户管理、产品提升等方面,满足企业数字化、智能化需求,助力企业实现数据驱动的产品和服务。未来,亿达信息将坚持 “创新驱动,转型发展”, 以质量为导向,争做数字化创新先锋,持续为行业客户数字化转型赋能。
|