以往靠鉴黄图拿工资的人工鉴黄师,他们的工作可能要“凉凉”了。近日,阿里AI鉴黄语音反垃圾服务上线公测,能识别语音中存在的涉黄、广告等违规信息。这意味着,除识别色情图片、色情视频和色情文字外,涉黄语音也能通过AI鉴别了。
以往,传统的人工鉴黄师通过一双肉眼鉴别色情图片和视频。听起来像是“福利”,但实际上并不轻松。如今,伴随着互联网上社交媒体、直播、短视频的发展,每天光上传的图片超过10亿张,发文数量超过5亿条,不少色情、暴力等内容充斥其中。人工鉴黄师一天一人审核1万张图片的工作量,远远满足不了这一需求。
2015年10月,阿里巴巴“绿网”上线,用人工智能识别网络上包括色情、暴力在内的违规信息,阿里AI鉴黄师应运而生。通过人工智能、深度学习和大数据样本等技术,阿里巴巴的AI鉴黄师训练识别千万张正常图片与色情图片,最终生成一个智能鉴黄模型。
(图说:阿里AI鉴黄师,用技术解决社会问题。)
“我们要做的就是拿图片去‘喂养’它,让它不断学习,变得越来越聪明。” 阿里巴巴安全部高级算法工程师威视介绍:“最初在获取样本时,我们筛选了近2000网站、6000多万色情图片,经过去重,标注1300多万张高质量的色情图片,可以说这是AI鉴黄最重要的一块基石。”
阿里安全,一向致力于解决社会问题,可以说,高效率、低成本的阿里AI鉴黄技术,正将人工鉴黄师逐渐解放出来。威视表示:AI鉴黄师每天可审核数亿张图片,识别准确率高于99.5%。举个例子,一天要审核4亿张图片的话,单纯由人工来审,一人一天审1万张,需要4万人,而AI鉴黄只需将其中20万张可疑的图片筛出来,由人工再审一道,这需要20人即可。
更厉害的是,阿里AI鉴黄师不仅能鉴别黄片黄图,连带有情色信息的语音内容都能识别。近期上线公测的AI语音鉴黄反垃圾服务,可支持中文、日文、英文等多国语言,还支持东北、四川、广东等地方言。无语义的呻吟声也能识别出来。8月21日在北京召开的2018年网络安全生态峰会上,这些成果将集中展示。
当然,AI鉴黄并不能完全取代人工鉴黄,相比人工审核,机器还很难理解内容背后的深意。“最佳的审核方式是智能为主,人工为辅。人工鉴黄师群体数量少了,目前主要做打标和审查可疑图片的工作。”阿里安全部产品专家念夏说。
|