| 首页  |  资讯  |  评测  |  活动  |  学院  |  访谈  |  专题  |  杂志  |  产服  |  
您现在的位置:硅谷网> 资讯> 互联网>

鉴黄界最难的音频识别问题,腾讯云给解决了

2018-10-23 15:00 作者:佚名 来源:硅谷网 HV: 编辑:钱旭东 【搜索试试

音视频的多媒体化,正在撬动大量用户的原创热情,但由此产生的海量内容却带来新的难题。

一方面,由用户端产生的内容(UGC)跨度广泛,质量参差不齐;

另一方面,部分打“擦边球”、违规内容,蒙混在海量音视频中,也进一步加剧了内容审核者的挑战。

对于网络上传播的色情恶意内容,图像鉴黄技术很好的打击了大部分色情图像和视频内容,而在一些短视频、直播等场景中,还有一些色情内容以音频方式传播,用以规避图像维度的打击。

因此腾讯云安全天御研发了基于音频的鉴黄系统,让腾讯云的整套鉴黄解决方案更具突破性,目前该系统已在腾讯云的点播、直播等业务中上线使用,进一步提高色情内容检出率。

该色情音频鉴黄系统目前日处理音视频超过1亿条,每日识别数十万条色情音视频,准确率95%以上。

先做个选择题,根据以下两张语谱图,猜猜哪张是色情尖叫声?

图A

图B

双管齐下,显著提升直播平台色情音频实时检出率

看似正常的语谱图,实际却是色情尖叫声。

目前音频鉴黄面临以下技术难点:

1. 音频内容和场景多样,常常伴有周围噪声和背景音乐等,信噪比较低;

2. 大部分音频时长较短,信息量不足;

3. 信道复杂,语音质量参差不齐,常见截频截幅等情况。

针对以上问题,腾讯云采用高效的 i-vector 系统保证较长音频正确快速检出,同时对信息量不足的短音频采用 DNN embedding 系统进行特定检出,两者互为补充,加上多种信道补偿算法的融合,同时保证了系统的识别性能和高实时率。

在业务量巨大的情况下,腾讯云基于变长统计和深度学习混合的鉴黄系统达到单线50倍速于原始音频流的高实时率。也就是说:1秒的音频,腾讯云0.02秒就能识别。

C:\Users\siriliu\AppData\Local\Temp\WeChat Files\faf8ddfd2419edea90c4b69939cbd9b3.jpg

[ 音频鉴黄系统框图 ]

腾讯云的音频鉴黄系统基于海量数据训练得到,对于每条业务音频,系统首先会通过静音检测去掉其中的静音部分,将保留下来的有效音频内容进行声学特征提取。

由于每条音频的时长不同,基于统计量和深度神经网络的音频识别模型将不同长度的音频特征转换为统一维度的音频表征信息。

最后再与系统中的色情模型与正常模型相比对,经过分数融合得到最终的识别结果 。

海量正负样本训练,让色情尖叫声悄然无存

音频鉴黄系统离不开海量的正负样本训练,样本标注看似简单,但实际操作起来却并不容易:

1、对于色情音频的定义,不同于语种说话人等有一个明显的定义,不同的人对色情内容理解会有偏差,一条音频在 A 听来是色情内容,在 B 听来可能只是在恶搞。

2、色情作为一种人为定义的类别,而声音是一种生物特征。同属于色情类别的声音可能从生物特征上来看差别巨大(像色情尖叫声和吮吸声),强制分为一类可能会导致训练不收敛的情况,并影响识别准确率。这就需要在标注时做细化工作,在色情与非色情之下再给出更精细化的标签。

基于以上几点,腾讯云在正负样本的标注中尽可能做到多标签区分,比如色情尖叫声、喘息声、吮吸声,专业 AV、UGC 视频等,以确保训练的模型能够有效的区分正常和色情音频,常见的标注如下:

C:\Users\siriliu\AppData\Local\Temp\WeChat Files\97550b427316fb0617d36d18eb8ea924.jpg

[ 色情音频样本标注 ]

在长期的细化与标注工作中,腾讯云累积了一套多标签色情尖叫声、喘息声长达上万小时的色情音频数据集,用于音频鉴黄系统的训练提升;

同时,针对线上的识别数据也持续进行人工抽检覆盖和漏过情况,并将正负样本进行标注用于系统优化,让音频鉴黄系统更智能。

音频鉴黄技术由腾讯云安全天御打造,在文本、图片鉴黄的基础上为腾讯云的客户提供更全面的技术支持。

目前腾讯云的音频鉴黄系统已经在多个业务场景上使用,但由于场景需求的复杂性,仍有很多困难与挑战并存。紧跟音频分类相关领域的最新技术趋势,同时利用海量业务数据的优势进一步提高系统性能和速度,是腾讯云下一步的发展方向。

【对“鉴黄界最难的音频识别问题,腾讯云给解决了”发布评论】

版权及免责声明:
① 本网站部分投稿来源于“网友”,涉及投资、理财、消费等内容,请亲们反复甄别,切勿轻信。本网站部分由赞助商提供的内容属于【广告】性质,仅供阅读,不构成具体实施建议,请谨慎对待。据此操作,风险自担。
② 内容来源注明“硅谷网”及其相关称谓的文字、图片和音视频,版权均属本网站所有,任何媒体、网站或个人需经本网站许可方可复制或转载,并在使用时必须注明来源【硅谷网】或对应来源,违者本网站将依法追究责任。
③ 注明来源为各大报纸、杂志、网站及其他媒体的文章,文章原作者享有著作权,本网站转载其他媒体稿件是为传播更多的信息,并不代表赞同其观点和对其真实性负责,本网站不承担此类稿件侵权行为的连带责任。
④ 本网站不对非自身发布内容的真实性、合法性、准确性作担保。若硅谷网因为自身和转载内容,涉及到侵权、违法等问题,请有关单位或个人速与本网站取得联系(联系电话:01057255600),我们将第一时间核实处理。
广告
相关
·英礴与腾讯云达成战略合作,携手推进 SpatialOS
·拿下80%直播平台 视频云成了腾讯云突围武器
·IBM LinuxONE与腾讯云 TStack实现相互认证
·她拍事件深度观察:授权模式促进腾讯云服务标准
·前三季度收入60亿 腾讯云成腾讯前进的新发动机
·邱跃鹏:互联网下半场,腾讯云要做信息能源发动
·腾讯云成KVM开源贡献榜国内唯一上榜公有云厂商
·携手爱接力慷宝中城联盟 腾讯云助力智慧地产
头条
Facebook降低拉丁美洲视频清晰度 缓解网络拥堵 Facebook降低拉丁美洲视频清晰度 缓解网络拥
【硅谷网】 2020年3月24日消息,据国外媒体报道,Facebook将在拉丁美洲范围内,在其社……
·Facebook降低拉丁美洲视频清晰度 缓解网络拥
·58同城强制安排员工长达2个月的停薪留职 激进
·《网络信息内容生态治理规定》2020年3月1日起
·爱奇艺被列为被执行人,执行标的为30191800元
·Netflix预计2020年第一季度新增用户比市场预
图文
Facebook降低拉丁美洲视频清晰度 缓解网络拥堵
Facebook降低拉丁美洲视频清晰度 缓解网络
克拉克拉上线虚拟社交功能“脱壳匹配”,探索社交匹配新玩法
克拉克拉上线虚拟社交功能“脱壳匹配”,探
李彦宏谈未来搜索 李彦宏理解的未来搜索是怎样的?
李彦宏谈未来搜索 李彦宏理解的未来搜索是
网易暴力裁员事件:还原网易暴力裁员事件始末
网易暴力裁员事件:还原网易暴力裁员事件始
最新
·Facebook降低拉丁美洲视频清晰度 缓解网络拥堵
·克拉克拉上线虚拟社交功能“脱壳匹配”,探索社交
·Disney+推迟至2020年4月7日法国上线 减轻网络负担
·走在全球化长征路上的BitZ 风雨苍茫启征程
·一年级网课前播接吻广告,优酷遭痛批陷入争议
热点
·李彦宏谈未来搜索 李彦宏理解的未来搜索是怎
·“走路赚钱”的趣步 是披着区块链外衣的传销
·Nature:晨光初现未来已来,一起链接世界
·支持美国制造业,苹果奖励康宁2.5亿美元
·订酒店未入住无法取消订单,是否属于“霸王条
旧闻
·天池OGeek算法挑战赛落幕 OPPO与阿里云扶持人
·从两会看短视频平台野心 好看视频在第一梯队
·追赶速度惊人!BBC:中国这几大科技领先全球
·迅雷链技术沙龙第四站:大咖带你了解进阶的迅
·5G时代,你会花25元在手机上看一场电影吗?
广告
硅谷影像
Facebook降低拉丁美洲视频清晰度 缓解网络拥堵
Facebook降低拉丁美洲视频清晰度 缓解网络拥堵
克拉克拉上线虚拟社交功能“脱壳匹配”,探索社交匹配新玩法
克拉克拉上线虚拟社交功能“脱壳匹配”,探索社交
Disney+推迟至2020年4月7日法国上线 减轻网络负担
Disney+推迟至2020年4月7日法国上线 减轻网络负担
走在全球化长征路上的BitZ 风雨苍茫启征程
走在全球化长征路上的BitZ 风雨苍茫启征程
一年级网课前播接吻广告,优酷遭痛批陷入争议
一年级网课前播接吻广告,优酷遭痛批陷入争议
新冠肺炎疫情下云逛街人潮涌动 无接触配送更常见
新冠肺炎疫情下云逛街人潮涌动 无接触配送更常见
关于我们·About | 联系我们·contact | 加入我们·Join | 关注我们·Invest | Site Map | Tags | RSS Map
电脑版·PC版 移动版·MD版 网站热线:(+86)010-57255600
Copyright © 2007-2020 硅谷网. 版权所有. All Rights Reserved. <京ICP备12003855号-2>