据国外媒体报道,IBM从网络相册Flickr上拍摄了近100万张个人照片,用它们来研究如何训练面部识别训练程序,并与外部研究人员分享照片。
但是据美国全国广播公司(NBC)爆料称,在Flickr上传照片的用户并不同意把他们的照片用来开发面部识别系统,要知道考虑到这些系统最终可能会被用来监视和识别他们,他们自然不愿意轻易批准。
虽然摄影师可能已经获得了为这些人拍照的许可,但一些人告诉NBC,被拍照的人不知道他们的照片上有面部识别注释,可以用来训练识别算法。
顺便说一句,这些照片最初不是由IBM汇编的-它们是被称为YFCC100M的更大的9920万张照片库的一部分,YFCC100M是Flickr之前的东家雅虎公司最初为进行研究而收集的。所有照片都是在CreativeCommonsLicense版权协议下共享的,这种版权协议表明照片可以自由使用,但存在一些限制。
但事实上,他们可能被用来训练面部识别系统,以按种族划分,或是作为一个人脸案例。
值得一提的是,IBM公司过去开发了一款视频分析产品,它使用人体摄像头来了解人们的种族。对于此次拍摄网络相册的人脸照片,IBM否认将“参与涉及种族相貌识别的工作”。
同样值得注意的是,IBM的初衷可能是为了防止人工智能对某些群体产生偏见。今年1月,当IBM宣布收集数据时,该公司解释称,它需要一个如此庞大的数据库,以帮助进行“公平”和准确的图像识别培训。
无论如何,对于一般人来说,很难检查他们的照片是否被用于人工智能训练,并请求删除他们的照片,因为IBM对任何和学术或公司研究无关的人都不会公开数据库。
NBC从不同的来源获得了数据集,并在其文章中为摄影师制作了一个工具,用于检查他们的Flickr账户名是否包含在IBM的数据库中。
IBM在一份声明中告诉媒体称,“我们非常重视个人隐私,并非常小心地遵守隐私原则。”它指出,照片数据库只能由经过验证的研究人员访问,而且只能包括网络上可公开获取的图像。它补充说,“用户个人可以选择退出这个数据库。”
IBM只是探索面部识别领域的几家公司之一,它并不是唯一家使用普通人照片而不明确征求民众同意的公司。例如,Facebook有80万张脸部照片可供其他研究人员下载。
|