Facebook市值蒸发近500亿美元后,扎克伯格3月22日回应数据泄露
06-17
人脸识别技术发展到今天,不仅在技术发展层面引起关注,事实上在政策和政策层面也引起了人们的关注。
用户隐私,引起了越来越多的争议,在某些领域或领域也颇为不得人心(见雷锋网此前报道);例如,2019年5月,旧金山市发布了面部识别技术禁令,禁止该技术。
被政府机构和执法机构使用,从而成为世界上第一个发布面部识别技术禁令的城市。
近日,微软悄然删除了该公司2018年发布的人脸识别数据库MS-Celeb-1M——该数据库是全球最大的公共人脸识别数据库。
Microsoft 为什么要发布 MS-Celeb-1M 数据库? 2018年8月,微软在其官网发表了一篇题为“《MS-Celeb-1M: A Dataset and Benchmark for Large-Scale Face Recognition》”的论文。
论文作者包括郭彦东(郭彦东,已离开微软加入小鹏汽车)、微软研究院张雷(张磊)、胡雨晓、何晓东、高剑锋等人。
在本文中,微软介绍了一项名为 MS-Celeb-1M 的人脸识别挑战赛。
参赛者需要根据微软提供的数据集作为训练数据,开发自己的图像识别系统,以便从10000个名人名单中进行选择。
用于人脸识别。
与此同时,伴随本次挑战,微软还发布了大规模人脸识别数据集MS-Celeb-1M开放下载,首个版本包含10万个名人(根据受欢迎程度,从上述的万孔名人名单),供研究人员开发自己的面部识别技术——微软声称这些照片来自人们常用的搜索引擎,即公共频道。
以Lady Gaga为例,我们看一下数据库中的相关照片:微软声称该数据库是全球最大的公共面部识别数据库。
微软技术与研究部首席研究员/研究经理张磊博士(上述论文中作者的张磊)曾表示,MS-Celeb-1M的目标是识别数百万张面孔,这是目前为止最大的分类。
计算机视觉。
问题,其中一个人物对应一个实体,与知识库绑定,知识库提供每个人的职业、性别等丰富的信息,从而解决人物重名问题,实现识别要实现的。
基于该数据库,微软举办了MS-Celeb-1M百万名人识别大赛,该大赛被业界认为是一年一度的人脸识别“世界杯”。
雷锋网获悉,2017年微软百万名人身份识别大赛:松下-新加坡国立大学获得第一名,CIGIT(中科院重庆绿色智能技术研究院)与中科院合作团队名列前茅第二,美国东北大学排名第一。
排名第三。
虽然在微软的理解中,这个数据集最初是为学术界准备的,但后来,这个数据集被工业界的很多同行所使用。
根据相关引文信息,MS-Celeb-1M数据库已被多家商业机构使用,如IBM、松下电器、阿里巴巴、惠达、日立、商汤科技、旷视科技等,甚至有报道称有相关军方研究人员使用该数据库来训练面部识别系统。
微软删除了它,但它存在于世界各地的硬盘上。
然而,随着面部识别技术的发展,人们越来越关注和担心相关的隐私问题。
有人认为微软的这个数据库涉嫌侵犯隐私。
例如,来自德国柏林的艺术家和技术专家 Adam Harvey 在他的 Megapixel 项目中记录了包括 MS-Celeb-1M 在内的数据库和用户的详细信息。
亚当·哈维认为,微软使用“名人”一词来指代那些在网上工作并在数字世界中出名的人,而不仅仅是像 Lady Gaga 和史蒂夫·乔布斯这样的名人。

例如,有媒体对MS-Celeb-1M数据库中的人脸进行验证后发现,MS-Celeb-1M中确实包含了大量名人的照片,比如Lady Gaga、史蒂夫·乔布斯等,但其中也包含了一些名人的照片。
媒体人民资讯,如《连线》杂志的资深记者Kim Zetter,负责报道网络犯罪、网络安全、隐私等问题。
事实上,针对微软涉嫌侵犯隐私的行为,英国还设法联系了MS-Celeb-1M数据库中包含的各方。
有些人甚至不知道他们的照片已被包含在内 - 例如科技作家 Adam Greenfield;他在接受采访时表示,自己绝不是公众人物,不能放弃自己的隐私权。
也就是说,微软在数据库中使用的照片并没有获得当事人的同意,即使他们是名人。
当然,微软本身也意识到了这个问题,现在已经删除了MS-Celeb-1M数据库;微软在给英国《金融时报》的回复中表示:这个网站最初是用于学术目的,是由微软的一名前员工运营的。
该员工现已离开 Microsoft,因此我们已将其删除。
值得一提的是,随着微软删除MS-Celeb-1M数据库,另外两家学术机构也删除了其旗下的类似相关数据库,包括杜克大学研究人员建立的杜克MTMC监测数据库和斯坦福大学的Brainwash数据库。
就目前的情况来看,微软用来介绍MS-Celeb-1M项目的网站还在,但数据集本身无法下载;不过,根据雷锋网搜索,相关数据库资源仍然可以从其他网站下载。
更重要的是,作为一个可公开下载的数据集,MS-Celeb-1M实际上存在于许多公司或机构的本地硬盘中,并被用于各种目的,但照片所涉及的人无法控制它。
正如 Adam Harvey 所说:一旦你发布它并且人们下载它,它就会存储在世界各地的硬盘上。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-17
06-18
06-18
06-18
06-17
最新文章
三只松鼠:门店扩张已全面暂停
Nvidia 已准备好“统治”AI
【创业24小时】2023年11月16日
【创业24小时】2022年10月20日
倒计时一天,浙江这座小镇要火了!
沃图网络获数千万A轮投资,加大投入海外网红营销SaaS平台建设
泰山天使基金部分退出拉手半年回报180倍
西格数据完成1000万元A+轮融资,国发创投领投