设为首页 - 加入收藏 ASP站长网(Aspzz.Cn)- 科技、建站、经验、云计算、5G、大数据,站长网!
热搜: 手机 数据 公司
当前位置: 首页 > 运营中心 > 建站资源 > 经验 > 正文

AI换脸背后的技术攻防战

发布时间:2019-09-02 16:17 所属栏目:19 来源:丁直仁 赵宇
导读:经过一个周末的集中爆发,换脸软件ZAO的热度终于有所降温。它应用的技术并不新鲜,却让人脸合成视频第一次离普通用户这么近。 广被诟病的用户协议、合成视频存在的安全问题使得ZAO深陷舆论漩涡从爆红到质疑缠身,只用了不到24小时。 但是,对ZAO的担忧与抵

AI换脸背后的技术攻防战

经过一个周末的集中爆发,换脸软件ZAO的热度终于有所降温。它应用的技术并不新鲜,却让人脸合成视频第一次离普通用户这么近。

广被诟病的用户协议、合成视频存在的安全问题使得ZAO深陷舆论漩涡——从爆红到质疑缠身,只用了不到24小时。

但是,对ZAO的担忧与抵制并不能解决普通人隐私、安全存在风险的问题。从人脸合成技术诞生的那一天开始,人们就没有停止过对技术被人利用去作恶的忧虑。

人脸合成只是当下备受追捧的人工智能领域的一个分支,技术在为人类带来诸多新奇体验、便利的同时,也给个体带来对于自身诸多权益被侵犯的担忧。

当人类制造的技术越来越强大,甚至无所不能,人类本身的领地和独特性如何维护便成为值得思考的问题。如今,人工智能的发展渐成加速之势,这个情况甚至超出了不少人最乐观的估计,潘多拉的盒子已被打开。

因此,对ZAO的担忧,折射出的是一个潜藏于每个人内心的最基础的疑问:如果人工智能越来越无所不能,人类该如何自处?在新一轮的产业变革中,人类的隐私和其他权益究竟如何保护?

如何让技术被正确的使用,这是一个始终没有标准答案的问题,却又是解答以上问题的关键。

「被引爆的隐私担忧」 曾经刷屏的应用软件不止ZAO一款

在朋友圈刷屏,ZAO有许多前辈:脸萌、足记、天天P图……与ZAO一样,这些曾经刷屏的应用大多与图像相关,许多也需要用户上传个人照片,但是从未引起如此规模的争议和质疑。

能够合成视频是ZAO引爆公众讨论的关键:在此之前,图像APP的玩法都是基于静态的照片,ZAO则是第一次将视频换脸带到了每一个普通用户身边。

在一位从事计算机视觉研究的业界人士看来,ZAO应用的技术难度并不大:“如果说计算机视觉技术零分是最容易,十分是最难的话,原来你给我一张人脸图像,我能生成另一张姿势的图像,可能那个难度是三分、四分,而合成视频就是要生成一系列图片,不再只是一张,难度也就五分、六分,实际上并没有进阶的突破。”

事实上,在计算机视觉领域,生成一张图片的技术早已有之:把A的脸抠出来贴在B的脸上,Photoshop也可以完成。只是在深度学习的帮助下,程序可以快速、大量的P图。而视频人脸合成,实际上就是先生成一个视频序列的所有帧,之后加入检测或视频序列技术,进而生成人脸合成视频。

合成视频,这触达了许多人的心理底线:当视频也可以被伪造,还有什么可以甄别真实?

无论是今年6月被篡改的马克•扎克伯格的视频,还是被嫁接了美国女星面孔的色情视频,都足够引发大众对于视频真实、安全性的担忧。比如犯罪分子伪装子女声音向父母勒索的案例已经发生,在人脸合成的帮助下,视频验真也已经无法确定事实的真相,正如有些网友提醒的:“有手机号,有面部图像,通过技术合成,犯罪分子可以替你和家人通话。”

大部分人并不会遇到上述极端情况,但人脸识别的广泛应用使得人脸合成有了更多可以想象的发挥空间。当人脸合成被装进手机应用中,成为每一个人都触手可及的技术时,类似的担忧无疑会被放大,在安防、支付、考勤、刑侦等领域,愈加真实、无破绽的人脸合成技术,的确会带来不少安全隐患。

好在,围绕人脸识别的攻防战早已拉开帷幕,多次交手后,技术升级后的人脸识别并不那么容易被攻破。

「技术攻防战」

人脸合成只是计算机视觉研究的一个细分方向,作为一门致力于让机器看懂物体的科学,计算机视觉研究诞生已久。1966年,人工智能学家Minsky给学生布置了一个作业:编写一个程序让计算机告诉我们它通过摄像头看到了什么,这被认为是计算机视觉最早的任务描述。而计算机视觉之所以在今天能诞生如此多新奇有趣的应用,与深度学习的发展密不可分。

2006年,深度学习泰斗Geofrey Hinton在《Science》发表了论文《A fast learning algorithm for deep belief nets》,推动了持续至今的人工智能浪潮。

深度学习在国内业界的普及则与百度密切相关。

2013年1月,百度正式对外宣布成立深度学习研究院(IDL),李彦宏亲自出任院长,中国“千人计划”国家特聘专家、现地平线创始人余凯任副院长。2014年,IDL的Deep Speech项目将嘈杂环境下的语音识别准确率提高至81%——彼时同样环境下Bing、Google以及Wit.AI等的最高识别率也只有65%。这是深度学习在国内工业界应用的典范,引发了人们对深度学习的重视。

得益于此,人工智能相关应用在过去几年迅猛增长。其中,人脸识别是应用范围比较广的技术之一。如今,在金融、安防、考勤等领域,人脸识别已被大量应用。比如,当用户向互联网金融公司借贷时,平台首先需要做的是“验证你是你”,由于与钱直接相关,拦截伪造的人脸攻击就变得至为重要。

ZAO应用的人脸合成技术引发人们忧虑的一个场景便是:合成人脸是否会引发安全问题?这个问题已经引发研究者的重视,为了提高人脸识别的安全性,他们做了诸多尝试。

2018年7月,旷视科技产品总监彭建宏曾在一节网络公开课中表示:在人脸识别领域,目前比较流行的攻击方法主要包括:图片攻击(使用合法用户的纸质打印照片、彩色打印照片、手机里保存的照片等欺骗,属于非活体攻击)、视频攻击(提前录制的视频回放,包含眨眼、转头、张嘴等动作指令欺骗,属于活体攻击)、立体面具攻击(利用事先伪造的面具欺骗,属于非活体攻击)等几种方法。

而研究者们最为重视的是可以应对活体攻击的检测方案,包括动作活体检测、视频活体检测、炫彩活体检测、双角度活体检测等几种类型。

旷视的人脸识别方案

●  动作活体检测:要求用户根据UI提示做点头、摇头等随机动作,每次的随机动作都是从计算机 Servers 端发出的,计算机通过人脸质量检测、人脸关键点的感测和跟踪,以及脸部的 3D 姿态等技术细节提高人脸识别的精准度。

●  视频活体检测:主要针对移动 H5 的场景,要求用户根据 UI 提供的内容读一个四位数字,计算机通过云识别、语音同步检测等方法判断被检测的人脸是否真实。

●  炫彩活体检测:根据反射光三维成像的原理,杜绝了用 3D 软件合成的视频、屏幕翻拍等的攻击。在强光环境下,炫彩活体的检测效果不太好,因此可能需要用户最后做出一个简单的点头动作,以提高活体攻击的门槛。

●  双角度活体检测:要求用户拍一张正脸的自拍照与侧面自拍照,这种检测方式相当于用户拍摄一个1-2秒钟的视频,计算机通过 3D 模型重建的方式来判断视频中是否为真人。

(编辑:ASP站长网)

网友评论
推荐文章
    热点阅读