Deepfake平民化,10美元加一台笔记本,人人都能“换脸”阿汤哥
這段著名的視頻中比爾·哈德在不知不覺中變成湯姆·克魯斯,而且還是阿湯哥年輕時的樣子。
本文來自于微信公眾號硅谷洞察(ID:guigudiyixian),鈦媒體經授權發布。
如果說最近哪項技術在近段時間引發了美國全社會的反感,那毫無疑問是人臉識別技術。
從去年開始,美國就已經開始有禁止人臉識別的動作了。去年 5 月,舊金山成為第一個禁止政府購買和使用人臉識別技術的城;而今年受弗洛伊德事件影響,6 月 10 日,美國科技巨頭 IBM 宣布正式放棄人臉識別技術,緊接著第二天,亞馬遜表示停止對警方提供面部識別技術。
這背后除了種族歧視的問題以外,還存在另一個比較嚴重的隱患。那就是人們的面部數據可能被用于“深度偽造”(Deepfake)。
曾經,Deepfake 還是有一定門檻的。雖然網上有開源的 Deepfake 的軟件和工具,但是要么硬件要求過高,要么就是「Fake」的不夠「Deep」。總之,想要制作出一個完美的 Deepfake 視頻需要專業人士大費周章。
但是,讓人擔憂的 Deepfake 如今已“平民化”。小探甚至發現了只需要 10 美元和一臺最基礎的筆記本就能進行 Deepfake 的開源工具包。只需要經過 24 小時,一張滿臉橫肉的面容就能變成大帥哥「湯姆·克魯斯」。其造假程度說是「偷天換日」也不為過。
想知道這背后的工作原理和操作方式嗎?那就繼續往下看吧~
只需要 24 小時,我就能變阿湯哥
某日,小探在B站上發現了一條名為「最高境界的換臉」的視頻。
視頻中一群「科技宅」在自己的實驗室中進行視頻拍攝,并運用 AI 技術將他的臉換成著名演員湯姆·克魯斯的臉
換臉的過程總共需要五步「視頻轉圖片」、「提取臉部」、「訓練模型」、「人臉替換」、「合成視頻」
首先,他們會為自己拍攝一段源視頻作為素材以供 AI 進行學習。注意,在拍攝的過程中你的面部表情需要盡可能的多,這樣才能夠更好和需要替換的對象進行融合。
拍攝源視頻時表情盡可能的豐富
然后利用視頻軟件對臉部表情進行提取,這里用到的軟件是 AE 視頻剪輯。在視頻中人進行運動的時候,對其臉部的輪廓和細節進行「摳圖」,并生成一張張不同角度和表情的圖片。
讀取動態面部數據
在圖片提取完成后,就可以開始進入「模型訓練」部分了。
視頻中我們可以看到五個部分,其中最左邊的是最真實的照片,最中間的是需要替換的目標人物的臉,最右邊模糊的部分是最終替換的結果預覽。
而中間兩條模糊的對比欄則是 AI 在進行學習時不斷匹配最優角度的過程對比。
導入人臉數據由 AI 進行訓練
在不停的學習過程中,AI 生成的圖片會和實際拍攝的圖片越來越接近,而最終學習的結果越真實則代表著最終的「換臉」真實度會越高。同時這也需要更久的時間。
AI 生成的面部數據會逐漸接近真實的人臉
而最終經過一天的不間斷學習,他們成功的將自己的臉更換成了湯姆克魯斯的臉。
「湯姆·克魯斯」來啦
雖然在視頻中我們可以看到,「湯姆·克魯斯」的臉在某些時候會因為沒有匹配好而產生扭曲,這也是因為 AI 只學習了一天的原因。但是在正常的視角下還是非常逼真的。
雖然視頻并沒有寫明這幫「科技宅」使用的是哪種 Deepfake 工具。但是小探在搜索過程中發現了一款名叫「DeepFaceLab」的開源工具,這是由一個名叫「ctrl shift face」的公司發布的開源 Deepfake 工具。
Ctrl shift face 官網
而那段著名的 Deepfake 視頻就是采用「DeepFaceLab」制作的。這段著名的視頻中比爾·哈德在不知不覺中變成湯姆·克魯斯,而且還是阿湯哥年輕時的樣子。
你看得出來他們在一瞬間換臉了嗎?
目前這款工具包已經在 GitHub 上獲得了五百多星,并且它支持最低 2G 顯存的 64 位像素學習。也就是說,你并不需要太多的算力就能夠在自己的電腦上進行 AI 人臉學習。
DeepFaceLab 能在 2G 顯存 64 位像素下進行 AI 換臉
DeepFaceLab 唯一的安裝要求就是對應版本的顯卡驅動,甚至不需要 CUDA 和 CuDNN。并且該軟件還有中文官網以及詳細的中文安裝說明和教程,同時還自帶許多人臉圖片數據。
根據其教程顯示,雖然沒有可視化的操作界面,但是其操作流程還算簡單易懂。完全沒有代碼基礎的小白只要認真隨著操作步驟操作就能很快速的上手。
Ctrl shift face 官網提供了三檔氪金服務
并且只需要最高 10 美元/月,就能夠使用暢享其所有的換臉數據庫,這可真的算是良心價了。
這里值得注意的是,雖然這款工具包對于算力的基本要求非常低,但前面我們也提到過,越高的顯存和越長的 AI 學習時間才是高質量 Deepfake 視頻的保障。所以,如果需要達到上面那種一瞬間換臉的程度,恐怕需要你電腦中昂貴的 GPU 長時間的運轉才能做到。
Deepfake 只是娛樂,千萬不要觸犯法律
如今,Deepfake 的工具和開源包非常的多,許多極客和計算機愛好者都喜歡使用不同的軟件和工具制作自己的 Deepfake 視頻或音頻。
但是千萬別忘了,Deepfake 這個專有名詞天生就帶有欺騙性質,如果濫用會對個人隱私、媒體公信力、司法裁決等多方面帶來困擾。
比如之前硅谷洞察報道過的,2018 年 4 月,美國前總統奧巴馬說“特朗普是個徹頭徹尾的笨蛋”的視頻,在推特上獲得超過 200 萬次的播放,2019 年 5 月特朗普在推特上轉發并嘲諷的美國眾議長佩洛西說話結巴的視頻引發大量關注,最終都被證明是由深度偽造技術生成的偽視頻。
使用男演員圖像偽造的奧巴馬發表講話視頻,圖片來自于網絡
這些虛假信息除了將直接影響個人信譽外,甚至還可能引發“蝴蝶效應”導致整個社會秩序的紊亂。
而 2018 年在國內出現的換臉 App「ZAO」,在經歷上線三天的火爆后,立馬被下架封殺。并且國內在去年年底相繼發布《網絡音視頻信息服務管理規定》、《網絡信息內容生態治理規定》等法規,明確不得利用深度學習、虛擬現實等新技術新應用從事法律、行政法規禁止的活動。
曾紅極一時的換臉 App ZAO,圖片來源于網絡
除了這些衍生的社會影響外,Deepfake 也給人臉識別這項技術本身帶來了一個無法逾越的挑戰。
2018 年,「Deepfake」這一概念的提出者 Sébastien Marcel 和 Pavel Korshunov 兩位科學家就表示根據目前人臉識別技術的發展水平,在相同模型下,同等訓練時長的人臉識別對 Deepfake 視頻的識別錯誤率高達 95%。也就是說,當前已有的先進人臉識別模型和檢測方法,在面對 Deepfake 時基本束手無措。
兩位科學家指出,換臉技術的不斷發展的同時,Deepfake 的造假能力也在隨之提升,兩者會在很長的時間里「并駕齊驅」。
也就是說,將人臉識別技術比喻為蜘蛛俠的話,那么 Deepfake 就是附在他身上的「毒液」。它會隨著本體力量的增強而不斷增強,若用于正道它會成為不小的助力;但如果心存邪念,它強大的力量可能連本體都會吞噬。
所以在最后,小探想要提醒大家。Deepfake 對于人臉識別技術的發展是一種鞭策的力量,并且可以讓一些「科技宅」很好的測試自己電腦 GPU 的算力,但是如果使用這項技術從事違法犯罪,那可就是本末倒置了。
參考鏈接:
https://www.patreon.com/ctrl_shift_face
https://github.com/iperov/DeepFaceLab
https://www.bilibili.com/video/BV16x411R73Q?from=search&seid=3033760871383602659
總結
以上是生活随笔為你收集整理的Deepfake平民化,10美元加一台笔记本,人人都能“换脸”阿汤哥的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 东莞市景洪花园在哪里?
- 下一篇: scr指标原理和详解