他不是英國人習慣的那種冷靜、深思熟慮的加雷斯·索斯蓋特,在這個粗獷而又現成的網絡幽默世界里,這可能才是重點。
在半決賽戰勝荷蘭隊后,英格蘭隊走出球場的幾個小時內,社交媒體上就出現了對球隊經理的深度模仿,充斥著英格蘭隊主教練賽后的咒罵,而且非常不尋常。
英格蘭隊在半決賽中戲劇性地戰勝荷蘭隊后,在TikTok上發布的一段視頻中,一個冒牌的索斯蓋特說:“看起來我今天把它們放進了一個大大的麗茲拉。”這些視頻使用人工智能工具復制了索斯蓋特的聲音,并操縱了他的下半張臉,以一種業余的方式嘗試對口型。無論結果如何,周日的決賽之后無疑還會有更多的比賽。
這位英格蘭主帥被廣泛認為是這個國家的象征,但在這種情況下,他象征著一種互聯網趨勢:深度假梗。
閱讀更多
就像之前的圖像編輯一樣,人工智能生成的惡搞視頻剪輯——深度造假——已經成為互聯網愛開玩笑者工具箱中的關鍵工具。
薩里大學(University of Surrey)以人為本的人工智能研究所(Institute for human - centered AI)教授巴哈瑞·赫拉維(Bahareh Heravi)表示:“深度造假正在成為新的ps內容。”“現在人們可以使用不同的基于人工智能的工具來創建內容,就像他們以前使用Photoshop和視頻編輯工具一樣。但現在,它的視頻和音頻生成功能得到了增強。”
簡單地說,商品換臉應用程序可以讓任何人在視頻片段中簡單地替換一張臉,這使得2018年的一項重大技術成就只需要按下一個按鈕。最近的例子包括Rishi Sunak和Keir Starmer飾演Del Boy, Rodney Trotter和Noel Gallagher飾演一系列愛爾蘭人,其中包括Roy Keane,這顯然是對搖滾明星在采訪中提到他的愛爾蘭血統的玩笑。
再加上ElevenLabs的語音克隆工具,你就可以更進一步,寫一個完整的腳本,讓你的新假名人朗讀出來。如果你看過英國政客扮演Twitch《我的世界》主播的視頻,你就會知道這樣的創作充滿了笑話和參考,只有奇怪的機器人鼻音或歪斜的嘴能把你從惡作劇中拉出來。
英國公司Faculty AI的專家們表示,索斯蓋特的這段視頻有明顯的漏洞,包括嘴部動作與說話不一致,說話時停頓和語速不自然。該公司與商業和英國政府簽訂了識別深度造假的合同。當然,最明顯的跡象是,英格蘭球迷知道索斯蓋特永遠不會用這種方式談論他的球員——哈里·凱恩、菲爾·福登和杰克·格雷利什都是被他們的假老板掏空內臟的球員。
學院表示,人工智能視頻深度造假可能在去年達到了一個轉折點,一段視頻再現了巴黎世家(Balenciaga)與哈利波特(Harry Potter)明星的t臺秀,并補充說,基于人工智能的欺詐可能會“對社會構成更大的威脅”。ITV的Deepfake neighbor Wars節目模擬了伊德里斯·艾爾巴(Idris Elba)和金·卡戴珊(Kim Kardashian)等明星,也表明這一概念正在進入主流。
然而,Faculty表示,生成式人工智能(指ChatGPT或Midjourney等系統,它們通過簡單的提示生成令人信服的文本、音頻和圖像)正在以如此快的速度發展,以至于“僅靠人工檢測將很快不足以防止真正有害內容的傳播”。
英足總表示:“就像我們處理所有有害內容一樣,我們將采取措施刪除冒犯性視頻。”
這些惡作劇者的意圖很少是直接誤導,但這并不意味著這些笑話不會混淆。在互聯網上,沒有哪一種模仿最終不會被誤認為是它所嘲笑的對象的一個例子——這種現象如此普遍,以至于在近20年前被命名為“坡定律”,因為一位評論者指出了諷刺極端觀點的困難。就像《洋蔥報》的文章或幽默網站B3ta制作的圖片一樣,病毒式傳播的深度偽造照片被轉發是相當常見的,越來越多的評論質疑該視頻是否真實。索斯蓋特的一些視頻片段被貼上了人工智能制作的標簽。
索斯蓋特的視頻在社交媒體上被大量觀看。在YouTube上,有很多關于索斯蓋特的假視頻,在斯洛伐克隊比賽后發布的一個深度假視頻獲得了39萬次觀看,而TikTok上一個專門針對索斯蓋特的假視頻的8個視頻總共獲得了超過100萬次觀看。TikTok賬戶鏈接到一個eBay頁面,出售索斯蓋特定制的人工智能信息,并補充說:“如果你想要一些臟話,請告訴我們。”
TikTok的指導方針要求為看起來逼真的人工智能內容貼上標簽,并允許“在某些藝術或幽默的環境中”模仿公眾人物。YouTube已經改變了審核政策,允許人們要求刪除深度造假視頻,不過該公司表示,在決定下架視頻之前,會考慮該視頻是惡搞還是諷刺。
赫拉維說:“對于公眾人物來說,事情不受他們控制,因為任何事情都可能被錯誤地歸咎于他們。”她補充說,她特別擔心音頻,因為沒有視覺線索來識別深度假聲音。“然而,隨著我們等待更好的深度偽造檢測工具,更重要的是,隨著公眾對深度偽造的認識和教育越來越高,我們可以預期情況會有所改善。”
假視頻并不是生成式人工智能重塑生產模因的唯一領域。由Glif領導的表情包生成器已經開始將幾乎整個幽默創作過程自動化。對于具有固定格式的模因,如“chad/virgin”或“stop doing math”,用戶可以創建完整的模板,將精心提示的大型語言模型(LLM)與生成圖片的圖像生成器以及將它們整合在一起的標準化結構配對。結果是一個工具,可以指示你制作一個關于為什么你應該“停止參加足球比賽”的表情包,并在幾秒鐘內收到“踢球不是為了決定民族自豪感”的勸告。