首頁
黨政
- 黨網(wǎng) · 時政
- 人事
- 反腐
- 理論
- 黨史
- 黨建
要聞
觀點(diǎn)
互動
可視化
地方
- 京
- 津
- 冀
- 晉
- 蒙
- 遼
- 吉
- 黑
- 滬
- 蘇
- 浙
- 皖
- 閩
- 贛
- 魯
- 豫
- 鄂
- 湘
- 粵
- 桂
- 瓊
- 渝
- 川
- 黔
- 滇
- 藏
- 陜
- 甘
- 青
- 寧
- 新
- 鵬
- 雄安
民文
English
合作網(wǎng)站
舉報專區(qū)
登錄

退出

從“一眼假”到“真假難辨”再到“深度偽造”，生成一條音頻只需20秒

濫用公眾人物聲音惡搞，AI技術(shù)應(yīng)用“玩過界”被質(zhì)疑

陳曦

2024年10月28日07:59 | 來源：工人日報

小字號

　　近日，一些短視頻平臺涌現(xiàn)了大量某知名企業(yè)家吐槽的視頻。在視頻中，該企業(yè)家對堵車、調(diào)休、游戲等熱門話題進(jìn)行了調(diào)侃和銳評，甚至還有不雅詞匯穿插其間，引發(fā)網(wǎng)友熱議。

　　事實(shí)上，那些吐槽視頻并非該企業(yè)家本人在發(fā)聲，而是由網(wǎng)友利用AI軟件采集該企業(yè)家原音生成的配音，但逼真的效果讓不少人信以為真。

　　AI的發(fā)展為生活帶來了許多便利，但一些亂象也引發(fā)質(zhì)疑。以AI語音合成技術(shù)為例，只需要打開軟件、動動手指，一條以假亂真的配音視頻就能新鮮出爐。然而，有的視頻越過了開玩笑的邊界，“偷走”他人聲音進(jìn)行惡搞、造謠，帶來了惡劣的社會影響。

　　20秒就能生成一條AI音頻

　　記者在社交軟件上檢索AI配音發(fā)現(xiàn)，不少用戶發(fā)布了相關(guān)視頻的生成教程。其中，大部分視頻的配音都源于某擬真語音大模型應(yīng)用。

　　在該應(yīng)用網(wǎng)站上，創(chuàng)作者上傳任意人物的一段音頻作為訓(xùn)練素材，隨后AI通過學(xué)習(xí)可克隆出一個聲音角色。網(wǎng)站中的其他用戶只需輸入文本，便可以使用該聲音生成內(nèi)容。

　　按照該網(wǎng)站的使用指引，記者添加了上述知名企業(yè)家的聲音角色，輸入一段100字的文本，然后點(diǎn)擊“開始生成”，約20秒，一條與該企業(yè)家聲音相似度極高的AI音頻就生成了。記者發(fā)現(xiàn)，截至目前，該聲音角色已被使用79.9萬次，生成字符數(shù)達(dá)4455.5萬個。

　　被“偷走”聲音的公眾人物還有不少。今年9月底，一段據(jù)稱是某直播平臺老板盧某某的酒后錄音在網(wǎng)絡(luò)上流傳，整體呈現(xiàn)出盧某某對于消費(fèi)者的傲慢態(tài)度，以及對相關(guān)人士的不尊重表達(dá)，為該平臺招致了不小的爭議。后警方調(diào)查發(fā)現(xiàn)，音頻內(nèi)容不實(shí)，系大模型偽造而成。

　　一位業(yè)內(nèi)人士告訴記者，通過模仿音頻樣本的語調(diào)、語速、情感、口音、發(fā)聲方式等特征，AI技術(shù)已經(jīng)能夠高度還原音頻樣本的聲音，達(dá)到人耳和其他鑒定方式難以區(qū)分的程度。

　　“從早期的‘一眼假’到如今的‘真假難辨’，AI的發(fā)展進(jìn)入了‘深度偽造’時代�！敝袊鐣茖W(xué)院大學(xué)法學(xué)院副教授、互聯(lián)網(wǎng)法治研究中心主任劉曉春向記者表示，在未經(jīng)過授權(quán)、未進(jìn)行標(biāo)注的情況下，用他人聲音制作AI語音產(chǎn)品，尤其是“借用”公眾人物的聲音，很容易引起誤解，這不僅會侵害個人信息安全，還可能擾亂網(wǎng)絡(luò)空間生態(tài)秩序。

　　濫用他人聲音侵犯人格權(quán)

　　當(dāng)前，不少網(wǎng)友在合成他人的AI音頻時，僅抱著娛樂心態(tài)，并沒有意識到背后隱藏的法律風(fēng)險。記者注意到，在一條“AI配音教程”視頻的評論區(qū)，有學(xué)員提問“這樣不侵權(quán)嗎”？

　　博主回復(fù)稱：“大家都在做，如果提示違規(guī)，刪了就行了。”

　　對此，北京盈善律師事務(wù)所律師張清鑫分析稱，與“肖像”類似，自然人的聲音具有唯一性、獨(dú)特性，是自然人人格的重要組成部分，聲音權(quán)益是人格權(quán)的一種。制作并上傳他人AI音頻的行為，無論是出于商業(yè)目的還是娛樂目的，都已構(gòu)成對其人格權(quán)的侵犯。如果配音內(nèi)容違法或違反公序良俗，可能侵犯他人的名譽(yù)權(quán)。

　　據(jù)了解，今年4月，北京互聯(lián)網(wǎng)法院一審開庭宣判了全國首例AI生成聲音人格權(quán)侵權(quán)案。該案中，配音師因認(rèn)為自身作品被短視頻平臺利用AI生成語音產(chǎn)品，嚴(yán)重侵犯了自己的聲音權(quán)益，將短視頻平臺及制作方等5家公司訴至法院，最終原告獲賠經(jīng)濟(jì)損失25萬元。

　　在審理過程中，被告公司辯稱，人工智能合成后的聲音產(chǎn)品，與自然人聲音在人身權(quán)屬性上有所區(qū)別，目前技術(shù)都會對人工智能合成聲音進(jìn)行水印標(biāo)記，切斷了人工智能合成聲音與自然人聲音之間的聯(lián)系，不會產(chǎn)生對應(yīng)自然人的人格屬性。而法院認(rèn)為，AI聲音與原告聲音具有高度一致性，能夠引起一般人產(chǎn)生與原告有關(guān)的思想或感情活動，能夠?qū)⒃撀曇袈?lián)系到原告本人。在具備可識別性的前提下，自然人聲音權(quán)益的保護(hù)范圍可及于AI生成聲音。

　　“該判決對于厘清和把握AI生成聲音的邊界具有指導(dǎo)意義�！眲源赫f。

　　治理手段要跟上科技步伐

　　清華大學(xué)新聞與傳播學(xué)院新媒體研究中心今年4月發(fā)布的一份研究報告顯示，近一年來，經(jīng)濟(jì)與企業(yè)類AI謠言量增長99.91%。受訪專家表示，法律法規(guī)和治理手段要跟上科技發(fā)展的步伐，對AI技術(shù)的應(yīng)用進(jìn)行明確的約束，引導(dǎo)科技向善。

　　張清鑫認(rèn)為，AI語音應(yīng)用工具提供方不能“置身事外”，而是要把好第一道關(guān)，強(qiáng)化對源頭素材的把控和對生成內(nèi)容的監(jiān)管，完善運(yùn)營規(guī)則，并在出現(xiàn)問題時積極配合有關(guān)部門，追溯違法音頻的生成源頭。

　　今年9月，國家網(wǎng)信辦發(fā)布的《人工智能生成合成內(nèi)容標(biāo)識辦法（征求意見稿）》提出，提供網(wǎng)絡(luò)信息內(nèi)容傳播平臺服務(wù)的服務(wù)提供者應(yīng)當(dāng)采取措施，規(guī)范生成合成內(nèi)容傳播活動。包括提供必要的標(biāo)識功能，并提醒用戶主動聲明發(fā)布內(nèi)容中是否包含生成合成內(nèi)容等。

　　“作為內(nèi)容傳播的服務(wù)提供者，短視頻等傳播平臺應(yīng)盡到相關(guān)義務(wù)�！眲源航ㄗh，除了提示用戶進(jìn)行標(biāo)識以外，平臺也應(yīng)對AI生成內(nèi)容建立甄別和追蹤的機(jī)制。如果發(fā)現(xiàn)涉嫌偽造的內(nèi)容或者接到相關(guān)投訴，應(yīng)當(dāng)要求內(nèi)容發(fā)布者及時對偽造內(nèi)容進(jìn)行標(biāo)識，在不標(biāo)識的情況之下，可以根據(jù)平臺規(guī)則刪除內(nèi)容，造成嚴(yán)重后果的可以進(jìn)行禁言、封號等處理。