◎文 《法人》雜志全媒體記者 白馗 見習(xí)記者 姚瑤
隨著AI語(yǔ)音合成技術(shù)的廣泛應(yīng)用,聲音被收集、合成、制作、模仿甚至篡改的現(xiàn)象越來越普遍,這對(duì)聲音權(quán)益的保護(hù)提出了前所未有的挑戰(zhàn)。
▲CFP
2024年4月,北京互聯(lián)網(wǎng)法院一審開庭宣判了全國(guó)首例AI生成聲音人格權(quán)侵權(quán)案,明確認(rèn)定在具備可識(shí)別性的前提下,自然人聲音權(quán)益的保護(hù)范圍可及于AI生成聲音。同時(shí),AI生成聲音可識(shí)別性的認(rèn)定應(yīng)綜合考慮行為人使用情況,并以相關(guān)領(lǐng)域普通聽眾能否識(shí)別作為判斷標(biāo)準(zhǔn)。
AI“偷走”配音師原聲
某天,配音師殷某發(fā)現(xiàn)自己的聲音被AI處理并在多個(gè)知名APP廣泛流傳,而這些被AI生成的作品經(jīng)聲音篩選和溯源,發(fā)現(xiàn)來自北京某智能科技公司(下稱“被告一”)。在被告一運(yùn)營(yíng)的平臺(tái)中,用戶只要輸入文本、調(diào)整參數(shù),即可實(shí)現(xiàn)文本轉(zhuǎn)化成語(yǔ)音功能。殷某曾接受北京某文化傳媒公司(下稱“被告二”)委托錄制錄音制品,且被告二為錄音制品的著作權(quán)人。
判決書顯示,調(diào)查發(fā)現(xiàn),被告二在殷某為其錄制錄音制品后,將音頻提供給某軟件公司(下稱“被告三”),允許被告三以商業(yè)或非商業(yè)的用途使用、復(fù)制、修改數(shù)據(jù)用于其產(chǎn)品及服務(wù)。被告三僅以原告錄制的錄音制品作為素材進(jìn)行AI化處理,生成了涉案文本轉(zhuǎn)語(yǔ)音產(chǎn)品并在上海某網(wǎng)絡(luò)科技公司(下稱“被告四”)運(yùn)營(yíng)的云服務(wù)平臺(tái)對(duì)外出售。被告一與北京某科技發(fā)展公司(下稱“被告五”)簽訂了在線服務(wù)買賣合同,由被告五向被告三下單采購(gòu),其中包括涉案文本轉(zhuǎn)語(yǔ)音產(chǎn)品。被告一采取應(yīng)用程序接口形式,在未經(jīng)技術(shù)處理的情況下,直接調(diào)取并生成文本轉(zhuǎn)語(yǔ)音產(chǎn)品在其平臺(tái)使用。原告殷某主張,被告行為已經(jīng)嚴(yán)重侵犯其聲音權(quán)益,被告一、被告三應(yīng)立即停止侵權(quán)、賠禮道歉,五被告應(yīng)當(dāng)賠償原告經(jīng)濟(jì)損失、精神損失。
法院審理認(rèn)為,自然人聲音以聲紋、音色、頻率為區(qū)分,具有獨(dú)特性、唯一性、穩(wěn)定性特點(diǎn),能夠給他人形成或引起一般人產(chǎn)生與該自然人有關(guān)的思想或感情活動(dòng),可以對(duì)外展示個(gè)人行為和身份。自然人聲音的可識(shí)別性是指在他人反復(fù)多次或長(zhǎng)期聆聽的基礎(chǔ)上,通過該聲音特征能識(shí)別出特定自然人。利用人工智能合成的聲音,如果能使一般社會(huì)公眾或者相關(guān)領(lǐng)域的公眾根據(jù)其音色、語(yǔ)調(diào)和發(fā)音風(fēng)格,關(guān)聯(lián)到該自然人,即可以認(rèn)定為具有可識(shí)別性。
本案中,因被告三系僅使用原告?zhèn)€人聲音開發(fā)涉案文本轉(zhuǎn)語(yǔ)音產(chǎn)品,而且經(jīng)當(dāng)庭勘驗(yàn),該AI聲音與原告的音色、語(yǔ)調(diào)、發(fā)音風(fēng)格等具有高度一致性,能夠引起一般人產(chǎn)生與原告有關(guān)的思想或感情活動(dòng),能夠?qū)⒃撀曇袈?lián)系到原告本人,進(jìn)而識(shí)別出原告的主體身份。因此,原告聲音權(quán)益及于涉案AI聲音。最終,被告一北京某智能科技公司、被告三某軟件公司向原告賠禮道歉,被告二北京某文化傳媒公司、被告三某軟件公司向原告賠償損失共計(jì)25萬元。
近日,北京天達(dá)共和(武漢)律師事務(wù)所合伙人崔逢銘在接受《法人》記者采訪時(shí)表示,本案系全國(guó)首例“AI聲音侵權(quán)案”。根據(jù)《中華人民共和國(guó)民法典》(下稱“民法典”)第一千零二十三條第二款,對(duì)自然人聲音的保護(hù),參照適用肖像權(quán)保護(hù)的有關(guān)規(guī)定,即自然人的聲音權(quán)也是受法律保護(hù)的一項(xiàng)人格權(quán)。根據(jù)民法典第一千零一十八條第二款,肖像是通過影像、雕塑、繪畫等方式在一定載體上所反映的特定自然人可以被識(shí)別的外部形象,即肖像需要具有可識(shí)別性。由于聲音權(quán)的保護(hù)參照肖像權(quán)的規(guī)定,那么聲音作為人身專屬的權(quán)益,應(yīng)當(dāng)具有可識(shí)別性,即社會(huì)公眾可以根據(jù)該聲音識(shí)別出特定主體的身份。
“可識(shí)別性”是法律邊界
近日,上海華聯(lián)律師事務(wù)所律師藍(lán)花棉向記者分析,本案中,雖然AI生成的聲音與自然人聲音并不高度一致,但法院的判決關(guān)鍵在于聲音的“可識(shí)別性”。也就是說,AI生成的聲音具有可識(shí)別性,即使與自然人聲音不完全一致,也能關(guān)聯(lián)到特定的自然人,從而構(gòu)成侵權(quán)。
“可識(shí)別性的判斷標(biāo)準(zhǔn)包括AI聲音是否能使一般社會(huì)公眾或相關(guān)領(lǐng)域的公眾根據(jù)其音色、語(yǔ)調(diào)和發(fā)音風(fēng)格關(guān)聯(lián)到該自然人,引起一般人產(chǎn)生與該自然人有關(guān)的思想或感情活動(dòng),能夠?qū)⒃撀曇袈?lián)系到特定自然人。”藍(lán)花棉說。
崔逢銘也認(rèn)為,聲音的可識(shí)別性是聲音能夠成為一項(xiàng)人格權(quán)的前提條件。
近日,北京鼎世律師事務(wù)所律師龐理鵬在接受記者采訪時(shí)表示,主流觀點(diǎn)認(rèn)為,聲音權(quán)益是一種人格利益,包括聲音的可識(shí)別性和聲音的內(nèi)容。倘若一段聲音無法識(shí)別出特定主體的身份,那么其將難以受到法律保護(hù)。因此,身份可識(shí)別性也可以作為自然人聲音權(quán)益的法律邊界。
“然而,由于聲音是一種人格權(quán)益,人工智能并不具備所謂的‘人格’。因此,在當(dāng)前法律框架下,人工智能是否有聲音權(quán)益還處于爭(zhēng)議階段?!饼嬂睐i表示,需要明晰的是,如果人工智能合成后的聲音與自然人的聲音并不一致,即無法通過合成后的聲音識(shí)別到自然人,并不構(gòu)成侵權(quán)。
崔逢銘表示,判斷AI合成的聲音與自然人聲音是否一致,主要有兩種方式:一是普通聽眾測(cè)試,即以一般社會(huì)公眾或普通聽眾能否識(shí)別為標(biāo)準(zhǔn),判斷AI合成聲音是否具有可識(shí)別性;二是技術(shù)鑒定,即通過專業(yè)的聲紋識(shí)別技術(shù),分析音色、語(yǔ)調(diào)、頻率、發(fā)音風(fēng)格等特征。
“當(dāng)然,從訴訟維權(quán)的角度來看,可以先從普通聽眾的視角來進(jìn)行聲音辨識(shí)測(cè)試,進(jìn)而判斷AI合成的聲音與自然人聲音的一致性程度,如果不能準(zhǔn)確判斷,也可視情委托第三方機(jī)構(gòu)進(jìn)行鑒定。”崔逢銘分析。
著作權(quán)不等于聲音權(quán)
值得一提的是,本案被告二辯稱,其將有音頻著作權(quán)及鄰接權(quán)的錄音制品用于與被告三某軟件公司合作符合相關(guān)法律規(guī)定,各個(gè)環(huán)節(jié)都已簽署協(xié)議和支付費(fèi)用,不存在主觀故意的侵權(quán)行為。AI音頻產(chǎn)品適用的配音內(nèi)容和場(chǎng)景不同于單純的有聲讀物,而是一個(gè)綜合的音頻內(nèi)容,根據(jù)音頻內(nèi)容熱度等因素造成的傳播量非配音人一己之力可以達(dá)成。
法院審理認(rèn)為,被告二關(guān)于獲得原告合法授權(quán)的抗辯不能成立。被告二對(duì)錄音制品享有著作權(quán)等權(quán)利,但不包括授權(quán)他人對(duì)原告聲音進(jìn)行AI化使用的權(quán)利。被告二與被告三簽訂數(shù)據(jù)協(xié)議,在未經(jīng)原告本人知情同意的情況下,授權(quán)被告三AI化使用原告聲音的行為無合法權(quán)利來源。
“簡(jiǎn)單來講,原告的聲音權(quán)益與被告二北京某文化傳媒公司對(duì)錄音制品享有的權(quán)利是兩種完全不同的權(quán)利。原告的聲音權(quán)益按照民法典的規(guī)定是一種人格權(quán)。而被告二的權(quán)益是一種著作權(quán)鄰接權(quán)?!饼嬂睐i告訴記者。
所謂鄰接權(quán),是指作品的傳播者和作品之外勞動(dòng)成果的創(chuàng)作者對(duì)其勞動(dòng)成果享有的專有權(quán)利的總稱。龐理鵬表示,鄰接權(quán)產(chǎn)生的主要原因是由于一些非物質(zhì)勞動(dòng)成果雖然有其自身存在的價(jià)值,但由于其本身獨(dú)創(chuàng)性較低,不屬于《中華人民共和國(guó)著作權(quán)法》(下稱“著作權(quán)法”)保護(hù)的作品。但又需要對(duì)該部分“作品”所付出的勞動(dòng)的成果進(jìn)行有效保護(hù)。因此,在著作權(quán)法中新設(shè)一種與傳統(tǒng)著作權(quán)之外的新型權(quán)利類型,專門用于保護(hù)那些“獨(dú)創(chuàng)性”程度不高但又與作品有一定聯(lián)系的勞動(dòng)成果,即鄰接權(quán)。
龐理鵬認(rèn)為,被告二的錄音制品就屬于鄰接權(quán)。其專有名稱是錄音錄像制作者權(quán),是指錄音、錄像制品的制作者對(duì)其制作的錄音、錄像制品享有的專有權(quán)利。按著作權(quán)法第四十條及第四十五條,其權(quán)利內(nèi)容不包括自然人的聲音權(quán)。
隨意上傳AI作品面臨侵權(quán)
“這起全國(guó)首例AI生成聲音人格權(quán)侵權(quán)案體現(xiàn)了司法對(duì)新技術(shù)應(yīng)用的規(guī)范和引導(dǎo),兼顧保護(hù)人格權(quán)益與技術(shù)發(fā)展,具有里程碑意義?!贝薹赉懕硎?,我國(guó)民法典將人格權(quán)獨(dú)立成編,以立法形式將保護(hù)“聲音”寫入人格權(quán)編,明確參照適用肖像權(quán)的有關(guān)規(guī)定保護(hù)自然人的聲音。本案反映了人格權(quán)與AI技術(shù)之間的沖突,明確了自然人聲音權(quán)益的保護(hù)范圍涵蓋AI合成聲音,并通過專業(yè)技術(shù)手段鑒定AI合成聲音與自然人聲音的相似度。同時(shí),在法律適用上,明確了AI合成聲音的法律邊界和可識(shí)別性標(biāo)準(zhǔn),為后續(xù)類似案件提供了裁判標(biāo)準(zhǔn)。因此,為了避免人格權(quán)益與AI技術(shù)的沖突,建議相關(guān)使用主體在使用AI技術(shù)處理他人聲音前,注意取得相應(yīng)授權(quán),做到依法行事、合法使用。
對(duì)此,藍(lán)花棉提示,在簽訂涉及聲音使用的合同時(shí),雙方當(dāng)事人應(yīng)注意聲音權(quán)益的歸屬和授權(quán)以及使用范圍、期限和費(fèi)用、侵權(quán)救濟(jì)措施、特殊情況的處理、法律適用和爭(zhēng)議解決等多方面。
“提供換臉、變聲等軟件的企業(yè),勢(shì)必涉及營(yíng)利問題,故這類企業(yè)需要確保人物面部特征、聲音特征不會(huì)與某自然人高度相似,必要時(shí)需要向自然人索要授權(quán)?!饼嬂睐i提示,如果上傳AI生成視頻的自然人只是“自?shī)首詷贰?,而非以營(yíng)利為目的,基本上可以滿足著作權(quán)法中合理使用的要求。但如果這類自然人用戶以營(yíng)利為目的,則可能面臨侵權(quán)和賠償問題。同時(shí),自然人在發(fā)現(xiàn)自己的肖像、聲音、姓名等信息,未經(jīng)允許被商用后,可以先和商用企業(yè)溝通,要求對(duì)方刪除、下架、賠償?shù)?。也可以向第三方平臺(tái)說明情況,要求平臺(tái)下架該企業(yè)的侵權(quán)內(nèi)容。如果上述途徑均無法維權(quán),自然人可以向法院提起訴訟。
編審|王 婧
責(zé)編|王 茜
校對(duì)|張波 張雪慧