入库参考案例:殷某桢诉北京某智能科技公司等人格权纠纷案
32 人阅读 日期:2025-03-20 14:42:33 作者/来源:最高法
入库编号2025-07-2-474-001
关键词 民事 人格权 声音保护 声音权益 AI生成声音 可识别性 利益衡量
基本案情
原告殷某桢系配音演员,2023年5月,殷某桢发现他人利用其配音制作的作品在多个知名APP广泛流传。经声音筛选和溯源,发现上述作品中的声音来自于被告一北京某智能科技公司运营平台中的文本转语音产品。法院经审理查明,2019年,殷某桢曾接受被告二某(北京)文化传媒公司(以下简称某文化公司)的委托录制录音制品,被告二某文化公司为录音制品的著作权人。2019年5月10日,被告二某文化公司与被告三某软件(中国)有限公司(以下简称某软件公司)签订《数据授权使用协议》,约定被告二某文化公司将包括殷某桢案涉录音制品在内的录音数据提供给被告三某软件公司,被告二某文化公司向被告三某软件公司提供了非由殷某桢本人签字的《数据授权书》。被告三某软件公司仅以殷某桢录制的一部录音制品作为素材,采用人工智能等技术进行处理,生成了案涉文本转语音产品,并在被告四上海某网络科技公司运营的云服务平台对外出售。被告一北京某智能科技公司与被告五北京某科技发展公司签订在线服务买卖合同,由被告五北京某科技发展公司向被告三某软件公司下单采购,其中包括了案涉文本转语音产品。被告一北京某智能科技公司采取应用程序接口形式,在未经技术处理的情况下,直接调取并生成文本转语音产品在其平台中使用。平台显示案涉声音播放量为3256728530次。
殷某桢诉称,被诉行为已经严重侵犯其声音权益,请求法院判令被告一北京某智能科技公司、被告三某软件公司立即停止侵权、赔礼道歉,五被告应当赔偿殷某桢经济损失人民币500000元(币种下同)、精神损失100000元。一审审理过程中,被告一北京某智能科技公司、被告三某软件公司下架了案涉文本转语音产品。
一审庭审中,经当庭勘验,现场使用案涉文本转语音产品进行文本转语音的操作,获得的AI声音与殷某桢的音色、语调、发音风格等具有高度一致性。
北京互联网法院于2024年4月23日作出(2023)京0491民初12142号民事判决:一、被告北京某智能科技有限公司、被告某软件(中国)有限公司自本判决生效之日起七日内,向原告殷某桢书面赔礼道歉;二、被告某(北京)文化传媒有限公司、被告某软件(中国)有限公司连带赔偿原告殷某桢经济损失人民币250000元;三、驳回原告殷某桢其他诉讼请求。宣判后,双方当事人未提出上诉,判决已发生法律效力。
裁判理由
本案争议焦点主要有三:一是殷某桢声音权益的保护范围是否包括经人工智能处理的声音;二是案涉对殷某桢声音的使用是否取得合法授权;三是被诉行为是否构成侵权,以及如构成侵权,应承担何种法律责任。
其一,殷某桢声音权益保护范围涵括由人工智能合成的声音。《中华人民共和国民法典》第一千零二十三条第二款规定:“对自然人声音的保护,参照适用肖像权保护的有关规定。”据此,对于声音权益的保护,参照肖像权保护的有关规定,以具有可识别性作为法律保护的前提条件。自然人声音的可识别性是指在他人反复多次或长期聆听的基础上,通过该声音特征能识别出特定自然人。而经人工智能技术处理后的声音是否落入自然人声音权益的保护范围,关键在于通过该声音是否仍能识别出该特定自然人。利用人工智能合成的声音,如果能使一般社会公众或者相关领域的公众根据其音色、语调和发音风格,关联到该自然人,则可以认定为具有可识别性。本案中,因被告三某软件公司系仅使用殷某桢个人声音开发案涉文本转语音产品,而且经当庭勘验,该AI声音与殷某桢的音色、语调、发音风格等具有高度一致性,能够引起一般人产生与殷某桢有关的思想或感情活动,能够将该声音联系到殷某桢本人,进而识别出殷某桢的主体身份。因此,案涉AI声音属于殷某桢声音权益的保护范围。
其二,案涉对殷某桢声音的使用是否取得合法授权。被告二某文化公司对录音制品享有著作权等权利,但不包括授权他人对殷某桢声音进行AI化使用的权利。根据已查明事实,《数据授权书》并非殷某桢本人签署,因此,被告二与被告三某软件公司签订协议,在未经殷某桢本人知情同意的情况下,授权被告三某软件公司AI化使用原告声音的行为无合法权利来源。因此,被告二、被告三的被诉使用行为未获得殷某桢的合法授权。
其三,五被告的被诉行为构成对殷某桢声音权益的侵害,应当承担相应的法律责任。被告二某文化公司、被告三某软件公司未经殷某桢许可AI化并使用了案涉声音,构成对殷某桢声音权益的侵犯,其侵权行为造成了殷某桢声音权益受损的后果,依法承担赔偿损失的法律责任。被告一北京某智能科技公司、被告四上海某网络科技公司、被告五北京某科技发展公司主观上不存在过错,不承担损害赔偿责任。对于殷某桢请求被告一北京某智能科技公司、被告三某软件公司书面赔礼道歉依法予以支持。此外,殷某桢并未举证证明被诉侵权行为给其精神利益造成严重损害,因此,对其精神损害赔偿请求不予支持。
裁判要旨
对于人工智能技术处理后的声音,一般社会公众或者一定范围内的公众根据音色、语调和发音风格,能够识别出特定自然人的,则该声音属于自然人声音权益的保护范围。未经自然人许可使用经人工智能技术处理的声音,构成对自然人声音权益的侵权。
关联索引
《中华人民共和国民法典》第995条、第1000条、第1019条、第1023条
一审:北京互联网法院(2023)京0491民初12142号民事判决书(2024年4月23日)
入库参考案例解读:AI“偷”走你的声音怎么办?
AI“偷”走你的声音怎么办?
——《殷某桢诉北京某智能科技公司等人格权纠纷案(入库编号:2025-07-2-474-001)》解读
当前,人工智能技术快速发展,对经济社会发展和人类文明进步产生深远影响,也带来难以预知的各种风险和复杂挑战。在日常生活中,利用人工智能技术处理自然人的声音并进行商业化应用的情形较为常见,公众通常难以区分哪些是“合成”的声音,哪些是自然人的声音。一些企业滥用人工智能技术,未经授权随意“合成”足以以假乱真的声音用于经营性活动,引发公众对发展人工智能技术的担忧,应当依法予以规制。然而,对于“合成”声音是否侵犯自然人合法权益、侵犯何种权益,法律上并无明确规定,实践中亦存在一定认识分歧,亟待通过确立裁判规则予以回应。对此,人民法院案例库入库参考案例《殷某桢诉北京某智能科技公司等人格权纠纷案(入库编号:2025-07-2-474-001)》明确了经人工智能技术处理的声音受声音权益保护的认定标准,即“对于人工智能技术处理后的声音,一般社会公众或者一定范围内的公众根据音色、语调和发音风格,能够识别出特定自然人的,则该声音属于自然人声音权益的保护范围。未经自然人许可使用经人工智能技术处理的声音,构成对自然人声音权益的侵权”,为类案裁判提供借鉴和参考。现就有关问题解读如下:
一、经人工智能技术处理的声音属于自然人声音权益保护范围的认定
声音与肖像、姓名一样,都是民事主体的外在表征。民法典第一千零二十三条规定“对自然人声音的保护,参照适用肖像权保护的有关规定”,明确将自然人声音权益作为人格权予以保护。据此,民法典关于肖像的认定、肖像权的权能及合理使用等规定,适用于对自然人声音权益的保护。根据民法典第一千零一十八条第二款关于肖像的定义,肖像具有可以识别特定自然人的属性。因而,自然人声音受到人格权保护的前提,也应当是具有识别特定自然人的属性。实践中有争议的问题在于,经人工智能技术处理后的声音是否落入自然人声音权益的保护范围。对此,应当从自然人声音权益的认定标准出发,能识别出该特定自然人的,可以认定为属于该自然人声音权益的保护范围,反之则不能受自然人声音权益的保护。
关于声音的可识别性认定标准,可以从处理方式角度,结合主客观因素综合考量。根据声音的处理方式具体分为两类:一类是直接使用自然人声音,如通过音频、视频等形式对自然人声音录制、公开、模仿、拼接、篡改等;另一类是利用人工智能技术合成新的声音。本案例即为第二类合成声音的情形。声音领域的人工智能技术通常是指文本转语音,即利用深度学习技术对自然人声音数据进行学习,通过文本转语音操作。
经人工智能技术合成后的声音是否具备可识别性,关键在于能否识别出自然人主体身份。对此,不能仅依靠声纹辨认、声纹确认的客观标准,还需结合使用方式,将新的声音的音色、语音语调、发音风格等与自然人声音作对比,同时根据自然人的社会知名度,采取一般社会公众、一定范围内公众的主观标准进行综合判断。例如,对于知名人物,由于其声音音色、语音语调、发音风格等独特性,通常为一般社会大众所熟知,此时以一般社会公众能否识别作为判断标准进行判定;而对于配音演员等从事与声音密切的行业的人员,应以在一定范围内(如配音领域内)公众能否识别作为判断标准。
本案例中,殷某桢是配音演员,经当庭勘验,某软件公司利用人工智能技术处理后形成的声音与殷某桢的音色、语调、发音风格等具有高度一致性,能够引起一般人产生与殷某桢有关的思想或感情活动,能够将该声音联系到殷某桢本人,进而识别出殷某桢的主体身份。因此,案涉经人工智能技术合成的声音属于殷某桢声音权益的保护范围。
二、人工智能技术处理声音构成侵权的认定
民法典第九百九十五条规定:“人格权受到侵害的,受害人有权依照本法和其他法律的规定请求行为人承担民事责任。受害人的停止侵害、排除妨碍、消除危险、消除影响、恢复名誉、赔礼道歉请求权,不适用诉讼时效的规定。”该条规定为自然人的人格权益受到侵害时的救济提供法律依据,从而实现保护人格尊严的目的。本案例系人格权侵权案件,按照民法典关于侵权责任的有关规定,认定被告的行为是否构成对殷某桢声音权益的侵害,应从侵害行为、侵害后果、因果关系、主观过错等方面综合考量。关于侵害行为方面,本案例中被诉侵权行为有二:一是未经自然人许可使用其声音用于训练素材,二是未经许可使用经人工智能技术生成的声音。具体而言:
第一个侵权行为涉及人工智能训练素材的“投喂”过程。通常而言,训练方将自然人的声音片段进行“投喂”,“投喂”的素材越多,生成的声音准确度、还原度就越高。在“投喂”声音的过程中,还可以进行微调训练,让人工智能自主学习“投喂”的声音数据的音色、音调等信息,而随着训练次数的增加,生成的声音就与该自然人的声音越相似。由于“投喂”训练素材需要使用自然人原本的声音,若未经自然人许可就直接使用,则构成对自然人声音权益的侵害。根据查明事实,殷某桢为某文化公司录制录音制品,某文化公司依照约定对录音制品享有著作权等权利,但不享有授权他人处理并使用殷某桢声音的权利。某文化公司将并非殷某桢本人签署的《数据授权书》提供给某软件公司,允许某软件公司以商业或非商业的用途使用、复制、修改数据用于其产品及服务。某软件公司仅以殷某桢录制的一部录音制品作为素材进行人工智能处理,生成了案涉声音,而殷某桢本人也未直接参与两家公司的合作协商,且殷某桢并未授权某文化公司对外许可对其声音进行人工智能处理。因此,某软件公司是在未经殷某桢本人知情同意的情况下,利用人工智能处理并使用殷某桢声音,该行为无合法权利来源,构成对殷某桢声音权益的侵犯。
第二个侵权行为是某软件公司在经营活动中使用了经人工智能技术生成的声音。生成后的声音是对殷某桢原始声音的模仿,容易让公众误认为是殷某桢本人的声音,可能会造成其人格尊严的贬损,而某软件公司将未经授权处理生成的声音制作成文本转语音产品,授权他人在网络平台上销售,而北京某智能科技公司购买该文本转语音产品后,直接在其平台中使用,导致案涉声音在网络上被广泛传播,上述行为侵犯了殷某桢的声音权益。
此外,关于侵害后果方面,声音权益属于法定的人格权益,适用人格权请求权有关规定。行使人格权请求权不以造成损害后果为要件,对于可能发生的妨害或者已经存在的妨害,权利人可以通过停止妨害请求权寻求救济。行使侵权请求权则需要以存在一定损害作为前提,以对权利人的损害进行补偿救济。同时,人工智能技术处理声音的侵害行为与侵害后果发生之间应当存在因果关系,被告据此承担相应的责任。本案例中,某文化公司与某软件公司的案涉侵权行为造成了殷某桢声音权益受损的后果,应当承担赔偿损失的法律责任。其他被告对此不存在过错,不承担损害赔偿责任,但应当承担相应赔礼道歉责任。
有必要提及的是,人工智能训练素材的合法性问题较为复杂,世界范围内尚无成熟解决方案。对此,本案例明确了使用自然人声音作为训练素材的,使用人应当有较高的注意义务,未取得自然人授权且不属于合理使用的,构成人格权的侵权。同时也应看到,人工智能技术的快速发展,给人格权保护带来前所未有的挑战。在此背景下,如何发挥司法职能作用,推动在法治轨道上加强和完善人工智能治理,不断提升人工智能技术的安全性、可靠性、可控性、公平性,是人民法院工作面临的时代课题,需要在实践中不断探索,并形成有益的裁判规则。
<<上一篇文章:房屋租赁合同部分法律问题解析
>>下一篇文章: