今天,文艺作品可以使用人工智能辅助、人工智能生成、人工智能鉴定,保护原创者的权益成为迫在眉睫的议题。从表面上看,人工智能时代的抄袭主体既可以是人,也可以是人工智能,但实际上人工智能的 " 作案工具 " 定位愈发突出。无论人工智能生成场景下由人输入提示词再由人工智能生成内容,抑或是人利用人工智能辅助创作作品,均存在抄袭容易而判定难的困境。那么,法律界是如何界定人工智能抄袭侵权的呢?
必须承认的是,法律具有滞后性。目前法律界定人工智能抄袭的行为与判定人类抄袭行为并无太大区别。原则上,法律定性人工智能抄袭主要分为两个阶段:一是输入端,即使用他人作品训练人工智能;二是输出端,即利用人工智能生成新内容。在输出阶段,人工智能输出的新内容可能与他人在先的版权作品构成相同或相似。
输入端的争议多聚焦于是否 " 合理使用 "。" 合理使用 " 指在特定情况下,人们可以不经过著作权人的同意使用其作品,比如为个人学习、研究或者欣赏,使用他人已经发表的作品等,但需要指明作者姓名或者名称、作品名称,并且不得影响原有作品的正常使用,也不得损害著作权人的合法权益。因此,在法律上," 合理使用 " 是对于著作权人的权利限制,也往往是对版权侵权的抗辩理由。比如若是为了个人欣赏使用动画人物海绵宝宝的图片就构成 " 合理使用 ";如果一家文创企业使用海绵宝宝的图片生成产品模型,那就有可能不构成 " 合理使用 "。
当然,现行《著作权法》只列明在十三种情形下才可能构成 " 合理使用 ",条件极度严苛。譬如,表演他人已经发表的作品,如果向公众收取费用,则不构成 " 合理使用 ";再如对设置或者陈列在公共场所的艺术作品制作立体的文创产品,也不构成 " 合理使用 "。
在人工智能生成场景下,当人工智能平台爬取他人作品进行训练时,它可能会侵犯著作权人的 " 复制权 "。通常,著作权人享有对作品的复制权、信息网络传播权等财产权利。但若认为人工智能生成内容平台爬取他人作品并训练的行为构成 " 合理使用 ",就无需承担侵权责任。目前,我国主流观点认为,在输入阶段,即人工智能平台使用作品用于训练,只要不以使用作品的独创性表达为目的,不影响该作品的正常使用,并未损害著作权人的合法利益,则可属于合理使用。
在输出阶段,判定抄袭的核心原则是 " 实质性相似 "。实质性相似是判断是否存在抄袭的最重要的标准。我国《著作权法》虽然对实质性相似的标准没有明确规定,但在长期的司法实践中已主要形成两类评判标准:一是整体比对法,即不区分思想与表达,以一般理性第三人的视角判断作品在整体上的主要特征、核心内容等方面是否构成实质性相似。在比较时无需拆解作品元素,而是将双方作品并列、整体分析,比较两者的相似度。该种比对方法常见于对美术作品、摄影作品等作品类型。二是抽象过滤比较法,即将原作与涉嫌抄袭的作品中的故事情节、人物设定等要素抽象出来,在过滤掉其中具有公共性、不受保护的内容后,再对剩下的部分进行对比和鉴定。
在网络创作小说等文字作品、电影等视听作品则多适用上述第二类评判标准。譬如,在琼瑶小说《梅花烙》诉电视剧《宫锁连城》案中,法院对原告抽象出来构成相似的故事情节,在过滤掉不受《著作权法》保护的思想范畴,如偷龙转凤这一母题级别的思想,或如纳妾时福晋询问弃女过往、誓要保护女儿等常见情节后,再进一步判断两部作品在整体结构、具体情节、人物关系以及场景等方面的独创性表达是否构成实质性相似。如法院认为小说中," 福晋连生三女无子,王爷纳侧福晋地位受到威胁后,计划偷龙转凤,生产当日又产一女,计划实施,弃女肩头带有印记,成为日后相认的凭据 " 情节设计实现了男、女主人公身份的调换,为男、女主人公长大后的相识进行了铺垫,同时该情节也是整个故事情节发展脉络的起因,该情节被用在了剧集中,这就构成了实质性相似。
然而,随着互联网迅速发展,网络创作的抄袭愈发具有便利性和隐蔽性,上述两类评判标准有时可能 " 失灵 "。譬如北京市朝阳区人民法院审理小说《庶女有毒》 ( 后改名为《锦绣未央》 ) 抄袭案时,发现被告分散抄袭了 12 位知名作家的 16 部小说具有独创性的背景设置、出场安排、矛盾冲突和具体情节设计,共存在 763 处语句、21 处情节相同或实质性近似,共计 114 千字。显然,因为涉及多个作者的多部作品,无论适用 " 整体比对法 " 还是 " 抽象过滤比较法 ",都无法判定抄袭。但最后法院的判定是,小说《锦绣未央》和 16 部权利作品构成实质性相似,侵害了温瑞安等 12 位作者对相应作品享有的署名权、复制权、发行权和信息网络传播权,并据此判令被告停止侵权、公开赔礼道歉并赔偿经济损失共计 74 万余元。而一个类似的案件是哈利 · 波特案,一位 " 哈迷 " 为《哈利 · 波特》的魔法世界制作了一部百科全书。原告 J.K. 罗琳指控被告所写的百科全书均摘抄散落于七部哈利 · 波特小说的零星原文,虽然原被告的文字作品性质完全不同,原告所作为冒险小说,被告所作为百科全书,但法院依旧以 " 碎片化字面侵权 " 理论为基础认定这构成了实质性相似。
目前就输出端而言,全球范围内关于人工智能生成新内容构成版权侵权的案件,其侵权与否的判断标准仍然是实质性相似。在此类人工智能生成新内容抄袭案件中,被告以生成式人工智能大模型服务平台方为主。如 2023 年底,《纽约时报》诉 OpenAI 与微软案中,原告主张 ChatGPT 会直接输出和自身文章高度相似的内容,包括逐字逐句的复制。再如 2024 年 2 月,在广州互联网法院判决的国内 " 大模型服务商版权侵权责任第一案 " ( 又称 " 奥特曼第一案 " ) 中,原告通过在被告公司经营的人工智能平台上,输入 " 奥特曼 " 即可生成并输出内容,且该输出内容部分或完全复制了奥特曼 IP 作品这一美术形象的独创性表达,并在多个关键特征与作品具有极高的相似度,构成了实质性相似,侵犯了原告的复制权与改编权。该案是全球范围内首例生成式人工智能服务平台侵犯他人美术作品著作权的生效判决。虽然该案未涉及文字作品,但对确立人工智能时代借用和抄袭的法律界限具有重要启示,那就是在判定 AI 生成内容是否存在版权侵权时,仍需坚持 " 实质性相似 " 标准。
事实上,原创者感兴趣的话题是人工智能生成或辅助生成的内容是否侵犯了他们的权益,然而对于那些利用人工智能生成或辅助生成内容的使用者而言,他们更关心人工智能生成或辅助生成的内容是否可以认定为原创或具有独创性,从而让他们成为天然的原创者。对此,我国法院判定仍有分歧。
例如,北京互联网法院在全国首例 " 人工智能文生图 " 著作权案中认为,原告使用人工智能软件制作图片并取名 " 春风送来了温柔 ",虽为人工智能生成内容,但其基于原告的智力投入直接产生,用户调整参数生成人工智能图片体现了原告作为人类的 " 独创性 " 表达,因此原告对涉案图片享有著作权,可以成为天然的原创者。被告未经许可,并且在使用时抹去水印,侵害了原告的信息网络传播权和署名权。而江苏省张家港市人民法院和江苏省苏州市中级人民法院在针对一起人工智能文生图著作权纠纷中,认为原告通过人工智能工具创作的 " 幻之翼透明艺术椅 " 系列美术作品,只是其作为使用者首次输入提示词而生成的体现提示词主题和要素的图形,不能确证使用者对图形具备充分的独创性,该图形不构成著作权意义上的作品。
当然,上述案件均是使用人工智能工具输入文字提示词生成图片 ( 文生图 ) ,但也可以给使用人工智能工具生成文字内容 ( 文生文 ) 启示。就目前的法院观点来看,若用户首次输入提示词生成内容,则一般认为不具有独创性;而若用户对于人物及其呈现方式等元素有针对性地设计提示词,设置参数,则体现了用户的 " 选择和安排 ",若继续增加提示词、不断调整参数也体现了用户的个性判断。这本质上认可的是,只要人工智能生成内容是人类利用人工智能工具进行创作,且对创作具有控制能力的情况下,可享有版权,版权归属于人工智能使用者,人工智能只是工具。
人工智能时代,互联网文娱产业中的抄袭在未来将会进一步呈现复杂性、隐匿性、成本低的趋势。无论人工智能生成场景抑或是人利用人工智能辅助创作作品,我国法律现在倾向于对输入端较为宽松,积极探索以 " 合理使用 " 为核心的生成式人工智能输入著作权作品作为数据训练的合法性路径,但对输出端具有明显 " 实质性相似 " 的抄袭作品给予打击。这恰恰是在底线上,向社会明确传递了尊重鼓励原创、抵制抄袭的信号,代表了法律努力保护原创的决心。不过,困难和挑战依然存在,比如有人用大模型检查朱自清《背影》的人工智能率,得到了 100% 人工智能生成的荒谬结果。因此,在人工智能时代保护原创,将会变成一个更复杂、更艰巨的任务。