人工智能生成内容版权保护的司法探索

  11月27日,北京互联网法院对李某诉刘某侵害作品署名权和信息网络传播权纠纷案(以下简称AIGC著作权案)作出一审判决。该案被称为我国首例涉及“AI文生图”著作权的案件,判决书公开后引发学术界、实务界热议。

  2023年2月,原告李某用绘图大模型Stable Diffusion生成一张古装少女图片,并将该图以《春风送来了温柔》为名在小红书等平台发布。不久后,原告发现百度百家号“我是云开日出”在其2023年3月2日发布的文章《三月的爱情,在桃花里》中使用了自己先前生成的图片作为插图,并去除了该图片原有的水印。随后,原告以侵害作品署名权和信息网络传播权为由将作者刘某起诉到北京互联网法院,要求被告赔偿其经济损失5000元,并赔礼道歉。

  经过审理,北京互联网法院依据作品构成的“四要件说”(是否属于文学、艺术和科学领域内,是否具有独创性,是否具有一定的表现形式和是否属于智力成果)分析认为,除Stable Diffusion模型外,原告在生成图片过程中使用第三人提供的AI绘画指导、绘画模型参数和提示词,虽然模型的设计者设计了算法和模型,并用大量的数据对其进行训练,但他们既没有创作涉案图片的意愿,也没有预先设定后续生成的内容,因而并没有参与到涉案图片的生产过程中,所以他们并不能成为涉案图片的作者。此外,在Stable Diffusion提供的使用许可证中已经说明“不主张对输出内容的权利”,因而即使他们是图片的作者,也已经自行放弃了著作权。原告李某根据需要对AI模型进行相关设置,并最终选定了图片,可以认为涉案图片是基于原告的智力投入直接产生的,并体现了原告的个性化表达,最终认定案涉图片构成美术作品。在参考AI绘画的市场价值后,要求被告酌定赔偿原告500元。


  利用人工智能模型生成内容的属性

  利用人工智能模型生成内容是否构成作品是该案的核心争议焦点,也是最具探讨价值的著作权理论问题。专业绘画类生成式人工智能并不需要模型使用者懂得绘画技能或编程技巧,只需要输入相应提示词(关键词)来描述画作想要表达的内容,并在模型提供的选项中选择相应的参数或类型,AI绘画模型就能快速生成用户想要的图片。模型用户的创作性贡献是对图片美学表达的创作还是提示词的创作?这值得探讨。比如上述案例中,原告使用的反向提示词中只有少量是自行编辑,其余大量复制词来源于某论坛的用户分享,这种借鉴(复制)提示词的行为当如何认定?图片生成后的微调阶段,作者修改迭代步数、提示词引导系数、随机数种子等,这些参数修改对美术作品的创作而言,又意味着什么?笔者并不否认整个生成过程原告进行了一定的智力投入,但这些智力投入仅体现为设定相关参数、根据初步生成的图片增加提示词并调整参数,并最终选择一幅自己满意的图片。输入不同参数,会生成内容不同,这能否体现原告的个性化表达,从而具有独创性,笔者认为值得商榷。就作品而言,人类作者创作时,“如有雷同纯属巧合”发生的概率并不高,但实践中可以发现,两个生成式AI用户构想出相同或近似提示词的概率却较高。笔者认为,在作品构成要件上强调独创性时,指作者自己的独立创造,没有搭别人的便车,更重要的是作者对现有表达有新的贡献,而不是将公有领域的表达据为己有。真实的独创性必然具有鲜明的人格特征,作者可以在创作作品上留下带有个人风格的“烙印”或“盖章”。然而,只要输入相同的提示词生成式人工智能就会输出相同内容,这无法体现不同创作者的人格特性。


  实践中对人工智能生成内容的处理

  该案判决与2019年4月北京互联网法院作出的北京菲林律师事务所诉百度公司侵害署名权、保护作品完整权、信息网络传播权纠纷一案(以下简称菲林诉百度案)的说理逻辑存在差异。在菲林诉百度案中,法院认为,具备独创性并非构成文字作品的充分条件,根据现行法律规定,文字作品应由自然人创作完成;无论计算机软件智能生成的此类“作品”在内容、形态,甚至表达方式上日趋接近自然人,但根据现实科技及产业发展水平,若在现行法律权利保护体系内可以对此类软件的智力、经济投入予以充分保护,则不宜对民法主体的基本规范予以突破。虽然案涉分析报告形成过程中确有自然人的参与,但在软件设计环节和软件使用环节的人为介入是不同的。在软件设计环节的人为创造已经通过软件著作权等权利形式得到保护。而软件使用环节人为参与,不足以否认文字报告系第三方法律信息库利用输入的关键词与算法、规则和模板结合形成的,因此,某种意义上可认定第三方“创作”了该分析报告。然而,法院也认为虽然分析报告不构成作品,但并不意味着其进入公有领域,可以被公众自由使用;对软件使用者而言,其通过付费使用进行投入,基于自身需求设置关键词并生成分析报告,其具有进一步使用、传播分析报告的动力和预期。因此,应当激励软件使用者的使用和传播行为,将分析报告的相关权益赋予其享有。

  此外,AIGC著作权案与广东省深圳市南山区人民法院于2019年12月作出的深圳市腾讯计算机系统有限公司诉上海盈讯科技有限公司侵害著作权及不正当竞争纠纷一案(以下简称“腾讯诉盈讯案”)的说理逻辑一致。在腾讯诉盈讯案中,法院认为,涉案文章是否构成文字作品的关键在于判断涉案文章是否具有独创性。一方面,涉案文章由原告主创团队人员运用Dreamwriter软件生成,其表现的内容体现出对当日上午相关股市信息、数据的选择、分析、判断,文章结构合理,表达逻辑清晰,具有一定的独创性;另一方面,涉案文章的生成过程经历的数据服务、触发和写作、智能校验和智能分发四个环节均由原告主创团队相关人员选择与安排。因此,法院从涉案文章的外在表现形式与生成过程两个维度肯定了案涉文章的特定表现形式是源于创作者个性化的选择与安排,因此,即使由软件在技术上“生成”的创作过程,也可满足著作权法对文字作品的保护条件。

  从2019年的菲林诉百度案、腾讯诉盈讯案,到2023年AIGC著作权案,虽然2020年著作权法经过一次修正,但修正内容并不直接涉及人工智能生成内容的著作权争议。在行业监管方面,2023年8月15日施行的《生成式人工智能服务管理暂行办法》强调,生成式人工智能服务提供者应当依法开展预训练、优化训练等训练数据处理活动,不得侵害他人依法享有的知识产权;提供和使用生成式人工智能服务应当尊重知识产权。这项针对生成式人工智能开展包容审慎和分类分级监管的制度没有明确规定人工智能生成内容的著作权保护问题。

  在产业方面,我国已经有百度(文心一言)、抖音(云雀大模型)、智谱AI(GLM 大模型)、网易有道(子曰大模型)、蚂蚁集团(百灵大模型)等AI大模型产品。然而,对大模型研发者(所有者)来说,其利益可通过收取模型或软件使用费用或嵌入广告等方式获得,其开发投入能够得到相应回报,且生成内容系模型使用者根据不同的使用需求、检索设置而产生,模型研发者(所有者)对其生成内容缺乏传播动力。因此,如果将生成内容的相关权益赋予模型研发者(所有者)享有,模型研发者(所有者)并不会积极应用,反而会造成使用者积极性不足,不利于文化传播和科学事业发展。因此,模型研发者并没有对生成内容主张权利或著作权的天然动机。相反,由于模型需要大量素材和内容开展模型训练,如果其他模型的生成内容都被用著作权进行封装,则不利于获取海量的不受著作权保护的材料进行模型训练。可见,生成式人工智能目前不会对版权系统造成重大冲击,版权法也不是解决生成式人工智能所带来的更广泛社会问题的精妙工具。

  (作者单位:上海政法学院)