新加坡联合早报昨晚(2月9日晚)报道,中国科技巨头字节跳动的Seedance2.0人工智能(AI)视频生成模型爆红,有网红博主担忧“被训练”,让AI领域备受质疑的语料版权问题再次引发关注。其实不用多说,只要关注AI行业的人都知道,这已经不是第一次因为AI模型爆红而扯出版权争议了,只不过这一次,主角换成了字节跳动的Seedance2.0,争议的背后,还藏着一些让人不舒服的选择性叙事。 先说说Seedance2.0到底为啥能爆红,它可不是简单的“换皮升级”,而是字节跳动实打实的技术突破。这款最新的AI视频生成模型,能轻松实现文生视频和图生视频,输入一段文字描述,或者一张静态图片,它就能生成1080p电影级别的高清视频,甚至还能做到多镜头叙事,让不同镜头之间的角色、环境保持一致,不用后期再费心剪辑衔接。 更厉害的是,它能同步生成适配视频的音频,不管是环境音效还是人物对话,口型都能精准对齐,比很多同类模型省了太多事,也正因为这样,不管是网红博主、内容创作者,还是企业做营销视频,都对它格外关注。 网红博主的担忧也不是空穴来风,毕竟现在AI模型训练,都离不开海量的数据支撑,而这些数据里,就包含了无数创作者的原创内容,不管是文字、图片还是视频片段,都有可能被抓取用于模型训练。 有博主就坦言,自己花好几天拍的视频、琢磨的文案,说不定不知不觉就成了AI训练的“养料”,以后AI随便就能生成和自己风格相似的内容,自己的原创价值就被稀释了。 这种担忧,其实和之前ChatGPT、Meta的Llama等模型爆红时,作家、画家们的焦虑一模一样,只不过这一次,因为Seedance2.0的视频生成能力太突出,担忧被放大了而已。 可能很多人不知道,AI版权争议从来都不是中国独有的问题,而是全球AI行业共同的困境,就连经济合作与发展组织(OECD)都专门发布过报告,探讨AI数据抓取带来的知识产权争议。 报告里提到,现在大概70%的AI训练数据集,都没有清晰的来源许可,有的数据集中甚至包含了盗版书籍、未经授权的音乐作品,比如之前Meta的Llama模型,就被指使用了包含17万本未经授权书籍的数据集训练。 而且各国的版权法律,对于AI训练数据的“合理使用”界定都不一样,欧盟有专门的版权指令,美国靠司法案例逐案判断,新加坡也修订了版权法适配AI发展,这种规则的碎片化,让很多跨国企业都头疼不已,更别说解决根本的版权争议了。 有意思的是,同样是AI技术突破,同样面临版权争议,西方同类模型和中国的Seedance2.0,却受到了部分媒体截然不同的对待。 就拿之前德国法院宣判的GEMA诉OpenAI案来说,OpenAI因为未经许可使用音乐歌词训练模型,被认定构成侵权,但当时很多西方媒体报道时,重点还是放在“AI技术推动人类进步”上,强调版权争议是“技术发展的必经之路”,很少用“备受质疑”这样的字眼去定性。 可轮到Seedance2.0爆红,部分媒体就立刻把焦点放在了“版权质疑”上,刻意放大博主的担忧,却对它的技术突破一笔带过,更不提这种争议是全球行业的共性问题,仿佛只有中国的AI才“不守规矩”。 这种双标其实不难发现,西方AI企业的技术突破,就是“文明之光”“造福人类”,哪怕面临版权诉讼,也被解读为“技术创新必然要付出的代价”; 而中国AI企业实现追赶,做出了不输西方的技术成果,就立刻被贴上“备受质疑”“存在争议”的标签,只盯着问题不放,却对全球行业都解决不了的困境视而不见。 其实Seedance2.0引发版权讨论,本身是很正常的事,毕竟技术在发展,旧的版权框架确实跟不上AI的迭代速度,讨论才能推动规则完善,但这种选择性叙事,既不客观,也不公平,反而会阻碍技术的正常发展。 说到底,每一代生成式AI模型爆红,版权争议都会被重新摆上台面,本质上就是因为,当创作从人类的独立原创,变成AI的数据分布和模型生成,原来的版权规则已经难以适配新的技术场景了。 这不是某一家企业、某一个国家的问题,需要全球各国、企业、创作者一起协商,找到保护原创和推动技术发展的平衡点。而那些带着偏见的双标叙事,除了制造对立,没有任何意义。 现在Seedance2.0的爆红,只是再次把这个老问题摆到了大家面前,它的技术突破值得被看见,版权争议也需要被理性讨论。 不知道大家怎么看这件事?你觉得网红博主的担忧有必要吗?面对AI版权争议,该怎么平衡创作者权益和技术发展?又该如何看待部分媒体的双标叙事?不妨留下你的观点,一起讨论讨论。
