中国人工智能AI新创公司发布的DeepSeek平台一度引起全球喧然大波
身为ChatGPT研发商的OpenAI今天对外宣布
该公司已掌握相关证据,能证明DeepSeek存在侵权行为,指责对方在训练与开发自己的模型时,使用OpenAI的专属技术进行蒸馏萃取,成为自己平台的重要基础养分
金融时报引述OpenAI的说法,这个开发商质疑、DeepSeek极有可能利用所谓蒸馏技术,透过从更强大且成形的AI模型,获得输出数据与数据,借此就能在花费较低成本的状态下,也能训练出具有类似性能的模型
虽然该公司并未透露更多细节,但是在ChatGPT服务条款上,明确禁止用户复制其服务,或是利用询问AI得到的结果,进行衍生性开发,制作出一款与OpenAI竞争的模型或平台,一旦被发现、这就属于严重侵权
重罪犯川普新任命的AI及加密货币政策负责人萨克斯明确表示怀疑,认为DeepSeek背后团队,很可能涉及窃取智慧财产权
萨克斯表示,在AI领域、有一种技术叫蒸馏,从一组已经成熟的模型中进行学习,再把得出的结果与知识吸收,重新组成自己的模块
萨克斯声称,有大量证据显示DeepSeek 正是通过蒸馏OpenAI模型的知识,认为OpenAI对此并不会开心
但即便明确表达质疑,可萨克斯在整个访问过程,都未提供具体证据
毕竟在DeepSeek上线后,许多专家在测试中发现,这个新平台回应方式,与GPT-4高度相似,非常有可能是透过蒸馏取得基础
彭博一则报道中则提到,有匿名知情人士声称,微软与 OpenAI 去年秋天曾启动内部调查,发现一批疑似属于DeepSeek的帐号,专门利用ChatGPT的API进行蒸馏取得资料,随后官方一次封禁这些被怀疑的帐号,但两家企业都并未对此做出回应
其实在人工智能领域,使用蒸馏技术相当常见,OpenAI其实就有为开发者提供官方渠道,提供他们进行蒸馏,借此取得更好、更快的答案,但关键问题在,当你是为了开发自家模型,私自未授权的状态下进行蒸馏,这就涉及违规
但即便存在违规风险,可无论是在中国或美国,许多AI实验室或企业,都会利用既有的顶尖AI模型,进行询问并取得输出模块,借此来训练自家的模型,这种做法相当常见
新创公司和学术界,经常利用经过人类调整的大型语言模型,像是ChatGPT来协助训练自己的模型,这样就能免费获得这些大平台砸下重金后调整的成果
如果 DeepSeek真的是使用这种方法,要想确实阻止此类行为,实际操作上会非常困难
对于这种情况,OpenAI早就注意到,他们在声明中指出,越来越多中国企业和其他竞争对手,一直在尝试利用蒸馏手段,窃取AI模型的数据与数据,他们已采取应对措施,保护自家的智慧产权,甚至还想借此机会,将AI模型上升到国家安全高度,呼吁要扩大与川普2.0政府的合作,保护最先进的 AI 模型,防止竞争对手和他国获取美国技术
不过,当OpenAI考虑提告DeepSeek侵权之际,别忘了身为AI平台研发商的它,目前自身也面临多起版权侵权诉讼,包括纽约时报和多位知名作家,先后控告OpenAI在未经授权的情况下,使用其新闻报道与著作内容来训练AI模型。