斯坦福回应抄袭清华系大模型
事件概述
在2024年5月29日,斯坦福大学的一支学生团队发布了一个名为Llama3-V的开源模型。他们宣称,这个模型的性能超越了当时备受瞩目的GPT-4V,而且其训练成本仅需要500美元。这一消息在全球科技界引起了广泛的关注和讨论。
不久之后,一些细心的网友发现这个Llama3-V模型与清华系面壁智能的MiniCPM-Llama3-V 2.5版本存在高度相似性。这种相似性不仅仅体现在模型架构上,甚至深入到代码和配置文件层面。更关键的证据是,清华团队未公开的“清华简”识别能力,在Llama3-V中得到了完全复现。这一发现无疑证实了抄袭的事实。
斯坦福团队的回应
在舆论的压力下,2024年6月3日,斯坦福的团队成员Siddharth Sharma和Aksh Garg在社交平台X上公开致歉,承认了抄袭的事实,并决定撤下模型。他们表示,这部分代码是由团队中的第三名成员Mustafa Aljadery编写的,但目前他处于“失联”状态,未能提供源代码进行验证。斯坦福AI实验室的主任Christopher Manning也严厉谴责了这一抄袭行为,并高度评价了清华模型的创新性。
清华系团队的回应
面壁智能的CEO李大海对于这一事件表示遗憾,并呼吁全球AI社区共建开放、信任的环境。联合创始人刘知远指出,这一事件从某种程度上反映了中国AI成果受到了国际社会的广泛关注,但他强调,这种关注应以正当的方式来认可和赞赏,而非通过不当的抄袭行为。
后续影响
随着这一事件的发酵,Llama3-V模型已被从各大平台如Hugging Face等下架,相关的宣传内容也被删除。这一事件在国际学术界引发了关于学术诚信的深入讨论,斯坦福大学的声誉也因此受到了一定的损害。从另一个角度看,这一事件也凸显了开源社区中知识产权保护的重要性,并标志着中国AI技术在国际舞台上的认可度正在不断提升。
这一事件不仅为学术界敲响了警钟,提醒我们在追求创新和发展的更要注重学术诚信和知识产权的保护;也为全球的AI社区提供了反思和讨论的机会,如何在开放合作的环境同推动AI技术的发展。