6月4日,网络上一则关于斯坦福大学AI研究团队的Llama3-V开源模型涉嫌抄袭的消息引发了广泛关注。据悉,该模型被指控抄袭了清华系明星创业公司面壁智能开发的开源模型“小钢炮”MiniCPM-Llama3-V 2.5。这一事件在科技界和开源社区中引发了热烈讨论,不仅关乎知识产权的尊重,也触及了学术道德和科研诚信的底线。
5 月 29 日一个斯坦福 AI 团队在网上宣称只需 500 美元就可训练出一个超越 GPT-4V 的 SOTA 多模态大模型,但很快网友就发现该项目使用的模型结构和代码与“小钢炮”高度相似,仅有部分变量名被更改。
面壁智能团队在 6 月 2 日深夜确认,斯坦福的模型不仅能识别出“清华简”中的战国古文字,而且连错误的识别结果都与 MiniCPM 模型完全一致。这些古文字数据是面壁智能团队花费数月时间从清华简上逐字扫描并人工标注的,且从未公开过,从而证实了抄袭的事实。
北京时间今早 1 点 27 分,斯坦福 Llama3-V 团队的两位作者 Siddharth Sharma 和 Aksh Garg 在社交平台 X 上对面壁 MiniCPM 团队就这一学术不端行为进行了正式道歉,并承诺将撤下所有 Llama3-V 模型,此前几小时,他们曾发布过一封类似内容的道歉信,但很快被删除。