← Back to document
科工力量:斯坦福AI团队抄袭中国大模型?背后还有更值得关注的信息
Open original site →
Extracted Text
【文/观察者网专栏作者 科工力量】
斯坦福团队抄袭中国开源大模型,事件曝光后连夜删库跑路。
对这条新闻,恐怕不少人第一反应和科工力量一样,有种一吐胸中郁闷的感受。此前很长一段时间,从美国朝野锁死中国AI研究能力的叫嚣,到中文网络上对国产大模型怪话连篇的调侃,让很多人对中国AI产业的发展倍感焦虑,而通过这次事件,这样的焦虑恐怕可以得到相当程度的纾解。
经过近两天的发酵,这起事件本身毫无疑问已经“实锤”,不仅Llama3-V团队发布道歉声明,作为被抄袭方的面壁智能,也由CEO李大海透露了核查结果,Llama3-V和MiniCPM-Llama3-V-2.5这两个模型即便在高斯扰动验证后,在正确和错误表现方面都高度相似。
两个模型的代码对比
不过继续挖掘信息的话可以发现,其实所谓的斯坦福团队只是两个印度裔本科生自己攒的局,闯祸后,他们还第一时间把锅甩给了实际干活的枪手,声称自己是被阿拉伯裔码农描绘的多模态架构忽悠了,他们实际只是在社交媒体平台帮着后者宣传推广。
而扛下了所有的码农“枪手”Mustafa Aljadery,也是个妙人,根据其网上简历,目前同时写了三份全职工作,除了两个自己注册的小微企业,还包括量化投资大厂Citadel“即将入职的暑期实习生”。
总之,这个“斯坦福团队”里的卧龙凤雏,倒是让人见识到了美国科技产业最底层的一个微观切片,相互忽悠攒项目、海投注水论文“抽奖”、绞劲脑汁包装履历,湾区大学生的求职“内卷”也着实不容易。
斯坦福的作者在中午做出了最新回应,但现在这条回应已删除 图源:网友截图
Aljadery之所以抄上MiniCPM-Llama3-V-2.5,很可能是因为这个模型前一段时间在HuggingFace趋势榜上连续霸榜,性能表现非常亮眼,OpenCompass性能基准榜单上平均得分65.1,甚至超过了GPT-4V、Gemini Pro 这些主流商用模型,而开发者在美国似乎又没有什么关注度,所以他们认为抄过来交差应该没什么风险。但这次东窗事发之后,几个年轻人恐怕都会面临“偷鸡不成蚀把米”的后果。
斯坦福人工智能实验室主任Christopher Manning发文谴责抄袭行为,他认为团队在事发后避重就轻,并对MiniCPM 这一中国开源模型表示赞扬。
在科工力量看来,这次事件背后,还有着更值得关注和探讨的信息。
1
2
下一页
余下全文
Archived Raw HTML