李飞飞团队50美元复刻DeepSeek真相 基于阿里通义千问模型

2025-03-14 11:02:06 铺路手游网

《科创板日报》2月6日讯,今日一则关于人工智能领域的新闻引发广泛关注。

据报道,李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现,据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。

极乐软件园

这一消息无疑在AI界投下了一颗重磅炸弹,真相究竟如何?

《科创板日报》记者调查和采访业内人士后发现,s1模型的训练并非从零开始,而是基于阿里云通义千问(Qwen)模型进行监督微调。这意味着,s1模型的神奇“低成本”,是建立在已具备强大能力的开源基础模型之上。

根据李飞飞等人的研究论文,s1模型的训练仅使用了1000个样本数据。按照业内共识,这一数据量在AI训练中可谓微乎其微,通常不足以训练出一个具备推理能力的模型。

极乐软件园

青年AI科学家、上海交通大学人工智能学院谢伟迪副教授告诉《科创板日报》记者,如果仔细研究斯坦福s1的论文会发现,s1模型的神奇是以通义千问模型为基座进行微调,这1000个样本训练的作用更像是“锦上添花”,而非“从零开始”。

“以通义千问模型作为基座,确实可以用很少的样本数据就达到产生新的推理模型的效果,但如果换成其他基座模型,新模型能力却没有任何的提升。所以,能力真正神奇的是Qwen模型,而不是s1。 ” 谢伟迪说。

极乐软件园

奈的教育日记汉化版
奈的教育日记汉化版
休闲益智 / 75.98M
2025-03-14
详情
心动小镇正版官方
心动小镇正版官方
休闲益智 / 954.96M
2025-03-14
详情
幸福宅女养成方法游戏完整版
幸福宅女养成方法游戏完整版
休闲益智 / 54.06M
2025-03-14
详情
飞机大厨2024国际服
飞机大厨2024国际服
休闲益智 / 83.91M
2025-03-14
详情
漫画人app
漫画人app
休闲益智 / 9.9MB
2025-03-14
详情
jmcomicron.mic天堂安装包
jmcomicron.mic天堂安装包
休闲益智 / 9.9MB
2024-12-16
详情
jmcomic2安装包1.7.4
jmcomic2安装包1.7.4
新闻阅读 / 9.97 MB
2025-01-13
详情
ehviewer漫画
ehviewer漫画
新闻阅读 / 8.92 MB
2025-01-03
详情
夏哈塔遭难的一天正式版官网
夏哈塔遭难的一天正式版官网
休闲益智 / 11.50M
2024-11-23
详情
EhViewer官方版绿色
EhViewer官方版绿色
新闻阅读 / 9.16 MB
2025-01-03
详情

相关游戏下载

jmcomicron.mic天堂安装包
jmcomicron.mic天堂安装包
休闲益智 / 9.9MB
详情
jmcomic2安装包1.7.4
jmcomic2安装包1.7.4
新闻阅读 / 9.97 MB
详情
ehviewer漫画
ehviewer漫画
新闻阅读 / 8.92 MB
详情
EhViewer官方版绿色
EhViewer官方版绿色
新闻阅读 / 9.16 MB
详情

推荐游戏玩法

最新游戏玩法