日本乐天 AI 3.0 模型被曝基于 DeepSeek-V3 架构,日本网友质疑其自主研发宣称

这件事在日本的社交网络上炸锅了。

日本乐天集团前几天高调发布了号称”日本最大、性能最强”的 7000 亿参数大模型 Rakuten AI 3.0,说是日本自主研发的成果,还拿到了日本政府 GENIAC 项目的资金支持。

结果发布没多久,开源社区的开发者就到 Hugging Face 上扒出了真相:这模型的底层架构根本就是中国的 DeepSeek-V3,乐天只是做了日文数据的微调。更尴尬的是,配置文件里明明白白写着架构来自 DeepSeek V3,但乐天的新闻稿里对此只字不提,只用一句”融合了开源社区的精华”带过。

事情还没完。有人发现乐天在开源时偷偷删除了 DeepSeek 的 MIT 开源协议文件,被实锤后才灰溜溜地补上一个”NOTICE”文件。MIT 协议的要求很简单——保留原作者的版权声明就行,但乐天连这个都不愿意做。

日本网友的反应挺有意思。有人说”用 DeepSeek 就算了,还要偷偷藏藏真的很逊”,也有人指出主导这个模型的首席 AI 官是个在美国 Google、苹果、微软工作过的移民,却拿着日本政府的补贴搞这种操作。

其实拿开源模型做本土化微调本身没问题,ABEJA 基于千问推出的模型就直接用 QwQ 的名字。但乐天的问题在于既想要中国技术的性价比,又放不下”本土巨头”的身段,最后弄巧成拙。

话说回来,喊了一年多的”欧洲版 DeepSeek”、”美国版 DeepSeek”好像都没做出来,日本版 DeepSeek 倒是以这种方式诞生了。不如大家一起等等 DeepSeek V4 吧。

📍 来源:虎嗅网

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
通知图标

欢迎访问AIvision