DeepSeek V3“报错家门”:我是ChatGPT

2024-12-30 02:07| 发布者: 6969369hhx| 查看: 1013| 评论: 0

摘要: 金磊发自凹非寺量子位|公众号QbitAI要说这两天大模子圈的顶流话题,那绝对黑白DeepSeekV3莫属了。不外在网友们纷纷测试之际,有个bug也成了热议的核心——只是少了一个问号,DeepSeekV3竟然称本身是ChatGPT。乃至让 ...

金磊 发自 凹非寺
量子位 | 公众号 QbitAI

要说这两天大模子圈的顶流话题,那绝对黑白DeepSeek V3莫属了。

不外在网友们纷纷测试之际,有个bug也成了热议的核心——

只是少了一个问号,DeepSeek V3竟然称本身是ChatGPT。



乃至让它讲个笑话,天生的效果也是跟ChatGPT一样:



加之DeepSeek V3这次爆火的一个亮点,就是练习只花了557.6万美元的本钱。

于是乎,有人就开始猜疑了:它不会是在ChatGPT的输出底子上练习的吧?

好巧不巧,Altman也发了一个状态,好像在暗讽着什么……



不外DeepSeek V3并非是第一个出现“报错家门”的大模子。

比方Gemini就曾说过本身是百度的文心一言



那么这到底是怎么一回事?

为什么DeepSeek V3报错家门?

起首必要夸大的一点是,从现在网友们团体讨论的观点来看,说DeepSeek V3是在ChatGPT输出上练习的大概性不大



之以是这么说,正如网友Riley Goodside所总结的那样——由于ChatGPT的影子无处不在。

即便DeepSeek V3故意用ChatGPT的输出做了练习,但这并不紧张。全部在ChatGPT之后出现的大模子,险些都见过它。
比方ShareGPT,一个并不奇怪的ChatGPT对话数据集,很多人已经实验在它和别的ChatGPT数据源上举行调解。但即便云云,也没能出现DeepSeek V3级别的大模子。



紧接着,Riley Goodside又拿出了DeepSeek V3陈诉中的一些证据:

而且要是用了ChatGPT数据的话,有些关于DeepSeek V3质量的题目是表明不通的。
比方Pile测试(底子模子压缩Pile的结果),DeepSeek V3得分险些与Llama 3.1 405B相称,这跟它接没打仗ChatGPT数据无关。
而且陈诉称95%的GPU-hours用于预练习底子模子,即便是跟ChatGPT数据有关,那这部门也会在post-training阶段发生(后5%)。



而比起用没用ChatGPT数据,大概昨们应当更加关注的是为什么大模子会频仍出现“报错家门”的题目。

TechCrunch针对这个题目给出了一句犀利的点评:

由于AI公司们获取数据的地方——网络,正在充斥着AI垃圾。

究竟欧盟的一份陈诉曾猜测,到2026年,90%的在线内容大概是AI天生的。

这种“AI污染”就会让“练习数据彻底过滤AI的输出”变得困难。



AI Now Institute的首席科学家Heidy Khlaaf则表现:

只管存在风险,开辟者依然被从现有AI模子中“蒸馏”知识所带来的本钱节省所吸引。
不测地在ChatGPT或GPT-4输出上举行练习的模子,也不肯定会展示出让人想起OpenAI定制消息的输出。

那么如今对于网友们热议的题目,量子位举行了一波实测,DeepSeek V3现在还没有办理这个bug。

仍旧是少了个问号,答复效果会不一样:



DeepSeek V3更多玩法

不外有一说一,绝大部门网友对于DeepSeek V3的本领是给予了大大的肯定。

从各路AI大佬们团体直呼“优雅”中就能印证这一点。

而就在这两天,网友们连续晒出了更多DeepSeek V3加持的实用玩法

比方有网友拿DeepSeek V3和Claude Sonnet 3.5一决高下,在Scroll Hub中分别用它俩创建网站



视频地点:https://mp.weixin.qq.com/s/ieCfWqC5gsJ-Oc7-_L3uDQ?token=904287848&lang=zh_CN

博主在测试之后,以为DeepSeek V3完全胜出!

另有网友分享了用DeepSeek V3在AI视频编辑器中的体验。

他表现以后不消再在FFMPEG下令上浪费时间了,DeepSeek V3不但免费,还能改变你的工作流程:



视频地点:https://mp.weixin.qq.com/s/ieCfWqC5gsJ-Oc7-_L3uDQ?token=904287848&lang=zh_CN

AI编程神器Cursor也能跟DeepSeek V3联合,来看一个做贪吃蛇的案例:



视频地点:https://mp.weixin.qq.com/s/ieCfWqC5gsJ-Oc7-_L3uDQ?token=904287848&lang=zh_CN

嗯,DeepSeek V3是有点好用在身上的。

One More Thing

对于此前公布的53页论文,也有网友关注到了一个非技能性的细节——

贡献列表中,不但展示了技能职员,另有数据解释和商务等工作职员:



网友以为这种做法非常符合DeepSeek的调性:




[1]https://techcrunch.com/2024/12/27/why-deepseeks-new-ai-model-thinks-its-chatgpt/
[2]https://x.com/victormustar/status/1872647314231398524
[3]https://x.com/breckyunits/status/1872422078592516295
[4]https://x.com/op7418/status/1872689338242482203
[5]https://x.com/goodside/status/1872911457857208596
[6]https://x.com/kevinsxu/status/1873146905846530472


路过

雷人

握手

鲜花

鸡蛋
返回顶部