Z站长网 Z站长网 AI 查看内容

王维嘉:DeepSeek 尚不敷以撼动中美 AI 差距格局

2025-1-31 01:29| 发布者: 我那里20公分| 查看: 150| 评论: 5

摘要: 图片泉源:theVerge▎从技能格局来看,只管DeepSeek的结果缩小了中美在人工智能技能上的差距,但中尤物工智能团体格局尚未被撼动。钛媒体注:本文为硅谷闻名企业家&投资家、《暗知识》作者王维嘉在一个企业家社群里 ...

图片泉源:the Verge

从技能格局来看,只管 DeepSeek 的结果缩小了中美在人工智能技能上的差距,但中尤物工智能团体格局尚未被撼动。

钛媒体注:本文为硅谷闻名企业家 & 投资家、《暗知识》作者王维嘉在一个企业家社群里的讨论要点,钛媒体 APP 经授权发布,并略经编辑。

眼下科技圈最关注的莫过于 Deepseek 变乱。网络上充斥着各种技能与财政分析。在此,我愿分享一些个人看法,以期为诸位提供更清楚的思绪。

技能创新的探索之路

我在硅谷工作了 40 年,对技能创新有着深刻的领会。技能创新犹如探路者在大山中探求金矿。只管有人指出大山中存在金矿,但详细位置却无人知晓。因此,浩繁探索者涌入,各自探求差别的方向。

回首人工智能发展进程,自 2012 年图像辨认取得初次突破,到厥后人工智能在围棋范畴的应用,昨们可将其视为人工智能 1.0 阶段。彼时,硅谷以致环球人工智能行业重要聚焦于图像辨认和视频辨认范畴。

2017 年,谷歌推出 Transformer 模子,聚焦语言翻译,尤其是英文与法文之间的翻译。然而,谷歌在完成相干研究后,并未深入探索,由于其时业界广泛以为语言翻译市场有限,远不及图像辨认和视频辨认范畴。

然而,OpenAI 另辟蹊径,洞察到语言范畴的广阔远景。人类聪明多以语言出现,因此 OpenAI 尽力投入研发。只管其时 OpenAI 资源匮乏,与谷歌、微软等巨头相比,人力、财力均相差悬殊,但他们依附敏锐的洞察力,于 2022 年 11 月发布了 ChatGPT。

这犹如在众人行走的阳光大道旁发现了一条小岔道,OpenAI 一头扎进去,竟不测发现了一座金矿,引发了行业的震惊。浩繁从业者纷纷涌入,将此范畴开辟成新的阳光大道。

今后,行业预练习模子不停加大规模和数据量,但渐渐迷失方向。在此过程中,OpenAI 又做出了新的贡献 —— 推理学习。研究发现,在模子规模并非极大的环境下,通过经心练习推理本领,模子性能可实现大幅提拔。2024 年 9 月 24 日,OpenAI 发布 o1 model,再一次为行业开发了新的路径。

在这一探索过程中,环球团队,尤其是美国团队,发明白诸多工具,犹如更锋利的砍刀与铲子,助力各团队在波折丛生的探索之路上加快前行。

DeepSeek 的开源抱负和乐成偶尔性

DeepSeek 堪称一支怀揣技能抱负的团队。他们对峙开源,与通常领先者秘而不宣的做法差别,选择借助环球聪明共同推进技能发展。

在技能发展中,领先者通常会对焦点技能有所保存,而落伍者则倾向于通过开源汇聚环球聪明推动发展,如 Meta(Facebook)在与 OpenAI 的竞争中选择开源。由于开源是一种雷同公益社区的精力,阿拉善的企业家就会比力更能明白,就是哪怕不知道有没有劳绩,但是仍会选择付出。

美国有开源的文化,好比软件的开源 Linux,好比 Wikipedia 做成了全天下的字典,中国其时也来拷贝,效果做的很差。在中国,开源文化并不深厚,DeepSeek 能对峙开源,将优质结果与天下共享,实属难过。这表现了美国开源社区精力对中国年轻步伐员和企业家的影响,只管这种影响在国内仍较为稀缺。

团队焦点人物梁文锋自 2013 年便开始运用呆板学习举行量化投资,团队在呆板学习范畴已有十余年的履历积聚。在技能敏感度上,他们大概早在 ChatGPT 之前就已开始利用 transformer 开辟大语言模子,如 2019 年大概就已启动相干工作。同时,团队汇聚了一批国内顶尖人才,在技能探索中,他们使用前人开辟的先辈工具,在推理模子的底子上又发现了一条新路径 —— 完全主动练习,区别于 OpenAI 的人工练习方式,低落了本钱。

这种主动推理练习雷同于 AlphaGo zero 的模式。AlphaGo 击败李世石后,谷歌工程师实验让 AlphaGo zero 不依靠人类履历重新学习,效果在短时间内,AlphaGo zero 便逾越了击败李世石的旧版 AlphaGo。DeepSeek 在这一起径上深入探索并取得乐成,固然其贡献水平不及 ChatGPT 和推理练习的发现,但也堪称自 ChatGPT 以来第三大紧张贡献,将推理本钱低落了两个数目级。

从技能格局来看,只管 DeepSeek 的结果缩小了中美在人工智能技能上的差距,但中尤物工智能团体格局尚未被撼动。

在人工智能技能的几个关键方面,芯片范畴中国仍与美国存在较大差距;在算法突破方面,已往十年间,从 2012 年的 alexnet 到 2017 年的 transformer,再到 2022 年的 ChatGPT 以及后续的头脑链、RAG 和推理练习等庞大突破,大多发生在美国,法国的 Mistral 公司也有少量贡献,DeepSeek 的贡献占比约为 5%,但这已然非常了不得。

DeepSeek 的乐成在肯定水平上具有偶尔性。在一个布满偶尔性的科学探索过程中,浩繁团队在差别的方向上探索,总会有某个团队率先取得突破。中国拥有巨大的 AI 底子和工程师队伍,颠末 30 年的发展,已经与西方创建了精良的交换底子。因此,中国出现像 DeepSeek 如许的团队并不令人不测。这雷同于苏联在 1957 年乐成发射第一颗人造卫星,其背后是美国在两次天下大战期间对苏联技能的开放,使得苏联造就了强盛的技能底子。然而,一旦苏联闭关锁国,这种技能本领便敏捷阑珊。

AI 海潮远景广阔,现在仍处起步阶段

在贸易和股市层面,人工智能范畴的发展与英伟达密切相干。我在 2017 年《暗知识》一书便指出,AI 期间的芯片霸主是英伟达,其时其市值约三百亿美元,今后涨幅近百倍。

近期美国股市大跌,部门缘故原由是市场以为算法服从进步会淘汰对算力的需求,进而低落对英伟达等芯片的依靠。但这是一种静态头脑,正如 19 世纪英国经济学家杰文斯发现的一个征象:当蒸汽机的服从大幅提拔后,煤炭的斲丧量并未淘汰,反而大幅增长。这一征象被称为 " 杰文斯悖论 "(Jevons Paradox)。其背后的逻辑是:只管单台蒸汽机的煤炭斲丧量淘汰了,但由于蒸汽机变得更加经济高效,人们开始在更多范畴广泛利用蒸汽机,从而导致蒸汽机的总数大幅增长,终极使得煤炭的总斲丧量不降反升。

同理,AI 模子本钱低落将推动 AI 应用的广泛拓展,对芯片的需求也会随之增长。已往,AI 应用面对的一大停滞是本钱高昂。以 ChatGPT 为例,用户每次提问都必要付出费用,且随着题目复杂度的增长,盘算本钱呈指数级上升。比方,答复一个简朴题目如 " 唐朝的第一任天子是谁 " 大概刹时完成,而答复一个复杂题目如 " 唐宋之变的焦点缘故原由是什么 " 则必要举行深入分析和佐证,盘算时间大概增长百倍乃至更多。

现在,AI 已经发展到可以作为智能署理(agent)为用户提供全面服务的阶段。比方,用户筹划前去巴西旅游,AI 可以像私家助理一样,从行程规划到旅店预订,再到机票购买,全程提供服务。这一过程的盘算本钱大概是简朴问答的万倍以上。假如每次服务的费用高达 10000 元人民币,用户大概会望而却步;但假如费用降至 100 元,用户则会绝不夷由地利用。因此,低本钱的 AI 模子将极大地扩展 AI 的应用场景,大概实现百倍、千倍乃至万倍的增长。

对于 Deepseek,外界关注其芯片利用量以及是否存在数据盗用题目。但从其市场订价来看,每次访问本钱仅为 OpenAI 的 1/30 且仍有利润,这表明其在本钱控制上卓有成效,至于其他题目,现在并无确凿证据,且对其技能代价和市场影响的判定并非关键。

DeepSeek 将来可否继承取得庞大突破还是一个未知数。随着团队的着名度提拔,当局的高要求和大公司的高薪挖角,大概会对其纯粹的技能寻求产生倒霉影响。可否在这种情况下服从技能抱负,继承前行,是一个值得打问号的题目。

AI 海潮的远景极为广阔,现在仍处于起步阶段,将来十年乃至二十年仍将发达发展。与互联网在 20 世纪 90 年代末和 21 世纪初的发展雷同,AI 有望在将来十年到二十年内实现庞大突破。

更为紧张的是,AI 的潜力毕竟有多大?现在,包罗 OpenAI、Anthropic、Google、微软在内的各大实行室都在积极研发通用人工智能(AGI)。AGI 的界说是:呆板可以或许完成人类绝大部门的智力运动。根据现在的研究希望,AGI 的出现时间大概在两年到五年之间。假如 AGI 成为实际,其市场规模将极为巨大,有望凌驾互联网市场,到达数万亿美元乃至数十万亿美元的规模。

DeepSeek 的技能突破进一步证明了人类有大概以较低本钱实现 AGI。假如 AI 的本钱过高,乃至凌驾人力本钱,那么其应用范围将受到限定。正如中国很多生产线仍旧利用人工而非呆板人,由于人工本钱更低。只有当呆板人的本钱远低于人工时,呆板人才气广泛遍及。DeepSeek 在低落 AGI 本钱方面做出了庞大贡献,这一点非常值得肯定。

总之,DeepSeek 的乐成是中国 AI 范畴的技能突破虽有偶尔性,但更多源于团队技能积聚。在 这场漫长的征程中,DeepSeek 已经迈出了第一步,将来可否继承引领潮水,还需时间的查验。

(本文首发于钛媒体 APP)


路过

雷人

握手

鲜花

鸡蛋
返回顶部