英国《金融时报》1月25日文章,原题:中国小型人工智能初创公司深度求索怎样震动硅谷 本周,中国一家人工智能(AI)实行室发布尖端模子的“技能配方”,此举不但震动天下,也使其低调的负责人酿成无视美国制止中国高科技雄心计划的民族好汉。
1月20日,由对冲基金司理梁文锋建立的公司深度求索正式发布R1模子,并在一篇论文中具体表明了怎样使用有限的自筹预算来构建一个大语言模子,该模子可在没有人工监视的环境下主动学习和自我改善。
包罗OpenAI和谷歌DeepMind在内的美企率先开辟出推理模子,这是一个相对较新的人工智能研究范畴,旨在实验使模子具有与人类相匹配的认知本领。上月,OpenAI发布o1模子的完备版本,但对创建模子的方法保密。
深度求索R1模子的发布在硅谷引发一场猛烈辩说,主题是包罗Meta和Anthropic在内资源更雄厚的美国人工智能企业可否守住技能上风。与此同时,梁文锋也成为提拔中国国内民族自大感的核心人物。本周,在中国总理召开的一次座谈会中,梁文锋是唯一的人工智能企业负责人。
2023年梁文锋创建深度求索公司。“他创建一个精彩的底子办法团队,他们真正相识芯片的工作原理。”另一家大语言模子公司的首创人说。
在华盛顿克制英伟达向中国出口功能最强盛的芯片后,中国本土人工智能企业被迫探求创新方法,以最大限度地使用现有芯片的盘算本领,而梁的团队已经知道怎样办理这一题目。“深度求索公司的工程师知道怎样开释这些图形处置惩罚器(GPU)的潜力,纵然它们不是最先辈的。”一名流工智能研究职员说。
业内人士表现,深度求索对研究的专注使之成为一个可畏的竞争对手,由于该公司乐意分享取得的突破,而非为获取贸易长处掩护它们。深度求索没有从外部基金筹集资金,也没有接纳重大肆措将其模子钱币化。北京的一名流工智能行业投资者说:“深度求索的运作方式就像早期的DeepMind,它专注于研究和工程。”
深度求索仅用2048颗英伟达H800 GPU和560万美元,就练习出6710亿参数的开源大模子,这只是OpenAI和谷歌练习划一范例模子耗费的一小部门。加州大学伯克利分校人工智能政策研究员里特维克·古普塔表现,深度求索近来发布的模子表明,“没有拦阻人们获取人工智能本领的壕沟”。他说:“练习模子第一人必须耗费大量资源才气实现目标,但跟进者可用更少的费用且以更快的速率实现目标。”
古普塔还表现,中国拥有比美国大得多的体系工程师人才库,他们知道怎样最好地使用盘算资源,以更自制的方式练习和运行模子。
美国的竞争对手也没有故步自封。它们正在构建由英伟达新一代Blackwell芯片构成的超大型“集群”,从而创造出强盛的盘算本领,有大概再次拉开与中国竞争对手的性能差距。(作者埃莉诺·奥尔科特等)
美国“贸易黑幕”网站1月25日文章,原题:当来自中国的人工智能竞争令硅谷感到恐慌,扎克伯格表现Meta将投资600多亿美元 扎克伯格24日在交际媒体上表现,2025年将是“人工智能的决定性一年”。他透露:“昨们筹划本年对该范畴增长600亿至650亿美元投资,同时大幅扩大人工智能研发团队。”
就在扎克伯格公布这一消息之际,硅谷正在审阅与中国企业深度求索有关的消息,在第三方开展的基准测试中,该公司开辟的开源人工智能模子的体现凌驾Meta、OpenAI和Anthropic等美企的模子。人工智能和中国成为本周在瑞士达沃斯举行的天下经济论坛2025年年会的重要话题。“昨们应该非常、非常认真地对待来自中国的发展态势。”微软(OpenAI最大投资方)的首席实行官纳德拉如是说。(作者凯蒂·贝尔维奇,王会聪译)