Z站长网 Z站长网 AI 查看内容

中国新AI大模子为何火爆全网?专家解读

2025-1-28 19:44| 发布者: 潘先生、| 查看: 146| 评论: 0

摘要:   【举世时报记者刘扬举世时报特约记者任重】克日,一个名为DeepSeek(深度求索)的中国AI初创公司成为国表里人工智能(AI)大模子范畴热议话题。在不到30天的时间里,DeepSeek先后发布了DeepSeek-V3和DeepSeek-R1 ...

  【举世时报记者 刘扬 举世时报特约记者 任重】克日,一个名为DeepSeek(深度求索)的中国AI初创公司成为国表里人工智能(AI)大模子范畴热议话题。在不到30天的时间里,DeepSeek先后发布了DeepSeek-V3和DeepSeek-R1两款大模子,其本钱与动辄数亿乃至上百亿美元的国外大模子项目相比堪称低廉,而性能与国外顶尖大模子相称。同时,DeepSeek与外国大模子巨头闭源的路径差别,接纳开源模式。中国这家公司的发展模式与结果让硅谷高度关注,多家西方主流媒体纷纷发文感叹“中国AI模子震动硅谷”,乃至引发了国表里多家着名厂商与机构连夜实验复现DeepSeek结果的“高潮”。DeepSeek的发展具有哪些特点?是否对国产大模子的发展路径以及创新思绪带来一些启示?《举世时报》记者26日采访了多位人工智能范畴的专家。

  “OpenAI o1经济实惠且开放的竞争对手”

  DeepSeek公司本月20日发布大模子R1,并表现“在数学、代码、天然语言推理等使命上,性能比肩OpenAI o1正式版”,引发外媒特殊是美国媒体高度关注这家中国公司及其最新大模子结果。

  “中国自制、开放的人工智能模子 DeepSeek让科学家高兴不已。”《天然》杂志24日以此为题称,中国研制的大语言模子DeepSeek-R1令科学家们高兴不已,它被以为是OpenAI o1等“推理”模子的经济实惠且开放的竞争对手。

  《纽约时报》24日以“中国人工智能初创企业DeepSeek怎样与硅谷巨头竞争”为题报道称,能做到上述结果本已是一个里程碑,但DeepSeek-V3大模子背后的团队形貌了一个更大的进步。他们在练习该体系时只用了先辈人工智能公司所用的高度专业化盘算机芯片的一小部门。中国工程师称,他们只花了约600万美元以及约2000个英伟达专用芯片就完成了新模子的练习,无论资金以及芯片利用规模都远低于天下领先的人工智能公司。

  “这不是中国追赶美国的题目,而是开源追赶闭源的题目”

  DeepSeek备受关注,除了性价比超高,另有另一个缘故原由:开源。连日来,网络上已经出现了一波复现DeepSeek的高潮。加州大学伯克利分校、香港科技大学、知名流工智能公司HuggingFace等纷纷乐成复现,只用强化学习,没有监视微调,乃至只用几十美元的本钱就能完成复现。

  美国红迪网25日称,中国DeepSeek的模子是开源的,这是令人高兴的真正缘故原由。根本上,他们将制造这些东西的知识免费提供给全天下,确保没有人可以或许真正把持它。中国公司根本上与美国公司的做法完全相反。你能看到OpenAI、Anthropic或谷歌开源任何强盛的模子吗?到现在为止,昨们从他们那边得到的只是皮毛。Meta是唯逐一家对开源大模子做出庞大贡献的西方大公司,但他们未来大概不会开源其最好的模子。被誉为“深度学习三巨头”之一的Yann LeCun(杨立昆)在交际平台X上表现,这不是中国追赶美国的题目,而是开源追赶闭源的题目。

  北京邮电大学人机交互与认知工程实行室主任刘伟在担当《举世时报》记者采访时表现,大模子三大焦点要素是数据、算法、算力,Deepseek利用较少的数据、较少的算力,通过算法的优化实现了与国外着名大模子等效乃至更优的结果,这黑白常值得肯定的。同时还要看到它是开源的,可以供环球盼望利用这一大模子的用户来利用和复现。

  清华大学消息学院、人工智能学院传授沈阳26日对《举世时报》记者表现,DeepSeek的大模子是环球开源大模子当中相称良好的一款,是混淆利用多种先辈技能实现逾越传统预练习技能的创新突破。他联合自身利用的感受谈了这款大模子的几个长处。一是它把现在提拔AI大模子本领的方法举行了工程上的微创新组合。二是DeepSeek公布了相干论文,整个过程可以让各人去复现,这就是开源的气力。三是DeepSeek的推理过程,有自身的创新。沈阳作为AI范畴的研究者,利用AI凌驾3万次,他以为,DeepSeek跟美国的AI相比,另有许多中国元素在内里,如中国网络当中的一些热词。

  提拔推理本领

  对于Deepseek的发展模式为国内大模子发展以及创新提供了怎样的紧张启示,刘伟以为,“创新不是规划出来的,必要市场、专业机构通过长时间的研究来另辟蹊径,尤其是一些恒久关注垂直范畴的贸易公司可以通过对技能路径的反思、对市场发展的嗅觉,来找到更好的创新点。OpenAI最初的发展过程也是如许,并不是美国官方与科技巨头砸重金规划出来的。”

  日前,OpenAI、软银等公司公布了“星际之门”筹划,要在4年中砸5000亿美元来加快美国人工智能的发展。刘伟夸大,这种会合人力、财力、物力,再给予政策倾斜的发展路径,在将来研究方向与研究效果方面都存在肯定的不确定性。“照旧要鼓励国内更多贸易公司、科研院所聚焦自身的研究范畴,找到得当本身的创新与发展路径。”

  沈阳表现,在AI发展汗青中,新的突破每每是由不显眼的工程创新与科学探索共同驱动的。这种趋势在DeepSeek的结果中得到了深刻表现,它不但突破了传统的练习方式,也为推理本领的提拔带来了全新的视角。“只管它的成绩尚处于一个阶段性程度,但其工程贡献和理论创新已经为将来的AI发展奠基了紧张底子。”沈阳以为,DeepSeek团队在底子模子预练习方面的贡献,不但是在技能层面上的突破,更在于其工程方法的精致与高效。DeepSeek的这种工程创新,标记着AI模子练习的一个全新阶段,这不但低落了开辟本钱,也为其他公司提供了可鉴戒的路径。同时,DeepSeek的焦点创新还表现在推理本领的提拔上,尤其是通过相干算法创新来推动模子的天然推理本领,证明白AI范畴的一种潜力——无须大量昂贵的头脑链标注,模子依然可以或许涌现出推理本领。

  沈阳以为,DeepSeek的乐成也让昨们看到了将来AI财产的发展方向:更多的开源创新、硬件与软件的深度协同,以及对模子开辟本钱与推理本领的不停优化。同时,昨们也必须看到,DeepSeek固然取得了明显的阶段性结果,要想在将来发展门路上实现进一步突破,仍旧必要面临很多深条理的挑衅,比方必要更多的原创性练习数据和算法创新。


路过

雷人

握手

鲜花

鸡蛋