DeepSeek 逼急 Gemini 放大招,ChatGPT 搜刮功能免费开放,AI 掀起让利战 ...

2025-2-7 01:30| 发布者: 吖潆ing| 查看: 666| 评论: 0

摘要: 客岁底,GoogleDeedmind推出了面向智能体期间的Gemini2.0Flash模子,一只脚迈入了2.0期间,时隔两个月,Gemini2.0系列百口桶终于正式上新。在DeepSeek的「鲶鱼效应」催化下,这次发布与往常不太一样,不但在性能上有 ...

客岁底,Google Deedmind 推出了面向智能体期间的 Gemini 2.0 Flash 模子,一只脚迈入了 2.0 期间,时隔两个月,Gemini 2.0 系列百口桶终于正式上新。

在 DeepSeek 的「鲶鱼效应」催化下,这次发布与往常不太一样,不但在性能上有进一步的提拔,还挥动起 AI 性价比的大旗,同时也拥抱多模态本领。

最新的大模子竞技场中,Gemini-2.0-Pro 在全部种别中排名第 1,Gemini-2.0-Flash 排名第 3,Flash-lite 则以精彩的性价比跻身前十。

Deepmind CEO Demis Hassabis 发文称:

令人高兴的希望!昨们在不停提拔质量的同时,积极低落本钱。Gemini 2.0系列是性价比和性能方面的领先模子。通过本日的发布,各人都可以使用它们强盛的推理和多模态本领,这也为昨们的智能工作奠基了底子。

Gemini 2.0 系列模子重要特点如下:

  • 2.0 Pro Experimental:主打编码性能和处置惩罚复杂提示本领,在知识明白和逻辑推理方面体现精彩。
  • 2.0 Flash:专门面向开辟者提供 API 接口,支持快速构建 App。
  • 2.0 Flash-Lite:在保持高性能的同时实现了更优的本钱效益和相应速率。
  • 2.0 Flash Thinking Experimental:已在 Gemini App 中开放利用,供用户体验。
不到 1 美元醒目啥?Google 新模子能给 4 万张图片配标题

详细来说,Gemini 2.0 系列百口桶模子各具特色。

此中,已全面发布的 Gemini 2.0 Flash 支持多模态输入和文本输出,具备 100 万tokens 的上下文窗口,并支持布局化输出、函数调用和代码实行等功能。

值得留意的是,其多模态及时 API 现在仍处于「beta」阶段,图像和音频输出功能也将在后续推出。

该模子的订价方案也已确定,文本、图像和视频输入每百万 tokens 收费 0.10 美元,音频输入则为 0.70 美元,(2 月 20 日起正式见效)。文本输出每百万 tokens 收费 0.40 美元。

各类缓存费用也都维持在较低程度。文本/图像/视频缓存费用为每百万 token 收费 0.025 美元,音频缓存费用为 0.175 美元。

在此底子上,Google 还推出了更具性价比的「轻量版」——Gemini 2.0 Flash-Lite 。

固然这款模子在功能上做了肯定弃取,暂不支持多模态及时 API、搜刮工具和代码实行,但它保存了 100 万 tokens 的上下文窗口,以及多模态输入、文本输出和函数调用等焦点功能。

其订价更为亲民,文本、图像和视频输入每百万 tokens 仅需 0.075 美元,险些比尺度版自制了三分之一。音频输入也为 0.075 美元,文本输出为 0.30 美元,文本/图像/视频缓存为每百万 tokens 仅需 0.01875 美元,音频缓存为 0.175 美元。

作为对比,DeepSeek-V3 模子如今在击中缓存的环境每百万 tokens 必要 0.014 美元。2 月 8 日起,其代价将规复到每百万 tokens 0.07 美元的程度。这一调解大概也是促使 Google 订定当前代价计谋的紧张因素之一。

据 Google 先容,利用该模子为 4 万张独特图片天生标题的本钱仅需不到 1 美元。

产物线的顶端则是 Gemini 2.0 Pro Experimental 版本。这款模子拥有 200 万 tokens 的超大上下文窗口,相称于可以一次性处置惩罚约 150 万个单词,能同时消化整个《哈利·波特》系列的七本书还绰绰有余。

在功能上,它也是最为万能的选手,不但支持多模态输入和文本输出,还具备布局化输出、函数调用、搜刮工具和代码实行等全方位本领。

在性能测试方面,Gemini 2.0 系列体现可圈可点。

在 MMLU-Pro 测试中,2.0 Pro Experimental 以 79.1% 的得分领先,而 2.0 Flash Lite Preview 和 2.0 Flash GA 分别得到 71.6% 和 77.6% 的结果。

在代码天生、数学和多语言本领等方面,2.0 Pro Experimental 同样体现优秀,特殊是在数学(91.8%)和多语言本领(86.5%)方面的结果尤为突出。

遗憾的是,即便是最强的 Gemini 2.0 Pro Experimental 版本也要远远落伍于 OpenAI o3 模子,并未完成外界等待的「弯道超车」。

不外也有网友以为,由于 Gemini 2.0 Pro 并非典范的 CoT 模子,当前的性能对比大概并不完全公道。

这些模子的重要上风在于其快速相应本领和较低的本钱,特殊实用于定名实体辨认或分类等特定使命。随着图像天生和文本到语音等新功能的即将推出,Gemini 2.0 系列的应用场景将进一步扩展。

如今,这些新模子现已在 Google AI Studio 和 Vertex AI 平台上向开辟者开放,Gemini 高级用户也可以在其装备上选用。

贪吃蛇大战、跳跃球,Gemini 2.0 还能如许玩

谁说 AI 只会干巴巴答复答复,随着 Gemini 2.0 百口桶的上线,网友如饥似渴地玩出了新格式。

比方说,想看贪吃蛇大战吗?让 Gemini 2.0 自行用代码操刀计划一个贪吃蛇游戏。

亦大概,Gemini Flash Thinking 模子是首个可以或许访问 YouTube 的推理模子,而且它还支持 Google 搜刮和舆图功能。

在图像渲染方面,有开辟者要求模子利用 p5.js 编写脚本,天生了一个包罗 100 个动态弹跳黄球的三维场景。而且,球体内的黄球还要可以或许精确相互碰撞,球体迟钝旋转,以及始终保持在球体内。

昨们也在 Google AI studio 简朴体验了此次上新的几款新模子。这几款新模子相应的速率倒是挺快的,至于结果嘛,Emmm,就属实有点难评了。

在 Gemini 大展拳脚之际,惯常偷袭的 OpenAI 也在连续发力。

本日,OpenAI 破晓公布 Deep Research 功能向全部 Pro 用户全面开放,包罗英国、欧盟、挪威、冰岛、列支敦士登和瑞士等地域。Plus 用户流下了倾慕的泪水。

而且,ChatGPT 的搜刮功能现已向全部用户开放,无需注册即可利用,进一步低落用户的利用门槛。

不外,在卷模子之前,不妨先卷一下 AI 模子的起名,无论是 Gemini 系列,照旧 OpenAI 的 GPT/o 系列,随着新模子的接踵而至,各类版本号和定名规则也是让人眼花缭乱。

客岁当 OpenAI CEO Sam Altman 被问及公司产物的定名计谋时,他也坦言相称头疼。

包罗 Anthropic CEO Amodei 曾表现,固然 Claude 的定名方式在早期看起来不错,但随着模子的快速迭代和更新,相沿的定名体系同样变得左支右绌。

他指出,现在没有任何 AI 公司真正「搞定定名」这一题目,各人都在积极探求更简朴、更清楚的定名方式。这大概也是 AI 巨头们少有告竣的共识。


路过

雷人

握手

鲜花

鸡蛋
返回顶部