北京时间周二凌晨1点,自年初“文生视频模型”Sora后许久未给市场带来惊喜的OpenAI举行春季发布会。公司首席技术官MiraMurati向外界展现了多项与ChatGPT有关的更新。 简要来说,OpenAI的发布会主要干了两件事 ...
北京时间周二凌晨1点,自年初“文生视频模型” Sora后许久未给市场带来惊喜的OpenAI举行春季发布会。公司首席技术官Mira Murati向外界展现了多项与ChatGPT有关的更新。 简要来说,OpenAI的发布会主要干了两件事情:发布最新GPT-4o多模态大模型,相较于GPT-4 Trubo速度更快、价格也更便宜。 通过响应速度的大幅提升,该模型在语音模式下已经可以达到“实时”响应的状态。用户可以与ChatGPT像真人一样聊天——在机器人回应的过程中打断它,提出更多的要求(例如转变话题、要求机器人改变语音语调),再也不需要等待机器人完成上一个问题的回复后,再提出新的问题。 第二件事情就是宣布,ChatGPT的免费用户也能用上最新发布的GPT-4o模型(更新前只能使用GPT-3.5),来进行数据分析、图像分析、互联网搜索、访问应用商店等操作。这也意味着GPT应用商店的开发者,将面对海量的新增用户。 当然,付费用户将会获得更高的消息限制(OpenAI说至少是5倍)。当免费用户用完消息数量后,ChatGPT将自动切换到 GPT-3.5。另外,OpenAI将在未来1个月左右向Plus用户推出基于GPT-4o改进的语音体验,目前GPT-4o的API并不包含语音功能。 最后,苹果电脑用户将迎来一款为macOS设计的ChatGPT桌面应用,用户可以通过快捷键“拍摄”桌面并向ChatGP提问,OpenAI表示,Windows版本将在今年晚些时候推出。 ----发布会直击全程回顾---- 01点00分:倒计时结束,直播正式开始。首席技术官Mira Murati登场。 01点01分:Mira Murati表示,今天她将谈论3件事情:1)为什么一个可以免费、广泛使用的工具对于OpenAI非常重要?2)如何减少摩擦,让每个人都能使用ChatGPT,公司将发布桌面版的ChatGPT;3)公司将在今日发布最新的旗舰大模型,叫做GPT-4o。 这里的“o”指的是“全方位”(omni)的意思——指的是GPT-4o的多模态特性。 01点05分:对于桌面版的ChatGPT,OpenAI表示重新对UI进行了设计。(注:OpenAI在公告中表示,桌面应用程序适用于macOS,Windows版本将在今年晚些时候推出) 01点08分:GPT-4o具备GPT-4同等的智能,但运行速度更快,兼具文字、音频和视频能力。这是OpenAI历史上第一次在“便于使用”这个目标上实现了飞跃的进步。 01点13分:直到今天之前,在语音模式下,OpenAI仍需要调用三个模型——转写、智能和文生语音功能,这也造成了体验上的巨大延迟。而GPT-4o可以自然地在图片、文件和声音上进行推理。 01点17分:通过效率的提升,也使得OpenAI可以向免费用户提供GPT-4级别的智能。 01点19分:Murati重申,由于GPT-4o带来的效率提升,现在OpenAI可以让所有人都能使用上(GPT-4)工具。 01点20分:目前GPT Store里已经有超过100万个GPTs。伴随着免费开放,GPTs的开发者将获得更大的用户基数。 01点22分:免费用户也将能够上传图片、进行分析、使用“浏览器”功能搜索实时信息。同时GPT-4o也将支持记忆功能。GPT-4o也将支持API,供开发者调用。相较于GPT-4 Turbo,GPT-4o快两倍、便宜50%,速率限制高出5倍。 01点25分:两名研究主管Mark Chen和Barret Zoph登台,他们将演示一系列新功能。 01点26分:Mark Chen正在与ChatGPT寒暄,机器人能够从急促的喘气声中理解“紧张”的含义,并且指导他进行深呼吸。 01点28分:Chen表示,他的演示是为了说明,在目前的语音模式下,不需要再与机器进行机械的一问一答,可以进行实时的沟通交流。实时交流中不需要再每次“尴尬地等待2-3秒”。 01点30分:实时演示中,主持们不断要求ChatGPT变换语调,包括夸张的语气、机器人的预期和使用“唱腔”讲故事。 01点35分:Barret Zoph启动摄像头,要求ChatGPT实时帮助他解决一个一元方程题。 01点37分:除了图像识别和解题能力外,ChatGPT展现了实时根据影像变化,与Barret实时互动的能力。 01点40分:Barret进一步展示了ChatGPT桌面版对代码和电脑桌面(一张气温图表)进行实时解读的能力。 01点42分:Murati和Mark Chen展示ChatGPT进行意大利语、英语的实时交传翻译。 发布会结束,OpenAI表示今天的发布会主要聚焦于免费用户,这些功能将在未来几周内逐步向所有用户推送。 根据OpenAI的官网公告显示,GPT-4o将同时向付费的Plus、Team用户,以及免费用户推出。Plus 用户的消息限制数量将是免费用户的5倍,Team和Enterprise用户的可用消息数量还会更高一些。当免费用户的使用量达到限制后,ChatGPT将自动切换到GPT-3.5,以便继续进行对话。
(文章来源:财联社) |