趁着谷歌开大会,OpenAI果然又来定向狙击了。

谷歌前脚刚官宣一系列更新,OpenAI立马跟着抛出重大消息——

GPT-4 Turbo迎来「重大升级」!

OpenAI今天官宣称,配备视觉能力的GPT-4 Turbo已经可以通过API调用了。

「视觉版」GPT-4 Turbo重磅升级!ChatGPT 40条消息限制或取消

最新模型有128k上下文,训练数据截止到2023年12月。同时,Vision请求也可以使用JSON模式和函数调用。

「视觉版」GPT-4 Turbo重磅升级!ChatGPT 40条消息限制或取消

而现在,早已有开发者用上了最新的模型。

爆火全网的AI工程师Devin就是通过Vision来执行各种编码任务。

「视觉版」GPT-4 Turbo重磅升级!ChatGPT 40条消息限制或取消

Healthifyme团队通过GPT-4 Turbo with Vision构建的应用Snap,可以对各种美食进行拍照识别,为你提供营养洞察。

「视觉版」GPT-4 Turbo重磅升级!ChatGPT 40条消息限制或取消

还有更牛的应用Make Real,直接勾画几笔UI,就能构建出由真实代码支持的网站。

「视觉版」GPT-4 Turbo重磅升级!ChatGPT 40条消息限制或取消

显然,新模型可以有助于简化开发人员的工作流程,创造出更高效的应用程序。

但代码能力变差了?

不过,有研究发现,GPT-4 Turbo with Vision在编码方面较差。

「视觉版」GPT-4 Turbo重磅升级!ChatGPT 40条消息限制或取消

尤其是,新模型似乎比现有的GPT-4 Turbo preview模型更加懒惰。

代码编辑能力

「视觉版」GPT-4 Turbo重磅升级!ChatGPT 40条消息限制或取消

Aider依靠代码编辑基准来定量评估LLM对现有代码进行更改的程度。

GPT-4 Turbo with Vision在这一基准上的得分仅为62%,是现有任何GPT-4型号中得分最低的。

其他模型的得分为63%-66%,因此这只代表了很微小的退步,与 gpt-4-0613 相比,在统计上可能微不足道。

懒惰编码

「视觉版」GPT-4 Turbo重磅升级!ChatGPT 40条消息限制或取消

GPT-4 Turbo preview版本因在编码时「懒惰」而广受吐槽。

经常省略所需的代码,而是在注释中留下「在此实现方法」之类的内容。

新的GPT-4 Turbo with Vision模型在AIDER的重构基准上只得了34%的分数,成为所有GPT-4 Turbo模型中最懒惰的一个。

不过,有网友表示,在对新模型进行了一天的测试后,发现其并不懒惰而是更愿意输出完整大量的代码,甚至推理能力变强了。

「视觉版」GPT-4 Turbo重磅升级!ChatGPT 40条消息限制或取消

每3小时40条消息限制取消了?

与此同时,有外媒报道称,OpenAI已经将GPT-4每3小时40条消息的使用限制,变成了根据供需情况动态调整的灵活配额」。

简单来说就是,OpenAI会根据系统当前的繁忙程度,来增加或减少用户对GPT-4的请求次数。

「视觉版」GPT-4 Turbo重磅升级!ChatGPT 40条消息限制或取消

然而,有不少Reddit网友表示,他们才刚发了10到17条消息,就被告知已经达到了上限。

但也有很「欧」的网友称,自己不管怎么用都没有触及限额。

不管是远低于40条的限制,还是近乎无限次的使用,OpenAI最大的问题在于——不仅从来不会告诉你已经使用的次数,也不会告诉你上限到底是多少。

据推测,这一调整是为了应对ChatGPT在「免注册」之后,显著增加的使用量。

对于OpenAI而言,这种变化提供了更大的灵活性,可以更好地分配有限而昂贵的计算资源给GPT-4。

但对于用户来说,尤其是在需求高峰期,可能用着用着突然就被取消了GPT-4的使用资格……

对此,有不少网友表示:还是Claude 3香!

至少,诸如Anthropic这样的平台,会提供更清晰的使用配额,或者允许按消息计费

文章来自”新智元“,作者 桃子 好困

关联网址

关联标签

文章目录

发评论,每天都得现金奖励!超多礼品等你来拿

后,在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则
暂无评论...