酷应用

考试中击败90%的人类！GPT-4发布，网友直呼：进化得太快了

百家作者：新闻日日睇 2023-03-15 22:22:24

ChatGPT的热度还未散去

当地时间3月14日

OpenAI官网发布了更强的GPT-4

堪称“王炸”产品

与ChatGPT所用的模型相比

GPT-4不仅能够处理图像内容

且回复的准确性有所提高

和以前人们印象中“不近人情”的AI相比

GPT-4在图片和文字领域都更“善解人意”

甚至能扮演不同的人格和用户对话

由于仅限于Plus订阅用户使用

当晚，大批新订用户涌入

以至于OpenAI的付款系统被挤爆了

能够处理图片信息
10秒生成一个网站

在官方演示中

GPT-4几乎只花了十秒左右的时间

就识别了手绘网站图片

并根据要求实时生成了网页代码

制作出了几乎与手绘版一样的网站

OpenAI用下面这张图片

演示了GPT-4的推理和识图能力

当模型收到这张照片后

它不仅能辨认出面粉、鸡蛋等元素

还可以迅速给出食谱建议

输入如下图片并询问

“这张图片有什么不寻常之处”

GPT-4可作出回答

“这张照片的不同寻常之处在于，

一名男子正在行驶中的出租车车顶上，

使用熨衣板熨烫衣服。”

除了普通图片

GPT-4还能处理更复杂的图像信息

包括表格、考试题目截图、

论文截图、漫画等

会推理判断
考试能力超过“做题家”

由于有着强大的推理能力

在标准化的技能测试中

GPT-4比起ChatGPT的表现

有了实质性的提升

OpenAI官网称

在模拟美国律师从业资格考试中

ChatGPT的成绩在全体考生中

只能排到末尾10%

而GPT-4能排进前10%

在难度更高的国际生物学奥赛中

GPT-4甚至能吊打99%的人类选手

在“美国高考”SAT中

GPT-4在数学和阅读部分

也能战胜近90%的考生

据OpenAI介绍

在某些情况下

新模型将产生更少的错误答案

更少地偏离谈话轨道

更少地谈论禁忌话题

甚至在许多标准化测试中

比人类表现得更好

会“角色扮演”不同人格

在“情商”方面

GPT-4比起GPT-3.5也提高很多

根据OpenAI的描述

用户能够将ChatGPT

原本固定冗长的语气和风格

改为更适合他们需要的个性化风格

具体来说

用户可以要求模型假扮各种角色

比如电视台进行采访的主持人、

面对老年用户的基金经理等

根据案例展示

GPT-4可以熟练切换语言风格

适应自己的角色定位

比如在和老年人对话时

使用平和缓慢的语气

而在担任经理下达命令时

又采取果断坚决的态度

并不完全可靠
使用语言模型时应格外小心

不过

与早期的GPT模型一样

GPT-4仍然存在一定的局限性

OpenAI称

它并不完全可靠

可能会出现推理错误

“GPT-4缺乏对绝大多数数据切断后（2021年9月）发生的事件的了解，并且无法从中吸取经验教训……它有时会出现简单的推理错误，它会轻信用户明显的虚假陈述，有时它会像人类一样在难题上失败，例如在它生成的代码中引入安全漏洞。”

基于此

OpenAI提醒

用户在使用语言模型时应格外小心

最好辅助以人工审查、附加上下文、

或完全避免在高风险情况下使用它

对于GPT-4的到来

很多网友觉得

这“进化得太快了吧”

也许在并不遥远的未来

一个考试中碾压人类“做题家”、

模仿“霸道总裁”口吻和员工对话

并能精准解读表情包背后小情绪的

强大AI即将诞生

对于人工智能的快速发展

你怎么看？

你希望GPT-4被应用在哪个领域

帮人类解决难题？

欢迎评论区聊聊~

来源：红星新闻、澎湃新闻、每日经济新闻、21世纪经济报道

责编：田德楚

视频推荐：

往期推荐：

20元承包一整天的快乐！广州动物园，藏不住了

没有“五个G”的胃，不敢走进广州的这条路

广州这些“花路”，刷屏了！

广州这条街，为什么男人们这么爱逛？

关注公众号：拾黑（shiheibook）了解更多

[广告]赞助链接：

*文章为作者独立观点，不代表爱尖刀立场

本文由新闻日日睇发表，转载此文章须经作者同意，并请附上出处( 爱尖刀 )及本页链接。

原文链接 https://www.ijiandao.com/2b/baijia/455135.html

图库

新闻日日睇

关注网络尖刀微信公众号
随时掌握互联网精彩

赞助链接

百度热搜榜

排名热点搜索指数