考试中击败90%的人类!GPT-4发布,网友直呼:进化得太快了

百家 作者:新闻日日睇 2023-03-15 22:22:24

ChatGPT的热度还未散去

当地时间3月14日

OpenAI官网发布了更强的GPT-4

堪称“王炸”产品



与ChatGPT所用的模型相比

GPT-4不仅能够处理图像内容

且回复的准确性有所提高

和以前人们印象中“不近人情”的AI相比

GPT-4在图片和文字领域都更“善解人意”

甚至能扮演不同的人格和用户对话

由于仅限于Plus订阅用户使用

当晚,大批新订用户涌入

以至于OpenAI的付款系统被挤爆了



能够处理图片信息
10秒生成一个网站


在官方演示中

GPT-4几乎只花了十秒左右的时间

就识别了手绘网站图片

并根据要求实时生成了网页代码

制作出了几乎与手绘版一样的网站



OpenAI用下面这张图片

演示了GPT-4的推理和识图能力



当模型收到这张照片后

它不仅能辨认出面粉、鸡蛋等元素

还可以迅速给出食谱建议


输入如下图片并询问

“这张图片有什么不寻常之处”

GPT-4可作出回答

“这张照片的不同寻常之处在于,

一名男子正在行驶中的出租车车顶上,

使用熨衣板熨烫衣服。”



除了普通图片

GPT-4还能处理更复杂的图像信息

包括表格、考试题目截图、

论文截图、漫画等



会推理判断
考试能力超过“做题家”


由于有着强大的推理能力

在标准化的技能测试中

GPT-4比起ChatGPT的表现

有了实质性的提升


OpenAI官网称

在模拟美国律师从业资格考试中

ChatGPT的成绩在全体考生中

只能排到末尾10%

而GPT-4能排进前10%


在难度更高的国际生物学奥赛中

GPT-4甚至能吊打99%的人类选手

在“美国高考”SAT中

GPT-4在数学和阅读部分

也能战胜近90%的考生


据OpenAI介绍

在某些情况下

新模型将产生更少的错误答案

更少地偏离谈话轨道

更少地谈论禁忌话题

甚至在许多标准化测试中

比人类表现得更好



会“角色扮演”不同人格


在“情商”方面

GPT-4比起GPT-3.5也提高很多

根据OpenAI的描述

用户能够将ChatGPT

原本固定冗长的语气和风格

改为更适合他们需要的个性化风格


具体来说

用户可以要求模型假扮各种角色

比如电视台进行采访的主持人、

面对老年用户的基金经理等

根据案例展示

GPT-4可以熟练切换语言风格

适应自己的角色定位

比如在和老年人对话时

使用平和缓慢的语气

而在担任经理下达命令时

又采取果断坚决的态度



并不完全可靠
使用语言模型时应格外小心


不过

与早期的GPT模型一样

GPT-4仍然存在一定的局限性

OpenAI称

它并不完全可靠

可能会出现推理错误 

“GPT-4缺乏对绝大多数数据切断后(2021年9月)发生的事件的了解,并且无法从中吸取经验教训……它有时会出现简单的推理错误,它会轻信用户明显的虚假陈述,有时它会像人类一样在难题上失败,例如在它生成的代码中引入安全漏洞。”

基于此

OpenAI提醒

用户在使用语言模型时应格外小心

最好辅助以人工审查、附加上下文、

或完全避免在高风险情况下使用它




对于GPT-4的到来

很多网友觉得

这“进化得太快了吧”



也许在并不遥远的未来

一个考试中碾压人类“做题家”、

模仿“霸道总裁”口吻和员工对话

并能精准解读表情包背后小情绪的

强大AI即将诞生


对于人工智能的快速发展

你怎么看?

你希望GPT-4被应用在哪个领域

帮人类解决难题?

欢迎评论区聊聊~





来源:红星新闻、澎湃新闻、每日经济新闻、21世纪经济报道
责编:田德楚

视频推荐:
往期推荐:

20元承包一整天的快乐!广州动物园,藏不住了



没有“五个G”的胃,不敢走进广州的这条路



广州这些“花路”,刷屏了!




广州这条街,为什么男人们这么爱逛?

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接