考试中击败90%的人类!GPT-4发布,网友直呼:进化得太快了

ChatGPT的热度还未散去
当地时间3月14日
OpenAI官网发布了更强的GPT-4
堪称“王炸”产品

与ChatGPT所用的模型相比
GPT-4不仅能够处理图像内容
且回复的准确性有所提高
和以前人们印象中“不近人情”的AI相比
GPT-4在图片和文字领域都更“善解人意”
甚至能扮演不同的人格和用户对话
由于仅限于Plus订阅用户使用
当晚,大批新订用户涌入
以至于OpenAI的付款系统被挤爆了
10秒生成一个网站
在官方演示中
GPT-4几乎只花了十秒左右的时间
就识别了手绘网站图片
并根据要求实时生成了网页代码
制作出了几乎与手绘版一样的网站


OpenAI用下面这张图片
演示了GPT-4的推理和识图能力

当模型收到这张照片后
它不仅能辨认出面粉、鸡蛋等元素
还可以迅速给出食谱建议

输入如下图片并询问
“这张图片有什么不寻常之处”
GPT-4可作出回答
“这张照片的不同寻常之处在于,
一名男子正在行驶中的出租车车顶上,
使用熨衣板熨烫衣服。”

除了普通图片
GPT-4还能处理更复杂的图像信息
包括表格、考试题目截图、
论文截图、漫画等
会推理判断
考试能力超过“做题家”
由于有着强大的推理能力
在标准化的技能测试中
GPT-4比起ChatGPT的表现
有了实质性的提升
OpenAI官网称
在模拟美国律师从业资格考试中
ChatGPT的成绩在全体考生中
只能排到末尾10%
而GPT-4能排进前10%
在难度更高的国际生物学奥赛中
GPT-4甚至能吊打99%的人类选手
在“美国高考”SAT中
GPT-4在数学和阅读部分
也能战胜近90%的考生
据OpenAI介绍
在某些情况下
新模型将产生更少的错误答案
更少地偏离谈话轨道
更少地谈论禁忌话题
甚至在许多标准化测试中
比人类表现得更好
在“情商”方面
GPT-4比起GPT-3.5也提高很多
根据OpenAI的描述
用户能够将ChatGPT
原本固定冗长的语气和风格
改为更适合他们需要的个性化风格
具体来说
用户可以要求模型假扮各种角色
比如电视台进行采访的主持人、
面对老年用户的基金经理等
根据案例展示
GPT-4可以熟练切换语言风格
适应自己的角色定位
比如在和老年人对话时
使用平和缓慢的语气
而在担任经理下达命令时
又采取果断坚决的态度
并不完全可靠
使用语言模型时应格外小心
不过
与早期的GPT模型一样
GPT-4仍然存在一定的局限性
OpenAI称
它并不完全可靠
可能会出现推理错误
“GPT-4缺乏对绝大多数数据切断后(2021年9月)发生的事件的了解,并且无法从中吸取经验教训……它有时会出现简单的推理错误,它会轻信用户明显的虚假陈述,有时它会像人类一样在难题上失败,例如在它生成的代码中引入安全漏洞。”
基于此
OpenAI提醒
用户在使用语言模型时应格外小心
最好辅助以人工审查、附加上下文、
或完全避免在高风险情况下使用它
对于GPT-4的到来
很多网友觉得
这“进化得太快了吧”




也许在并不遥远的未来
一个考试中碾压人类“做题家”、
模仿“霸道总裁”口吻和员工对话
并能精准解读表情包背后小情绪的
强大AI即将诞生
对于人工智能的快速发展
你怎么看?
你希望GPT-4被应用在哪个领域
帮人类解决难题?
欢迎评论区聊聊~



关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号随时掌握互联网精彩
- 1 潮涌海之南 开放风正劲 7904037
- 2 火箭军一等功营宿舍没有“豆腐块” 7809704
- 3 中方回应马克龙涉华表态 7712463
- 4 海南封关开放大幕拉开 谁的机会来了 7619361
- 5 中央戏剧学院院长郝戎被查 7521038
- 6 张小泉集团名下迈巴赫被38万元拍卖 7425314
- 7 6人编造传播“杀人”谣言被查处 7332684
- 8 中方出面调停 柬泰表示欢迎 7236070
- 9 七旬奶奶练出“少女背” 7139922
- 10 大雾+大风+暴雪!中央气象台发预警 7041559

![小花夕-大西北茶卡盐湖之旅[熊猫] ](https://imgs.knowsafe.com:8087/img/aideep/2022/4/5/d1ff9ebeed45a7b4a05a139611cd4393.jpg?w=250)





新闻日日睇
