考试中击败90%的人类!GPT-4发布,网友直呼:进化得太快了
ChatGPT的热度还未散去
当地时间3月14日
OpenAI官网发布了更强的GPT-4
堪称“王炸”产品
与ChatGPT所用的模型相比
GPT-4不仅能够处理图像内容
且回复的准确性有所提高
和以前人们印象中“不近人情”的AI相比
GPT-4在图片和文字领域都更“善解人意”
甚至能扮演不同的人格和用户对话
由于仅限于Plus订阅用户使用
当晚,大批新订用户涌入
以至于OpenAI的付款系统被挤爆了
10秒生成一个网站
在官方演示中
GPT-4几乎只花了十秒左右的时间
就识别了手绘网站图片
并根据要求实时生成了网页代码
制作出了几乎与手绘版一样的网站
OpenAI用下面这张图片
演示了GPT-4的推理和识图能力
当模型收到这张照片后
它不仅能辨认出面粉、鸡蛋等元素
还可以迅速给出食谱建议
输入如下图片并询问
“这张图片有什么不寻常之处”
GPT-4可作出回答
“这张照片的不同寻常之处在于,
一名男子正在行驶中的出租车车顶上,
使用熨衣板熨烫衣服。”
除了普通图片
GPT-4还能处理更复杂的图像信息
包括表格、考试题目截图、
论文截图、漫画等
会推理判断
考试能力超过“做题家”
由于有着强大的推理能力
在标准化的技能测试中
GPT-4比起ChatGPT的表现
有了实质性的提升
OpenAI官网称
在模拟美国律师从业资格考试中
ChatGPT的成绩在全体考生中
只能排到末尾10%
而GPT-4能排进前10%
在难度更高的国际生物学奥赛中
GPT-4甚至能吊打99%的人类选手
在“美国高考”SAT中
GPT-4在数学和阅读部分
也能战胜近90%的考生
据OpenAI介绍
在某些情况下
新模型将产生更少的错误答案
更少地偏离谈话轨道
更少地谈论禁忌话题
甚至在许多标准化测试中
比人类表现得更好
在“情商”方面
GPT-4比起GPT-3.5也提高很多
根据OpenAI的描述
用户能够将ChatGPT
原本固定冗长的语气和风格
改为更适合他们需要的个性化风格
具体来说
用户可以要求模型假扮各种角色
比如电视台进行采访的主持人、
面对老年用户的基金经理等
根据案例展示
GPT-4可以熟练切换语言风格
适应自己的角色定位
比如在和老年人对话时
使用平和缓慢的语气
而在担任经理下达命令时
又采取果断坚决的态度
并不完全可靠
使用语言模型时应格外小心
不过
与早期的GPT模型一样
GPT-4仍然存在一定的局限性
OpenAI称
它并不完全可靠
可能会出现推理错误
“GPT-4缺乏对绝大多数数据切断后(2021年9月)发生的事件的了解,并且无法从中吸取经验教训……它有时会出现简单的推理错误,它会轻信用户明显的虚假陈述,有时它会像人类一样在难题上失败,例如在它生成的代码中引入安全漏洞。”
基于此
OpenAI提醒
用户在使用语言模型时应格外小心
最好辅助以人工审查、附加上下文、
或完全避免在高风险情况下使用它
对于GPT-4的到来
很多网友觉得
这“进化得太快了吧”
也许在并不遥远的未来
一个考试中碾压人类“做题家”、
模仿“霸道总裁”口吻和员工对话
并能精准解读表情包背后小情绪的
强大AI即将诞生
对于人工智能的快速发展
你怎么看?
你希望GPT-4被应用在哪个领域
帮人类解决难题?
欢迎评论区聊聊~
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
随时掌握互联网精彩
- 1 古城老街蕴文脉 7982639
- 2 小孩引爆沼气家长付天价赔偿系谣言 7987818
- 3 正月初五为啥又叫破五 7831315
- 4 来看N种过年新玩法 7705564
- 5 NBA重磅交易!东契奇浓眉互换东家 7642225
- 6 岳云鹏回老家过年 弟弟罕见露面 7508059
- 7 美宣布对中国商品加征10%关税 7471783
- 8 网友路遇罕见白鹿如画中走出 7346922
- 9 饺子导演肉眼可见的变老 7280270
- 10 行在路上奔团圆 非遗民俗贺新春 7169973