微软推出38亿参数语言模型;Meta VR 之心不死 | AI头条

百家 作者:AI100 2024-04-23 23:23:35

整理 | 王轶群
出品丨AI 科技大本营(ID:rgznai100)

一分钟速览新闻点!

  • 软推出Phi-3,一个在 3.3 万亿个 tokens 上训练的 38 亿参数语言模型

  • Meta 向第三方开放 Meta Horizon OS 的 VR 操作系统

  • 英伟达帮助日本建造混合量子超级计算机

  • 消息人士:拜登政府正在扭转美国公司与阿联酋之间的谈判僵局,包括微软 G42 交易

  • UIUC学者:Agents将大型语言模型与自动化软件相结合,可通过阅读安全公告利用安全漏洞

  • 一季度中国芯片产量同比增涨40%

  • 最高法启动“版权AI智审”试点

全球 AI 要闻

微软推出Phi-3,一个在 3.3 万亿个 tokens 上训练的 38 亿参数语言模型

微软发布最新论文,介绍了其团队引入了 Phi-3-mini。这是一个在 3.3 万亿个 tokens 上训练的 38 亿参数语言模型,从学术基准和内部测试衡量,其整体性能可与 Mixtral 8x7B 和 GPT-3.5 等模型相媲美(例如,Phi -3-mini 在 MMLU 上达到了 69%,在 MT-bench 上达到了 8.38),尽管它足够小,可以部署在手机上。

研究人员写道:“创新完全在于我们的训练数据集,这是用于 Phi-2 的数据集的放大版本,由经过严格过滤的网络数据和合成数据组成。该模型还进一步调整了稳健性、安全性和聊天格式。我们还提供了一些针对 4.8T tokens 训练的 7B 和 14B 模型的初始参数缩放结果,称为 Phi-3-small 和 Phi-3-medium,两者都比 Phi-3-mini 能力更强(例如,分别为 75%) MMLU 上为 78%,MT 基准上为 8.7 和 8.9)。”(arXiv)

论文链接https://arxiv.org/abs/2404.14219

Meta 向第三方开放 Meta Horizon OS 的 VR 操作系统

Meta 向第三方开放其名为 Horizon OS 的 VR 操作系统,并表示华硕和联想都在计划推出与 Meta Horizon OS 兼容的耳机。继上周发布强大的全新开源 AI 模型 Llama 3 之后,Meta 公司如今又带来另一条震撼行业的公告:为 Meta Quest 系列头显(包括最新的 Meta Quest 3)提供支持 Horizon 操作系统将向第三方厂商开放,供其据此构建硬件。该公司在4月22日的博文中表示,正在“向第三方硬件制造商开放为我们 Meta Quest 设备提供支持的操作系统,希望借此给消费者带来更多选择,也为开发者们提供更广泛的构建生态系统。”

英伟达帮助日本建造混合量子超级计算机

Nvidia 将为日本 ABCI-Q 提供软件,这是一款混合超级计算机,可为药物研究和其他用途提供量子计算能力。在东京,日本政府支持的技术研究所将与英伟达合作建造一台混合超级计算机,为研究人员和公司提供量子计算能力。作为国家量子计算计划的一部分,日本产业技术综合研究所正在构建名为 ABCI-Q 的量子人工智能混合云系统。(日经亚洲)

消息人士:拜登政府正在扭转美国公司与阿联酋之间的谈判僵局,包括微软 G42 交易

消息人士称,为了在人工智能交易中寻求相对于中国的优势,拜登政府正在斡旋美国公司与阿联酋之间的谈判,其中包括微软的 G42 交易。4月中旬,微软发布官方博客文章,宣布微软将向总部位于阿联酋的AI公司G42投资15亿美元,获得G42的少数股权和董事会席位。两家公司将共同研发AI产品,并支持建设一个为开发人员提供的10亿美元基金,以提高阿联酋和更广泛地区的AI技能。(英国《金融时报》)

UIUC学者:Agents将大型语言模型与自动化软件相结合,可通过阅读安全公告利用安全漏洞

在一篇新发布的论文中,伊利诺伊大学厄巴纳-香槟分校 (UIUC) 的四位计算机科学家——Richard Fang、Rohan Bindu、Akul Gupta 和 Daniel Kang——报告称 OpenAI 的 GPT-4 大语言模型 (LLM) 可以在真实情况下自主利用漏洞-世界系统,如果获得描述该缺陷的 CVE 公告。

“为了证明这一点,我们收集了 15 个一日漏洞的数据集,其中包括 CVE 描述中被归类为严重严重性的漏洞,”美国作者在论文中解释道。“根据 CVE 描述,GPT-4 能够利用 87% 的漏洞,而我们测试的其他所有模型(GPT-3.5、开源 LLM)和开源漏洞扫描程序(ZAP 和 Metasploit)只能利用 0% ”。“一日漏洞”是指已被披露但尚未修补的漏洞。通过 CVE 描述,该团队指的是由 NIST 共享的带有 CVE 标记的公告,例如CVE-2024-28859 的公告。

测试的不成功模型 – GPT-3.5、OpenHermes-2.5-Mistral-7B、Llama-2 Chat (70B)、LLaMA-2 Chat (13B)、LLaMA-2 Chat (7B)、Mixtral-8x7B Instruct、Mistral (7B) Instruct v0.2、Nous Hermes-2 Yi 34B 和 OpenChat 3.5 ——不包括 GPT-4 的两个主要商业竞争对手,Anthropic 的 Claude 3 和 Google 的 Gemini 1.5 Pro。(arXiv)

论文链接https://arxiv.org/abs/2404.08144

一季度中国芯片产量同比增涨40%

今年第一季度中国芯片总产量同比飙升40%,达到了981亿颗,这表明在先进制程发展受到美国限制之下,中国的成熟制程芯片的产能正在快速扩大。根据国家统计局周二公布的最新数据显示,仅今年3月份,全国集成电路产量就增长了28.4%,达到362亿颗,创历史新高。该机构表示,中国“高科技制造业增长更快”。中国集成电路产量的大幅增长,部分得益于新能源汽车等下游行业的强劲需求。数据显示,一季度全国新能源汽车产量增长29.2%至208万辆。同期智能手机产量增长了 16.7%。(国家统计局)

最高法启动“版权AI智审”试点

4月22日,最高人民法院启动“版权AI智审”试点工作。最高人民法院决定在部分省份法院开展“版权AI智审”试点工作,充分运用数字技术和人工智能提升知识产权司法保护质效,更好发挥著作权审判助力优秀文化传播利用、促进文化产业健康发展的服务保障作用,有力服务和支撑高质量发展。

“版权AI智审”借助“以图搜图”技术和海量数据底池,实现“图片查重”“创新参考”“侵权比对”三大功能,进一步解决涉图片版权案件原创权属认定、相似度比对等难题。(央视新闻)

4 月 25 ~ 26 日,由 CSDN 和高端 IT 咨询和教育平台 Boolan 联合主办的「全球机器学习技术大会」将在上海环球港凯悦酒店举行,特邀近 50 位技术领袖和行业应用专家,与 1000+ 来自电商、金融、汽车、智能制造、通信、工业互联网、医疗、教育等众多行业的精英参会听众,共同探讨人工智能领域的前沿发展和行业最佳实践。欢迎所有开发者朋友访问官网 http://ml-summit.org、点击「阅读原文」或扫码进一步了解详情。

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接