谷歌“复仇者联盟”出击!集结 26 位技术大拿、号称“比 GPT-4 强”的 AI 王炸即将来袭?

百家 作者:CSDN 2023-08-21 11:24:46

整理 | 朱珂欣   
出品 | CSDN程序人生(ID:coder_life)

在 AI 拉锯战上,谷歌的口令一直是:「咱不能输」。

如今,谷歌带着它的“复仇者联盟”,向 OpenAI 全军出击!

据外媒报道,谷歌正在马不停蹄地赶工中,准备在今年秋天发布迄今为止可能是大模型界的阿尔法级别产品:Gemini。


蓄力多时,“复仇者联盟”集结多位干将


毋庸置疑,ChatGPT 珠玉在前,谷歌想要展开正面交锋,得有点绝杀才有说服力。

万众期待之下,几个月来,谷歌一直蓄势待发。

4 月,谷歌将深度学习人工智能研究部门 Google Brain 与子公司 DeepMind 合并,成立 Google DeepMind。一切旨在提高效率,将谷歌庞大的计算资源和 DeepMind 的研究技能结合起来。

5 月,在谷歌举行的 I/O 2023 大会上,谷歌就指出,Gemini 目前正在接受训练,一旦经过微调,它就会像 PaLM 2 一样「以不同的规模和能力」面世。 

6 月,谷歌的 Gemini 被爆由谷歌最强 AI 团队 Google DeepMind 倾力打造。那时,谷歌就声称:“这个 AI 系统将谷歌背后的技术与大型语言模型相结合。 该系统具有新的功能,例如规划或解决问题,比 OpenAI 的 GPT-4 更强大”。

随后的日子,谷歌将数百位工程师的集结于此,只为在今年秋天用 Gemini 扳回一局。

据 The Information 报道,为了应战,谷歌联合创始人 Sergey Brin 甚至亲自参与 Gemini 项目开发,并对模型进行评估。

从“复仇者联盟”版图来看,由 Google Brain 和 DeepMind 公司的前主管共同管理监督 Gemini 的大部分小组。目前,已曝光的名单中,至少有 26 名技术大拿正参与开发。

此外,Gemini 将团队划分为约 10 个小组,分别负责预训练、数据、基础设施、模型微调、模型评估、代码库、多模态、强化学习、工具使用以及人工标注数据。


杀手锏来袭:文本能力+文生图能力


众所周知,两个月前,谷歌 DeepMind 首席执行官 Demis Hassabis 放下狠话:Gemini 将成为能「媲美」 ChatGPT 的聊天机器人!

如今,需要划重点的来了。
据知情人士透露,谷歌意图将 Gemini 模型打造成一款「文本生成功能」与「文生图功能」相结合的多模态产品。
简单来说,除了像 GPT-4 大型语言模型一样理解并生成对话文本,还能像 Midjourney 一样生成图像。
此外,还提及了 Gemini 的一些其他功能,例如如分析图表、创建带有文字描述的图形,甚至使用文字或语音指令控制软件。


YouTube 视频数据库的「锦上添花」


值得一提的是,Gemini 坐拥强大能力的背后,离不开庞大的训练数据支撑。
而恰巧谷歌拥有大量的资源,尤其是在可用于训练 AI 模型的数据上,占据绝对优势。
例如,谷歌可以访问 YouTube 视频、Google 图书、庞大的搜索索引以及 Google Scholar 的学术材料。其中,大部分数据都是谷歌「独家」。
据 The Information 早前的报道,谷歌自家的视频平台 YouTube 更是为 Gemini 的训练有素,作出了帮衬。
通过使用 YouTube 视频副本来训练 Gemini,由此将音频与视频集成到 Gemini 中,使其具备多模态能力。
例如,通过 YouTube 视频训练出的模型可以辅助工程师根据视频诊断汽车维修问题、根据用户想创建的网站或应用程序的草图来生成软件代码等。
据 Global Media Insight 估计, YouTube 上至少有 8 亿个视频
目前,为保证自己在这场 AI 军备竞赛中占据绝对优势,谷歌公司的律师也在持续密切关注 Gemini 使用的训练数据材料,以防侵犯版权。

网友:“ChatGPT 统治的终结?”


若 Gemini 的愿景实现,这款集合了“ ChatGPT + Midjourney/Dall-E + Microsoft 365 Copilot ”的大模型,很有可能将直接带着谷歌逆风翻盘。
这场将在秋日由 Gemini 拉开的正面交锋,也引发了不少业内人士的讨论
谷歌前高管、风险投资公司 Felicis Ventures 的创始人 Aydin Senkut 极度认可:“这是正确的方向。相信最终,谷歌会成功的!”
彭博社风投分支 Bloomberg Beta 的 AI 初创企业投资人 James Cham 表示:“这将是有模型能与 GPT-4 旗鼓相当的第一个迹象。我认为,在过去的九个月中,也许每个人都在问:什么时候才会有人能赶上 OpenAI?”
除此之外,不少网友也展开了热情讨论:
  • “Gemini 项目的合并过程并不容易,涉及到两个独立团队的磨合”;
  • “我还记得 Bard 的‘翻车’事件,希望 Gemini 能改写历史”;
  • “ChatGPT 统治的终结?”
  • “Gemini 的成败可能决定谷歌未来能否保持其在 AI 技术领域的领先地位”……
立秋已过,接下来让我们一起期待谷歌的秋季发布会吧。

参考链接:

https://www.gizchina.com/2023/08/16/google-gemini-ai-artificial-intelligence/

https://indianexpress.com/article/technology/artificial-intelligence/google-gemini-ai-fall-launch-chatgpt-edge-8896455/

https://www.theinformation.com/articles/the-forced-marriage-at-the-heart-of-googles-ai-race

推荐阅读:

系统时间随机跳到 55 天后,程序出 Bug,开发者:这是 Windows 系统功能搞得鬼!

前华为天才少年稚晖君创业6个月造出人形机器人,百亿参数大模型加持、目标成本20万元以内

“从未写过一行代码的我,刚刚通过了谷歌系统设计面试!”

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接