Gemini-SQL2 – 谷歌推出的文本转 SQL 任务 AI 模型

动态 来源:AI工具集 2026-06-16 11:57:18

Gemini-SQL2是什么

Gemini-SQL2是Google Research最新推出的AI模型 ,是基于 Gemini 3.1 Pro ,具备最顶尖的 Text-to-SQL 能力模型在 BIRD 基准单模型赛道用 80.04% 执行准确率登顶,将自然语言直接转化为可执行 SQL 查询,无需手写数据库语句。

Gemini-SQL2的主要功能

  • 自然语言转 SQL:用户用口语描述数据需求,系统自动生成可运行的 SQL 查询。
  • 复杂查询理解:支持多表关联、聚合计算、嵌套查询等高级 SQL 结构生成。
  • 业务自助分析:业务人员可直接查询营收、流失率、区域表现等经营指标。
  • 跨领域适配:覆盖 37 个专业领域的数据库语义理解。

Gemini-SQL2的技术原理

  • 大模型底座优化:模型以 Gemini 3.1 Pro 为基础模型,通过专项后训练提升 SQL 语法与数据库 schema 理解能力。
  • BIRD 基准对齐:针对包含脏数据、外部知识需求的 95 个真实数据库环境进行优化,提升执行准确率非仅文本匹配。
  • 执行验证机制:模型生成的 SQL 需通过真实数据库执行验证,确保结果可运行且语义正确。

如何使用Gemini-SQL2

等待谷歌后续公布 API 接口或产品接入方式。

Gemini-SQL2的核心优势

  • 准确率行业领先:BIRD 单模型赛道执行准确率达 80.04%,超越前代 Gemini-SQL 及所有竞品。

  • 真实场景适配:针对含脏数据、多领域知识的真实企业数据库环境优化,非理想化基准测试。

  • 降低技术门槛:业务人员无需掌握 SQL 语法,直接用自然语言完成复杂数据分析。

  • 底座模型强劲:基于 Gemini 3.1 Pro,继承其长上下文与推理能力,支持复杂 schema 理解。

Gemini-SQL2的同类竞品对比

维度Gemini-SQL2XiYan-SQL
开发机构Google Research蚂蚁集团 / 阿里巴巴
BIRD 执行准确率80.04%(单模型)75.63%(多生成器集成框架)
技术路线单模型专项后训练(Gemini 3.1 Pro)多生成器集成框架(ICL + SFT + 选择模型)
开源情况闭源,无 API/模型卡/技术报告开源,GitHub 仓库 + 模型权重 + 训练框架
自研模型无(依赖 Gemini 3.1 Pro)XiYanSQL-QwenCoder 系列(3B/7B/14B/32B)
单模型成绩80.04%69.03%(32B 微调模型)
Schema 表示未公开独创 M-Schema 半结构化表示法

Gemini-SQL2的应用场景

  • 自助式 BI 分析:业务人员用自然语言查询报表,无需依赖数据分析师写 SQL。
  • SaaS 数据问答:在 CRM、ERP 等系统中嵌入自然语言查询接口,降低使用门槛。
  • 数据治理与审计:模型支持快速生成复杂查询语句,辅助排查数据异常与合规审查。
  • 智能客服与搜索:支持企业内部知识库的结构化数据检索与问答。

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接