Oracle 23ai作为首个AI原生融合数据库,推出的SELECT AI新特性。它将大语言模型(LLM)与数据库内核深度融合,实现了“自然语言提问→AI自动转SQL→执行查询→结果反馈”的全流程自动化,无需编写一行SQL代码,只需用日常口语化提问,就能快速获取数据库中的精准数据。这一特性不仅降低了数据查询的门槛,更重构了人与数据库的交互方式,让数据查询变得高效、便捷、零门槛。

原生NL2SQL能力:自然语言直接转SQL

  • 只需使用“SELECT AI + 自然语言提问”的格式,即可触发NL2SQL功能,无需记忆复杂参数,上手成本极低;
  • 支持各类常见查询场景,无论是简单的单表查询、多表关联查询,还是复杂的聚合统计、条件筛选、排序分页,都能精准识别意图,生成高效SQL。例如“查上季度华东区销售额Top5的产品及对应销量”“统计各部门员工数量及平均工资”“找出近30天未付款的订单并按金额降序排列”;
  • 支持“仅显示生成的SQL、不执行查询”“用自然语言解释生成的SQL”两种模式,技术人员可快速核查SQL逻辑,确保查询结果的准确性,同时也能借助这一功能学习复杂SQL的编写方式,提升SQL能力。
    实战示例(基础查询):

    1. 直接执行自然语言查询(默认执行生成的SQL)
    SELECT AI '查询2026年第一季度华东区的总销售额';
    2. 仅显示生成的SQL,不执行查询
    SELECT AI showsql '查询各产品类别对应的销量,按销量降序排列';
    3. 用自然语言解释生成的SQL
    SELECT AI explainsql '查询近30天未付款的订单,显示订单号、客户名称和订单金额';
    4. 用自然语言描述查询结果
    SELECT AI narrate '统计各部门员工的平均工资,保留两位小数';

智能元数据感知:精准识别表结构,提升SQL生成准确率

传统NL2SQL工具的核心痛点的在于“无法精准理解数据库元数据”,常常因误解表名、字段名、关联关系,生成错误SQL。而Oracle 23ai SELECT AI内置智能元数据感知能力,能够自动识别数据库中的表结构、字段注释、外键约束、表关联关系,甚至能感知用户添加的Schema注解,大幅提升SQL生成的准确率,避免因元数据理解偏差导致的查询失败。
核心能力细节:

  • 自动识别表/列注释:如果数据表、字段添加了业务注释(如“product_name 产品名称”“sales_amount 销售额(元)”),SELECT AI会自动读取注释信息,理解字段的业务含义,避免将“sales_amount”误解为“销量”;
  • 感知外键与关联约束:自动识别表与表之间的外键关系,生成多表关联查询时,能够精准使用JOIN条件,避免关联错误。例如查询“产品对应的订单数量”,会自动关联产品表与订单表,无需用户手动指定关联字段;
  • 支持Schema注解集成:可通过AI配置文件,将Schema注解纳入LLM的元数据感知范围,进一步提升SQL生成的精准度,尤其适合复杂业务场景下的查询需求;
  • 大Schema自适应:面对包含数百张表的复杂数据库,SELECT AI会自动筛选与用户提问相关的表,减少Token消耗,避免因Schema过于庞大导致的SQL生成延迟或错误,适配企业级复杂数据库场景。
    这一特性的核心价值,在于让SELECT AI能够“懂业务、懂数据”,生成的SQL不仅语法正确,更贴合业务逻辑,无需用户反复修改,大幅提升查询效率。例如,当用户提问“查未付款的客户订单”,SELECT AI会自动识别“订单表”与“客户表”的关联关系,以及“付款状态”字段的含义,生成精准的关联查询SQL,无需用户手动指定表关联条件。

多场景扩展能力:不止于查询,覆盖全流程数据交互

Oracle 23ai SELECT AI并非局限于“查询”这一单一场景,而是围绕数据交互全流程,扩展出多种实用能力,覆盖开发、运维、业务分析等多个场景,成为一站式智能数据交互工具,这也是其区别于传统NL2SQL工具的核心优势之一。
核心扩展能力:

  • RAG原生联动:与Oracle 23ai的原生向量引擎、RAG能力深度集成,能够自动检索向量库中的相关内容,补充到自然语言提问中,减少LLM的“幻觉”,提升查询结果的准确性。例如,当用户提问“某产品的最新定价政策”,SELECT AI会自动检索向量库中相关的文档内容,结合数据库中的定价数据,生成更全面的回答;
  • 对话式交互:支持多轮对话,能够记忆上下文,用户可基于上一轮查询结果,进行追问式查询,无需重复描述背景信息。例如,用户先提问“查上季度各区域销售额”,再追问“华东区的销售额占比是多少”,SELECT AI会自动关联上一轮的查询结果,快速生成占比计算SQL;
  • 合成数据生成:支持通过自然语言提问,生成符合业务规则的合成数据,用于开发测试、场景模拟等场景。例如,“生成100条模拟客户数据,包含客户名称、手机号、所属区域”,SELECT AI会自动生成符合格式要求的合成数据,无需手动编写插入语句;
  • 多语言支持:可接收多语言自然语言提问,生成对应的SQL语句,适配跨国企业、多语言办公场景,结果质量取决于所使用的LLM或嵌入模型的能力;
  • 属性图查询支持:能够基于自然语言,生成属性图查询(PGQ)语句,无需用户掌握PGQ语法,即可查询图数据,适配社交网络、供应链分析等场景。

安全可控与灵活适配:兼顾便捷性与企业级需求

作为企业级数据库的核心特性,SELECT AI在便捷性的基础上,重点强化了安全可控与灵活适配能力,满足企业的数据安全与个性化需求,这也是其能够落地企业生产环境的关键。
核心安全与适配能力:

  • 权限精细化管控:继承Oracle数据库的权限体系,可精准控制用户的SELECT AI使用权限,例如限制某用户只能查询特定表、特定字段,避免敏感数据泄露;同时,可通过AI配置文件,限制表访问范围,仅让LLM考虑配置中列出的表,进一步提升数据安全性;
  • 私有模型集成:支持通过DBMS_CLOUD_AI包,集成自定义LLM模型(如本地部署的Ollama、LLaMA 3),或对接外部AI服务,企业可根据自身安全需求,选择私有部署或公有云模型,确保数据不泄露;
  • 私有端点访问:可将LLM模型部署在企业虚拟云网络(VCN)的私有端点后,实现对生成式AI模型的安全、私有访问,隔离数据库与AI模型服务器,避免公网访问带来的安全风险;
  • 多平台适配:支持在SQL Developer、OML Notebooks及第三方工具中使用,可通过AI关键字直接输入自然语言提示,适配不同用户的使用习惯;同时,支持Python客户端库,可在Python代码中调用SELECT AI能力,适配开发场景;
  • 反馈优化机制:支持用户对生成的SQL及结果进行反馈,帮助优化LLM的SQL生成能力,让SELECT AI越用越精准,贴合企业的业务场景。

Related Posts