后浪云OceanBase教程:OceanBase SUBPLAN FILTER

SUBPLAN FILTER 算子用于驱动表达式中的子查询执行。

OceanBase 数据库以 NESTED-LOOP 算法执行 SUBPLAN FILTER 算子,执行时左边取一行数据,然后执行右边的子计划。SUBPLAN FILTER 算子可以驱动相关子查询和非相关子查询计算,并且两种执行方式不同。

驱动非相关子查询计算

示例 1:SUBPLAN FILTER 算子驱动非相关子查询计算


obclient>CREATE TABLE t1(c1 INT, c2 INT);
Query OK, 0 rows affected (0.09 sec)

obclient>CREATE TABLE t2(c1 INT, c2 INT);
Query OK, 0 rows affected (0.09 sec)

obclient>EXPLAIN SELECT /*+NO_REWRITE*/c1 FROM t1 WHERE 
        c2 > (SELECT MAX(c2) FROM t2)\G;
*************************** 1. row ***************************
Query Plan: 
| ===========================================
|ID|OPERATOR        |NAME|EST. ROWS|COST  |
-------------------------------------------
|0 |SUBPLAN FILTER  |    |33334    |167652|
|1 | TABLE SCAN     |T1  |100000   |68478 |
|2 | SCALAR GROUP BY|    |1        |85373 |
|3 |  TABLE SCAN    |T2  |100000   |66272 |
===========================================
Outputs & filters: 
-------------------------------------
  0 - output([T1.C1]), filter(nil), 
      exec_params_(nil), onetime_exprs_([subquery(1)]), init_plan_idxs_(nil)
  1 - output([T1.C1]), filter([T1.C2 > ?]), 
      access([T1.C2], [T1.C1]), partitions(p0)
  2 - output([T_FUN_MAX(T2.C2)]), filter(nil), 
      group(nil), agg_func([T_FUN_MAX(T2.C2)])
  3 - output([T2.C2]), filter(nil), 
      access([T2.C2]), partitions(p0)

上述示例中,执行计划展示中 0 号算子 SUBPLAN FILTER 驱动右边 SCALAR GROUP BY 子计划执行,outputs & filters 详细列出了 SUBPLAN FILTER 算子的输出信息如下:

信息名称

含义

output

该算子输出的列。

filter

该算子上的过滤条件。

由于示例中的 SUBPLAN FILTER 算子没有设置 filter,所以为 nil。

exec_params_

右子计划依赖左子计划的参数,执行期由SUBPLAN FILTER 从左子计划中获取,传递给右子计划执行。

由于示例中 SUBPLAN FILTER 算子驱动非相关子查询没有涉及该参数,所以为 nil。

onetime_exprs_

计划中只计算一次的表达式,如果右子计划是非相关子查询,每次重复执行的结果都是一样的,所以执行一次后保存在参数集合中。

每次执行 SUBPLAN FILTER 时,可以直接从参数集获取右子计划的执行结果。参数 subquery(1) 表示 SUBPLAN FILTER 右边第一个子计划是 onetime expr。

init_plan_ids_

该算子中只需要执行一次的子计划。

它与 onetime_exprs_ 的区别是,init_plan_返回多行多列,onetime_expr_ 返回单行单列。

由于示例中的 SQL 查询未设置此项,所以为 nil。

SUBPLAN FILTER 算子驱动非相关子查询计算的一般执行流程如下:

  1. SUBPLAN FILTER 在启动时会执行 onetime_exprs_。

  2. 从参数中拿到右边非相关子查询的结果,下推 filter 到左边计划,执行左边的查询。

  3. 输出左边查询的行。

驱动相关子查询计算

示例 2:SUBPLAN FILTER 算子驱动相关子查询计算


obclient>EXPLAIN SELECT /*+NO_REWRITE*/c1 FROM t1 WHERE c2 > (SELECT 
                MAX(c2) FROM t2 WHERE t1.c1=t2.c1)\G;
*************************** 1. row ***************************
Query Plan: 
| ===============================================
|ID|OPERATOR        |NAME|EST. ROWS|COST      |
-----------------------------------------------
|0 |SUBPLAN FILTER  |    |33334    |8541203533|
|1 | TABLE SCAN     |T1  |100000   |68478     |
|2 | SCALAR GROUP BY|    |1        |85412     |
|3 |  TABLE SCAN    |T2  |990      |85222     |
===============================================
Outputs & filters: 
-------------------------------------
  0 - output([T1.C1]), filter([T1.C2 > subquery(1)]), 
      exec_params_([T1.C1]), onetime_exprs_(nil), init_plan_idxs_(nil)
  1 - output([T1.C1], [T1.C2]), filter(nil), 
      access([T1.C1], [T1.C2]), partitions(p0)
  2 - output([T_FUN_MAX(T2.C2)]), filter(nil), 
      group(nil), agg_func([T_FUN_MAX(T2.C2)])
  3 - output([T2.C2]), filter([? = T2.C1]), 
      access([T2.C1], [T2.C2]), partitions(p0)

上述示例中,执行计划展示中 0 号算子 SUBPLAN FILTER 驱动右边 SCALAR GROUP BY 子计划执行,outputs & filters 详细列出了 SUBPLAN FILTER 算子的输出信息如下:

信息名称

含义

output

该算子输出的列。

filter

该算子上的过滤条件。

例如,示例 2 中的 SQL 查询过滤条件为 t1.c2 > subquery(1)

exec_params_

右子计划依赖左子计划的参数,执行期由SUBPLAN FILTER 从左子计划中获取,传递给右子计划执行。

左边输出一行数据后需要下推的参数,在非相关子查询中一般没有下推的参数。

onetime_exprs_

计划中只计算一次的表达式,如果右子计划是非相关子查询,每次重复执行的结果都是一样的,所以执行一次后保存在参数集合中。

每次执行 SUBPLAN FILTER 时,可以直接从参数集获取右子计划的执行结果。参数 subquery(1) 表示 SUBPLAN FILTER 右边第一个子计划是 onetime expr。

由于示例中的 SQL 查询未设置此项,所以为 nil。

init_plan_idxs_

该算子中只需要执行一次的子计划。

与 onetime_exprs_ 的区别是,init_plan_返回多行多列,onetime_expr_ 返回单行单列。

由于示例中的 SQL 查询未设置此项,所以为 nil。

SUBPLAN FILTER 算子驱动相关子查询计算的一般执行流程如下:

  1. SUBPLAN FILTER 在启动时会执行 onetime_exprs_

  2. 执行左边的查询,输出一行后,计算相关参数,下推到右边,执行右边的子查询。

  3. 执行 filter,输出符合条件的数据行。

文章来源网络,作者:管理,如若转载,请注明出处:https://shuyeidc.com/wp/305934.html<

(0)
管理的头像管理
上一篇2025-05-26 10:23
下一篇 2025-05-26 10:24

相关推荐

  • 骨干网络体系结构能干什么?骨干网络体系结构的作用

    骨干网络体系结构是现代信息社会的“超级高速公路网”,它通过分层设计、冗余备份和智能调度,确保海量数据在全球范围内高速、稳定、安全地传输,是支撑云计算、物联网及人工智能应用的底层基石,想象一下,如果你把互联网比作一个巨大的城市交通系统,那么骨干网络就是连接各个城市的主干道和立交桥,没有它,你的每一次微信发送、每一……

    2026-06-18
    0
  • 高io数据库可以干什么用?高io数据库适合什么场景

    高IO数据库的核心价值在于通过极高的读写吞吐量,解决海量数据场景下的性能瓶颈,是支撑高并发交易、实时分析及大规模内容分发的关键基础设施,在数字化转型的深水区,数据不再仅仅是静态的记录,而是流动的资产,传统的机械硬盘或普通SSD早已无法满足现代应用对速度的极致追求,高IO(Input/Output)数据库,就是那……

    2026-06-18
    0
  • 高io服务器性能如何?高io服务器适合什么场景

    高IO服务器并非单纯指代某种硬件,而是指在随机读写、高并发连接及小文件处理场景下,具备极致IOPS(每秒输入输出操作次数)和低延迟特性的计算资源,它是支撑现代高并发应用稳定运行的核心基石,在2026年的数字化浪潮中,业务负载早已从简单的静态页面展示演变为复杂的实时数据处理,许多开发者在排查系统瓶颈时,往往忽略了……

    2026-06-18
    0
  • 隔离网络空间哪里便宜?国内隔离网络空间价格

    隔离网络空间并没有统一的“便宜”标准,其成本高度取决于物理隔离等级、带宽需求及安全合规要求,通常物理网闸方案初期投入较高但长期运维成本低,而逻辑隔离方案虽初期便宜但存在潜在安全风险,建议根据业务敏感度选择混合隔离架构以平衡成本与安全,在数字化时代,企业构建独立网络环境的需求日益增长,但“隔离网络空间哪里便宜”这……

    2026-06-18
    0
  • 骨干网络体系结构设备为何故障?常见原因有哪些

    骨干网络体系结构设备故障的核心原因通常归结为硬件老化、配置错误、物理链路中断及外部攻击四大类,其中电源模块失效与光模块性能衰减是占比最高的隐性故障源,骨干网作为数字经济的“大动脉”,其稳定性直接关乎国计民生,当核心路由器或交换机出现丢包、震荡甚至宕机时,运维人员往往面临巨大的压力,很多人第一反应是检查软件配置……

    2026-06-18
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注