DB2 V9.7 索引压缩的概念与正确启用索引压缩

文章主要描述的是DB2 V9.7 索引压缩的新特性正确使用,DB2 V9.1 数据库提出了行压缩技术,当我们的系统中数据量很大,IO 需求超过了磁盘系统提供的容量(即 IO 成为系统的瓶颈)时,行压缩技术能够有效的减少读写磁盘的次数。

DB2 9.7 更进一步提出了索引压缩技术,减少索引磁盘空间的占用,减少读取索引时的 IO 次数从而提高了性能。

DB2 压缩不仅有助于减少在线数据库存储区需求,还有助于减少在备份和灾难恢复时所需的存储器数量。此外,由于在备份与恢复过程中涉及到的数据量变小了,所以备份与恢复操作所花的时间也就变短了。所有这些因素都在无形中节约了 IT 成本。

简介

数据库中占用物理存储空间的对象主要是表和索引,这两类对象的大小直接影响着磁盘空间的占用,同时也决定着数据库的性能。当前数据库系统中,随着时间的推移表会越来越大,对应着索引也会越来越大,这也是我们的系统越来越慢的原因。

DB2 V9.1 中提出了全新的行深度压缩(deep compression)的技术,以应对这种挑战。尽管深度压缩的主要目的是节省存储空间,但是使用它也可以大大节省磁盘 I/O 并提高缓冲池命中率。因而可以提高性能,并无需成本——数据压缩和解压缩需要占用额外的 CPU 周期。深度压缩的存储节省和性能影响与数据、数据库本身的设计、数据库调优程度以及应用程序负载有关。

在 DB2 V9.7,IBM 在行压缩的基础上提出了DB2 V9.7 索引压缩,其目标与行压缩一样,都是为减少磁盘空间的占用,这同时适用于大型 OLTP 和数据仓库环境。 DB2 V9.7 采用多种压缩算法对索引进行自动压缩。本文不会对具体的压缩算法进行讨论,而是将重点放在索引压缩的应用场景上,即如何启动索引压缩、什么数据分布适合索引压缩,什么数据不适合索引压缩。

如何启用索引压缩

在缺省情况下,当对表启动压缩后,索引压缩也处在启动状态。对于未压缩的表索引压缩处于禁用状态,我们可以使用 CREATE INDEX 语句的 COMPRESS YES 选项可以更改此缺省行为。创建索引之后,我们还可以使用 ALTER INDEX 语句来启用或禁用索引压缩功能;然后,必须执行 INDEX REORG 以重建索引。

启用索引压缩功能后,DB2 将根据数据库管理器所选择的压缩算法对索引页在磁盘上和内存中的格式进行修改,以便最大程度地减少存储空间耗用量。根据所创建索引类型以及索引所包含数据的不同,DB2 实现的压缩程度也会有所变化。

例如,通过存储重复键的记录标识(RID)的缩写格式,数据库管理器可以对包含大量重复键的索引进行压缩。在索引键前缀的公共程度很高的索引中,数据库管理器可以根据索引键前缀的相似性来进行压缩。

索引压缩是使用 CPU 的空闲周期或者是 CPU 在等待 IO 时的周期对索引数据进行压缩、解压缩的。因此在带来 IO 成本节约的同时,索引压缩技术增加了系统的 CPU 负担,如果我们的系统不受到 CPU 的约束,我们在对数据进行 Select、Insert、Update 时都能感觉到DB2 V9.7 索引压缩技术带来的性能提升。如果我们的系统本身 CPU 就已经比较繁忙了,再启用索引压缩可能会带来一些负面影响。

清单 1. 创建表时指定表压缩

 

 

  1. db2 "create table t1 (col1 int) compress yes"   
  2. db2 "create index idx_col1 on t1(col1) "   
  3. db2 "select substr(INDNAME,1,18),substr(TABNAME,1,18),COMPRESSION,PCTPAGESSAVED   
  4. from syscat.indexes where tabname='T1'"   
  5. 1 2   
  6. COMPRESSION PCTPAGESSAVED   
  7. IDX_COL1 T1 Y -1   

上面的语句中首先创建了一张表 T1,并对该表启动行压缩。在创建索引 idx_col1 时,由于基表启动了压缩,DB2 V9.7 索引压缩也被自动启动。上述代码的第三句就是验证索引 idx_col1 确实启动了压缩,而由于未收集统计信息因此当前压缩比例是 -1 。当我们向表中 Insert 或者 Update 数据时,索引自动被压缩维护到物理存储上。

 

如果我们在创建表时未指定表进行压缩,那么此表上创建的索引默认情况下是不压缩的,如果期望对索引进行压缩需要进行以下步骤。

  1. db2 "create table t2 (col1 int)   
  2. db2 "create index idx_col2 on t2(col1) "   
  3. db2 "select substr(INDNAME,1,18),substr(TABNAME,1,18),COMPRESSION,PCTPAGESSAVED   
  4. from syscat.indexes where tabname='T2'"   
  5. 1 2 COMPRESSION PCTPAGESSAVED   
  6. IDX_COL2 T2 N   
  7. -1   
  8. db2 "alter index idx_col2 compress yes"   
  9. db2 "select substr(INDNAME,1,18),substr(TABNAME,1,18),COMPRESSION,PCTPAGESSAVED   
  10. from syscat.indexes where tabname='T2'"   
  11. 1 2 COMPRESSION PCTPAGESSAVED   
  12. IDX_COL2 T2 Y -1   

上面语句中开始创建表时未指定表进行压缩,后继创建的索引默认情况下不压缩。如果希望索引启动压缩功能,则可以使用 alter 语句进行更改。

 

注意,即使我们更改将索引更改为压缩后,后来插入的数据还是未压缩的,直到我们使用 reorg 语句重组索引。 DB2 考虑中间更改索引的压缩属性,需要对更改前、更改后的插入的数据保持一致性,不可能在索引中同时存在非压缩、压缩数据。

我们对上面的 IDX_COL2 执行以下脚本,插入 1 万行数据:

  1. INSERT INTO t2 (col1)   
  2. WITH TEMP (COUNTER, col1) AS   
  3. (   
  4. VALUES (0, INT(RAND() * 1000))   
  5. UNION ALL   
  6. SELECT   
  7. (COUNTER + 1), INT(RAND() * 1000)   
  8. FROM   
  9. TEMP   
  10. WHERE   
  11. (COUNTER + 1) < 10000   
  12. )   
  13. SELECT   
  14. col1   
  15. FROM   
  16. TEMP   
  17. ;  

然后我们收集表和索引的统计信息。

 

  1. db2 "runstats on table db2admin.t2 and indexes all"   
  2. db2 "select substr(INDNAME,1,18),substr(TABNAME,1,18),COMPRESSION,PCTPAGESSAVED   
  3. from syscat.indexes where tabname='T2'"   
  4. 1 2 COMPRESSION PCTPAGESSAVED   
  5. IDX_COL2 T2 Y 0   

大家会发现压缩率为 0,这是因为我们还没有对索引进行 reorg 。当然,除了上面 Select 语句我们也可以使用 REORGCHK 工具检查是否需要对索引进行 Reorg 。

 

  1. db2 "reorg indexes all for table db2admin.t2"   
  2. db2 "runstats on table db2admin.t2 and indexes all"   
  3. db2 "select substr(INDNAME,1,18),substr(TABNAME,1,18),COMPRESSION,PCTPAGESSA   
  4. VED from syscat.indexes where tabname='T2'"   
  5. 1 2 COMPRESSION PCTPAGESSAVED   
  6. IDX_COL2 T2 Y 40   

以上的相关内容就是对DB2 V9.7 索引压缩新特性的使用的介绍,望你能有所收获。

完整内容的学习,请访问:

http://www.ibm.com/developerworks/cn/data/library/techarticles/dm-0907luohq2/

【编辑推荐】

  1. JDBC连接DB2数据库的“捷径”
  2. 对DB2 实现split的操作流程描述
  3. DB2数据库双机的正确安装流程描述
  4. 分享DB2 9安装方法,不得不看!
  5. DB2数据库在AIX上正确卸载与对其重新安装的步骤

     

     

文章来源网络,作者:运维,如若转载,请注明出处:https://shuyeidc.com/wp/251200.html<

(0)
运维的头像运维
上一篇2025-04-28 20:58
下一篇 2025-04-28 20:59

相关推荐

  • BuyVMVPS测评,实测体验怎么样,BuyVMVPS测评推荐

    BuyVMVPS 在 2026 年依然是性价比极高的入门级选择,特别适合预算有限但追求高 I/O 性能的开发者与小型企业,但在高并发场景下需警惕其单线带宽限制,BuyVMVPS 核心架构与 2026 年市场定位在 2026 年的云计算市场中,BuyVMVPS 凭借独特的“按年付费”模式与高规格硬件配置,成功占据……

    2026-05-02
    0
  • hostsolutionsVPS测评,抗投诉实测表现,hostsolutionsVPS抗投诉能力如何?

    hostsolutions VPS 在 2026 年的抗投诉实测中表现卓越,其独特的“先斩后奏”容错机制配合高防节点,使其成为处理敏感业务(如海外营销、跨境支付)时优于传统廉价 VPS 的首选方案,但需注意其价格略高于行业平均水平,核心性能与抗投诉机制深度解析在 2026 年复杂的网络监管环境下,VPS 服务商……

    2026-05-02
    0
  • BuyVM服务器测评,实测体验好吗,BuyVM服务器怎么样

    BuyVM 服务器在 2026 年依然具备极高的性价比,特别适合需要低成本海外节点、搭建轻量级应用或进行跨境网络测试的用户,但其在高端游戏场景下的延迟表现略逊于顶级独服,在 2026 年的云主机市场,BuyVM 凭借“按需付费”与“固定 IP”的混合模式,依然占据着中小开发者与个人站长的核心生态位,对于寻找Bu……

    2026-05-02
    0
  • AlphaNine美国怎么样?AlphaNine美国官网入口

    AlphaNine 美国作为 2026 年高性能计算与边缘 AI 领域的领军品牌,其核心优势在于通过自研异构计算架构实现了 40% 的能效比提升,是解决企业级数据延迟与算力瓶颈的首选方案,尤其在 2026 年中美科技博弈背景下,其合规性与本土化服务能力成为关键决策点,AlphaNine 美国技术架构与 2026……

    2026-05-02
    0
  • AviarHostVPS测评,实测体验,AviarHostVPS怎么样,AviarHostVPS好用吗

    AviarHostVPS 在 2026 年实测中展现出极高的性价比与网络稳定性,是中小型企业搭建海外业务及开发者进行轻量级应用部署的理想选择,尤其适合关注AviarHostVPS 价格与海外服务器免备案场景的用户,在云计算市场高度内卷的 2026 年,VPS 服务商的筛选标准已从单纯的“低价”转向“性能密度”与……

    2026-05-02
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注