SQL Server索引密度的实际操作

以下的文章主要向大家描述的是SQL Server索引密度(Index Densities),在实际操作中当一个查询的SARG 的值直到查询运行时才已知,或是 SARG 是关于一个索引的多列时,SQL Server才使用为索引中每列存储的密度值。

对于组合键值,SQL Server为第一列的组合键存储了密度值;为第一列和第二列;为第一、二、三列;等等。这些信息可以从Listing34.1的DBCC SHOW_STATISTICS 输出信息的All density区域看到。

SQL Server索引密度表示为键的唯一键值的倒数。每个键的密度可以按照下面的公式进行计算:

 

 

引用

 

 

  1. Key density = 1.00/ ( Count of distinct key values in the table)  

 

键密度 = 1.00 / (表中的不同键值数)

 

 

所以,pubs数据库的author表中state列的密度计算公式如下:

 

 

  1. Sql代码   
  2. Select Density = 1.00/ (select count (distinct state) from authors)   
  3. Go   
  4. Select Density = 1.00/ (select count (distinct state) from authors)  
  5. Go  
  6. Density   
  7. .1250000000000   
  8.  

State和zip的组合列密度计算如下:

  1. Sql代码   
  2. Select density = 1.00/( select count (distinct state + zip) from authors)   
  3. Go   
  4. Select density = 1.00/( select count (distinct state + zip) from authors)  
  5. Go  
  6. Density   
  7. .0555555555555   
  8.  

注意,不像选择率,越小的SQL Server索引密度意味着具有更高的索引选择性。当密度趋近于1,索引就变得有更少的选择性,基本上没有用处了。当索引的选择性低的时候,优化器可能会选择一个表扫描(table scan),或者叶子级的索引扫描(Index scan),而不会进行索引查找(index seek),因为这样会付出更多的代价。

 

引用

 

提示:

 

当心你的数据库中低选择性的索引。这样的索引通常是对系统的性能是一个损害。它们通常不仅不会用来进行数据的检索,而且也会使得数据修改语句变得缓慢,因为需要额外的索引维护。识别这些索引,考虑删除掉它们。

 

通常,当你给键中添加更多的列时,密度值应该变得更小。例如,在Listing 34.2,密度值逐渐变小。

 

 

  1. Key Column Index Density   
  2. title_id 1.8621974E-3   
  3. title_id, stor_id 5.997505E-6   
  4. title_id, stor_id, ord_num 5.9268041E-6  

使用索引密度评估行数(Estimating Rows Using the Index Statistics)

那么优化器是如何使用SQL Server索引密度来决定一个索引的效果呢?

当在一个范围内查找一个索引值或者键中存在重复值时,SQL Server会使用直方图信息。考虑下面关于bigpubs2000数据库中的sales表中查询:

 

Sql代码

 

  1. Select * from sales   
  2. Where title_id = 'BI2184'   
  3. Select * from sales  
  4. Where title_id = 'BI2184' 

因为在表中title_id中存在重复值,SQL Server使用关于title_id的直方图(参考Listing34.2)来估计匹配的行数。对于BI2184值,它将查看EQ_ROWS值,值为343.0。这表示在表中title_id值为BI2184的记录共有343行。

当一个查询参数(search argument)的精确匹配(exact match 即等号计算)在直方图中step没有发现时,SQL Server使用比查找值(search value)大的下一个step中的AVG_RANG_ROWS值。例如,SQL Server对查找值为‘BI2187’进行评估,它将会发现匹配值为270.0行。

对一个范围检索,SQL Server把检范围两端的RANG_ROW和EQ_ROWS相加。例如,利用Listing34.2中的直方图,如果查找参数为 where title_id <= ‘BI2574’,行数估计将是:

314 + 613 + 343 + 270 + 277,或者为1817。

 

当直方图不能使用时,SQL Server就使用索引密度来估计匹配行数。对于等值查找的计算公式是直截了当的,例如:

  1. Sql代码   
  2. Declare @tid varchar(6)   
  3. Select @tid = 'BI2574'   
  4. Select count(*) from sales where title_id = @tid   
  5. Declare @tid varchar(6)  
  6. Select @tid = 'BI2574' 
  7. Select count(*) from sales where title_id = @tid  

 

行估计值等于指定键值的SQL Server索引密度(1.8621974E-3)乘以表中行数:

  1. Sql代码   
  2. Select count(*) * 1.8621974E-3   
  3. From sales   
  4. Go   
  5. Select count(*) * 1.8621974E-3  
  6. From sales  
  7. Go  
  8. 314.19925631500001   

如果一个查询的SARG为title_id 和stor_id,并且假如title_id的SARG是一个可在优化期间可评价的常量表达式,SQL Server会用title_id stor_id的索引密度和title_id的直方图来估计匹配的行数(对某些值来说,索引密度估计的值可能会大学直方图估计出来的值)。SQL Server 将会用二者中较小的值作为匹配的行数。

根据title_id stor_id的索引密度,你能看到:

  1. Sql代码   
  2. Select coun(*) * 5.997505E-6   
  3. From sales   
  4. Select coun(*) * 5.997505E-6  
  5. From sales  
  6. 1.011929031125   

 

在这个例子中,SQL Server将用title_id 和stor_id的SQL Server索引密度来估计匹配的值。在此情况下,它估计查询将返回一条匹配的行。

【编辑推荐】

  1. 优化SQL Server数据库的经验大盘点
  2. SQL Server 2005商业智能功能浅析
  3. 修改SQL Server 2005 数据库的执行环境很简单
  4. SQL Server 2000数据库备份和还原的示例
  5. SQL Server 2008数据库在实际应用中的独到之处

文章来源网络,作者:运维,如若转载,请注明出处:https://shuyeidc.com/wp/244838.html<

(0)
运维的头像运维
上一篇2025-04-25 22:06
下一篇 2025-04-25 22:08

相关推荐

  • 个人主题怎么制作?

    制作个人主题是一个将个人风格、兴趣或专业领域转化为视觉化或结构化内容的过程,无论是用于个人博客、作品集、社交媒体账号还是品牌形象,核心都是围绕“个人特色”展开,以下从定位、内容规划、视觉设计、技术实现四个维度,详细拆解制作个人主题的完整流程,明确主题定位:找到个人特色的核心主题定位是所有工作的起点,需要先回答……

    2025-11-20
    0
  • 社群营销管理关键是什么?

    社群营销的核心在于通过建立有温度、有价值、有归属感的社群,实现用户留存、转化和品牌传播,其管理需贯穿“目标定位-内容运营-用户互动-数据驱动-风险控制”全流程,以下从五个维度展开详细说明:明确社群定位与目标社群管理的首要任务是精准定位,需明确社群的核心价值(如行业交流、产品使用指导、兴趣分享等)、目标用户画像……

    2025-11-20
    0
  • 香港公司网站备案需要什么材料?

    香港公司进行网站备案是一个涉及多部门协调、流程相对严谨的过程,尤其需兼顾中国内地与香港两地的监管要求,由于香港公司注册地与中国内地不同,其网站若主要服务内地用户或使用内地服务器,需根据服务器位置、网站内容性质等,选择对应的备案路径(如工信部ICP备案或公安备案),以下从备案主体资格、流程步骤、材料准备、注意事项……

    2025-11-20
    0
  • 如何企业上云推广

    企业上云已成为数字化转型的核心战略,但推广过程中需结合行业特性、企业痛点与市场需求,构建系统性、多维度的推广体系,以下从市场定位、策略设计、执行落地及效果优化四个维度,详细拆解企业上云推广的实践路径,精准定位:明确目标企业与核心价值企业上云并非“一刀切”的方案,需先锁定目标客户群体,提炼差异化价值主张,客户分层……

    2025-11-20
    0
  • PS设计搜索框的实用技巧有哪些?

    在PS中设计一个美观且功能性的搜索框需要结合创意构思、视觉设计和用户体验考量,以下从设计思路、制作步骤、细节优化及交互预览等方面详细说明,帮助打造符合需求的搜索框,设计前的规划明确使用场景:根据网站或APP的整体风格确定搜索框的调性,例如极简风适合细线条和纯色,科技感适合渐变和发光效果,电商类则可能需要突出搜索……

    2025-11-20
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注