数据库国产化替代之后,补坑之路从未止步……

“天底下没有完美的数据库,也许Oracle是个例外”,前阵子几个DBA在讨论国产化替代时,有人就这么说。确实是的,Oracle算是比较完美的数据库产品了,不过现在很多用户都在面临从Oracle数据库向其他数据库迁移的问题。中国电信已经宣布了今年年底前全线下架Oracle数据库,全部用国产或者开源数据库替代。本周和中国电信的朋友交流的时候,他们说已经完成了数百套系统从Oracle数据库的迁移,最晚到8月份,这个任务就能够完成了。

还有些企业怕遇到坑,因此还在不断地研究、认证、测试、分析中。事实上,在做出决策之前多一分小心还是十分必要的。10年前电信提出用开源数据库替代Oracle的时候,针对MYSQL和PG做了一番分析,我也参与了其中的一些工作,通过对当时的MYSQL和PG进行对比,我们最终的分析结果是:如果要迁移计费、账务系统,MYSQL优于PG。当然这个分析并不是说MYSQL就全面碾压PG,而只是针对计费、账务这样的系统场景,PG的膨胀与VACUUM会对系统稳定运行造成较大的影响,相对而言风险更大。

其实我们也没办法看得太远,哪怕是选择好的数据库,在迁移过程中,甚至迁移完成后的长期运行过程中,还是会遇到很多坑。有些问题可能是数据库基础架构从娘胎里带来的,无法马上解决的问题。如果你的应用对这样的问题十分敏感,不解决会引发大问题,那样就十分悲惨了。

昨天刚刚上班就有一个客户遇到国产数据库的问题,他们有一条SQL执行十分频繁,总体开销很大,希望通过index only scan来降低开销,不过创建了索引之后,执行计划依然不走index only scan,还是要走需要回表的执行计划。我以前也没有遇到过这类的问题,正好这个国产数据库是基于opengauss 2.0的,我们的测试环境中有opengauss 2.0和3.0的环境。于是我就先在opengauss 2.0的环境中做了一个测试。实际上openGauss是不支持Covering index的,在openGauss 2.0上,我们创建Covering index的时候会报错:

openGauss2.0是不支持这个语法的,openGauss3.0也类似,只不过错误信息有所变化:

在openGauss 3.0上,我并没有看到预期的Index Only Scan的执行计划。于是我在网上和一个朋友交流了这个问题,他正好对此有过研究,立即就指出了这是一个visibility map的问题,PG 8.4为了支持MVCC,引入了visibility map。不过VM文件并不是实时更新的,因此如果PAGE在VM中是不可见状态时,就必须做回表操作,因为索引中并不存在数据行可见性的标识数据,因此不能使用Index Only Scan。为了进一步确认这个问题,我在一个社区版的PG 11上做了一个测试。

droptabletest_covering ;

createtabletest_covering (idserial,nametext,valint);

createindexidx_test_coveringontest_covering(id) include(val);

insertintotest_covering(name,val) select'test'||generate_series(1,10000),(random()*100)::int%100;

analyzetest_covering;

updatetest_coveringsetval=val+1;

selectrelallvisiblefrompg_classwhererelname='test_covering';

selectrelallvisiblefrompg_classwhererelname='test_covering';

explain (analyzetrue,bufferstrue) selectvalfromtest_coveringwhereid>=10andid<100;

vacuumtest_covering;

selectrelallvisiblefrompg_classwhererelname='test_covering';

explain (analyzetrue,bufferstrue) selectvalfromtest_coveringwhereid>=10andid<100;

我们在PG 11上看到了预期的执行计划,因为PG的数据行的可视性信息仅仅存储于表数据中,而索引中没有这个信息,因此在做Index Only Scan的时候,如果VM没有及时更新,就必须回表才能获得准确的信息了。在VACUUM前执行的查询中,HEAP FETCHES是180,说明虽然执行计划是Index Only Scan,不过有180条数据是回表操作了。

当VM里已经更新了PAGE的信息,那么这些PAGE上的记录就不需要“回表操作”了,因此VACUUM后VM得到了更新,此时HEAP FETCHES变成0了,说明没有任何回表操作。因为VM文件的大小远远小于数据表的文件,因此不回表会降低执行成本。从上面的例子我们也可以看出,不回表执行0.037毫秒,回表执行0.203毫秒,差异还是挺大的。

在PG 11上只要做了表分析,那么起码执行计划是Index Only Scan的,为什么openGauss上执行计划也不选择Index Only Scan呢?刚才我们测试openGauss的时候因为不支持Covering Index的问题,对SQL做了改写。改写后的SQL在PG 11上是什么样的呢?

我们发现,如果索引变成了普通的索引之后,在PG上的执行计划也和openGauss一样了。

不过如果我们做一个vacuum,执行计划就变得正确了,而且也不存在“回表”的问题了。从这个测试我们再联想一下openGauss,openGauss数据库的CBO优化器是不是认为因为VM比较旧,这个查询需要回表,所以不选择Index Only Scan的执行计划呢?

于是我们也在openGauss上做了VACUUM,不过VACUUM完成后,可视的PAGE数量还是0,执行计划也还是没有发生改变。过了一段时间后,发现可见页的数量不为零了,于是再次分析执行计划,发现执行计划已经变成了Index Only Scan。

openGauss的文档上对于VM文件更新的问题并未做出说明,因为我们也只能猜测openGauss的vacuum命令并不更新VM文件,VM文件的更新可能是由其他机制来完成的。因为这个问题的存在,因此openGauss在ASTORE上不支持Covering Index,以防止创建了这样的索引,大部分情况下,Index Only Scan的执行计划也不可用。不过我们在openGauss的相关文档上并未找到这方面的说明。

我们利用openGauss 3.0的USTORE功能,做了最后一个实验,因为刚才我们看到openGauss在USTORE上是支持covering index的,是不是用Ustore可以解决这个问题呢?

droptabletest_covering ;

createtabletest_covering (idserial,nametext,valint) with (STORAGE_TYPE=USTORE) ;

createindexidx_test_coveringontest_coveringusingubtree(id) include(val) ;

insertintotest_covering(name,val) select'test'||generate_series(1,10000),(random()*100)::int%100;

explain (analyzetrue,bufferstrue) selectvalfromtest_coveringwhereid>=10andid<100;

analyzetest_covering;

updatetest_coveringsetval=val+1;

explain (analyzetrue,bufferstrue) selectvalfromtest_coveringwhereid>=10andid<100;

和我们预想的一样,在USTORE上不需要VM的情况下,优化器正确地选择了Index Only Scan。似乎在opengauss上使用USTORE可以完美解决这个问题。不过目前USTORE还不够成熟。在USTORE上也存在不少坑,比如说官方文档中没有提及的USTORE表不支持回收站的问题,以及USTORE上以前我们遇到的一些性能问题。从openGauss仅在USTORE上支持covering index上,我们也可以看出华为openGauss在VM方面可能存在一些问题。就像我们测试中发现,哪怕做vacuum,也不能马上更新VM数据。不能及时更新VM,会导致SQL语句的回表操作增加,导致covering index的初衷无法实现。

数据库使用过程中难免会遇到坑,在使用“完美的数据库”-Oracle的时候我们不也经常遇到BUG吗。遇到坑并不怕,怕的是遇到坑之后我们无法找到解决方案,也不知道这个坑到底是怎么回事。国产数据库并不只是在功能与性能上存在差距的问题,更大的问题可能是在今后的长期维护上,运维知识、运维专家、运维工具的缺失可能会更大地影响国产数据库的发展。

不过不管如何,走出第一步就没有后退的道理了,遇到坑就退回去也是不大可能的。企业在走出第一步之前,就应该未雨绸缪,安排好填坑的队伍,这样才能有备无患。

文章来源网络,作者:运维,如若转载,请注明出处:https://shuyeidc.com/wp/293742.html<

(0)
运维的头像运维
上一篇2025-05-20 18:22
下一篇 2025-05-20 18:24

相关推荐

  • 个人主题怎么制作?

    制作个人主题是一个将个人风格、兴趣或专业领域转化为视觉化或结构化内容的过程,无论是用于个人博客、作品集、社交媒体账号还是品牌形象,核心都是围绕“个人特色”展开,以下从定位、内容规划、视觉设计、技术实现四个维度,详细拆解制作个人主题的完整流程,明确主题定位:找到个人特色的核心主题定位是所有工作的起点,需要先回答……

    2025-11-20
    0
  • 社群营销管理关键是什么?

    社群营销的核心在于通过建立有温度、有价值、有归属感的社群,实现用户留存、转化和品牌传播,其管理需贯穿“目标定位-内容运营-用户互动-数据驱动-风险控制”全流程,以下从五个维度展开详细说明:明确社群定位与目标社群管理的首要任务是精准定位,需明确社群的核心价值(如行业交流、产品使用指导、兴趣分享等)、目标用户画像……

    2025-11-20
    0
  • 香港公司网站备案需要什么材料?

    香港公司进行网站备案是一个涉及多部门协调、流程相对严谨的过程,尤其需兼顾中国内地与香港两地的监管要求,由于香港公司注册地与中国内地不同,其网站若主要服务内地用户或使用内地服务器,需根据服务器位置、网站内容性质等,选择对应的备案路径(如工信部ICP备案或公安备案),以下从备案主体资格、流程步骤、材料准备、注意事项……

    2025-11-20
    0
  • 如何企业上云推广

    企业上云已成为数字化转型的核心战略,但推广过程中需结合行业特性、企业痛点与市场需求,构建系统性、多维度的推广体系,以下从市场定位、策略设计、执行落地及效果优化四个维度,详细拆解企业上云推广的实践路径,精准定位:明确目标企业与核心价值企业上云并非“一刀切”的方案,需先锁定目标客户群体,提炼差异化价值主张,客户分层……

    2025-11-20
    0
  • PS设计搜索框的实用技巧有哪些?

    在PS中设计一个美观且功能性的搜索框需要结合创意构思、视觉设计和用户体验考量,以下从设计思路、制作步骤、细节优化及交互预览等方面详细说明,帮助打造符合需求的搜索框,设计前的规划明确使用场景:根据网站或APP的整体风格确定搜索框的调性,例如极简风适合细线条和纯色,科技感适合渐变和发光效果,电商类则可能需要突出搜索……

    2025-11-20
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注