从SIMD与AVX-512说起,你明白了吗?

昨天提到了PG 16开始支持SIMD了,并且我也说了很多数据库早就开始使用SIMD来充分利用CPU厂商提供的扩展指令集,特别是INTEL的AVX-512。很多DBA可能不太关注硬件,因为数据库虽然依赖于某些硬件平台,但是可以 相对独立的运行,在大多数情况下,DBA不太需要去关注硬件的细节。不过随着现代硬件的不断发展,数据库与硬件的结合越来越紧密,数据库产品也会充分的利用现代硬件的特性来加速某些任务。比如说通过对SIMD的支持来加速运算速度,从而提高行列转换,数据压缩,加解密等方面的性能。甚至有些数据库产品已经开始支持使用GPU的算力来进一步提高这些任务的性能。

AVX-512是Intel在2013年提出的一组512位扩展指令集,用于x86指令集架构(ISA)的高级向量扩展(Advanced Vector Extensions,SIMD)指令。它可以加速诸如科学模拟、金融分析、人工智能/深度学习、3D建模和分析、图像和音频/视频处理、加密和数据压缩等工作负载和用例的性能。通过SIMD,数据库产品可以调用AVX-512、SSE等扩展指令集的功能,同样也可以使用ARM芯片上的ASIMD、SVE2等指令集来达到类似的效果。

近些年GPU火起来了,在科学计算上GPU有着CPU无法比拟的性能。GPU通常拥有更多的计算单元和更高的内存带宽,因此在处理大规模的数据并行计算时,GPU的性能优势很明显。例如,在深度学习领域,GPU可以比CPU快几十倍甚至上百倍。SIMD的主要目的是利用一个指令同时对多个数据进行相同的操作,从而实现空间上的并行性和提高程序的运算速度。SIMD可以利用一组指令对多组数据通进行并行操作,如加法、乘法、比较等。SIMD可以应用于图像/音视频处理、数据分析、科学计算、数据加密和压缩和深度学习等大规模运算需求的应用场景。通过SIMD,可以让CPU在这方面的劣势得到一定程度的弥补。在使用AVX512指令集进行浮点数加法运算时,可以一次对8个双精度浮点数或16个单精度浮点数进行操作,相比于标量运算,可以提高8倍或16倍的性能。

虽然没有做过多的宣传,不过Oracle数据库很早就开始使用SIMD指令集做一些计算任务。在内存列存储中,使用SIMD指令集对数据进行压缩、解压缩、扫描、过滤、聚合等操作;在哈希连接中,使用SIMD指令集对数据进行哈希、构建、探测、收集等操作;在向量化表达式计算中,使用SIMD指令集对数据进行算术、逻辑、比较等操作。这些操作都可以提高Oracle数据库的性能和效率。

在其他数据库中,也有很多使用了SIMD来提高计算类任务的性能。比如TiDB也是比较早使用SIMD的数据库产品。最典型的是在TiFlash上,在表达式计算中,使用了SIMD指令集来加速向量化计算,提高了表达式的执行效率;在编码和解码中,使用了SIMD指令集来加速数据的压缩和解压缩,减少了数据传输和存储的开销;在哈希函数中,使用了SIMD指令集来加速哈希值的计算,提高了哈希表的性能;在排序算法中,使用了SIMD指令集来加速数据的比较和交换,提高了排序的效率。

Oceanbase也比较重视将向量化引擎引入数据库,利用SIMD来提升一些复杂分析类任务的性能。提高数据库单核计算性能,降低查询响应时间数据库来说至关重要。为帮助客户解决 HTAP 混合负载下数据查询效率难的问题,OceanBase 引入向量化技术设计了向量化查询引擎,实现了 HTAP 场景下复杂分析查询性能的大幅提升。在 TPC-H 30TB 测试场景下,OceanBase 向量化引擎的性能是非向量化的 3 倍。对于 Q1 这种聚合分析且计算密集的 SQL 查询,性能提升约 10 倍。测试结果可以证明,向量化引擎对提升 SQL 执行效率、降低用户的查询响应时间具有相当明显的效果。

上面这张图来自于Oceanbase官方,并非我们自己的测试结果,从中可以看出向量化引擎的效果还是相当好的。目前引入向量化计算,更好的利用现代CPU的能力已经是广大数据库厂商的共识。对于数据库厂商和用户来说,这都是一件好事情,不过对于广大DBA来说,不能算是好事情。因为一个数据库产品,在CPU类型不同的服务器上,甚至在相同架构,但是存在代差的服务器上,可能跑出来的性能会差异较大,这会让人十分蒙圈。这年头,干DBA也真是一件十分苦逼的事情。

文章来源网络,作者:运维,如若转载,请注明出处:https://shuyeidc.com/wp/239113.html<

(0)
运维的头像运维
上一篇2025-04-23 06:26
下一篇 2025-04-23 06:27

相关推荐

  • 个人主题怎么制作?

    制作个人主题是一个将个人风格、兴趣或专业领域转化为视觉化或结构化内容的过程,无论是用于个人博客、作品集、社交媒体账号还是品牌形象,核心都是围绕“个人特色”展开,以下从定位、内容规划、视觉设计、技术实现四个维度,详细拆解制作个人主题的完整流程,明确主题定位:找到个人特色的核心主题定位是所有工作的起点,需要先回答……

    2025-11-20
    0
  • 社群营销管理关键是什么?

    社群营销的核心在于通过建立有温度、有价值、有归属感的社群,实现用户留存、转化和品牌传播,其管理需贯穿“目标定位-内容运营-用户互动-数据驱动-风险控制”全流程,以下从五个维度展开详细说明:明确社群定位与目标社群管理的首要任务是精准定位,需明确社群的核心价值(如行业交流、产品使用指导、兴趣分享等)、目标用户画像……

    2025-11-20
    0
  • 香港公司网站备案需要什么材料?

    香港公司进行网站备案是一个涉及多部门协调、流程相对严谨的过程,尤其需兼顾中国内地与香港两地的监管要求,由于香港公司注册地与中国内地不同,其网站若主要服务内地用户或使用内地服务器,需根据服务器位置、网站内容性质等,选择对应的备案路径(如工信部ICP备案或公安备案),以下从备案主体资格、流程步骤、材料准备、注意事项……

    2025-11-20
    0
  • 如何企业上云推广

    企业上云已成为数字化转型的核心战略,但推广过程中需结合行业特性、企业痛点与市场需求,构建系统性、多维度的推广体系,以下从市场定位、策略设计、执行落地及效果优化四个维度,详细拆解企业上云推广的实践路径,精准定位:明确目标企业与核心价值企业上云并非“一刀切”的方案,需先锁定目标客户群体,提炼差异化价值主张,客户分层……

    2025-11-20
    0
  • PS设计搜索框的实用技巧有哪些?

    在PS中设计一个美观且功能性的搜索框需要结合创意构思、视觉设计和用户体验考量,以下从设计思路、制作步骤、细节优化及交互预览等方面详细说明,帮助打造符合需求的搜索框,设计前的规划明确使用场景:根据网站或APP的整体风格确定搜索框的调性,例如极简风适合细线条和纯色,科技感适合渐变和发光效果,电商类则可能需要突出搜索……

    2025-11-20
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注