如何使用内存中副本提高矢量数据库的读取吞吐量

译者 | 李睿

审校 | 孙淑娟

在正式发布之后,Milvus 2.1增加了许多新功能,例如内存副本、支持字符串数据类型、嵌入式Milvus、可调一致性、用户身份验证和传输中的加密,以提供便利和更好的用户体验。虽然内存中副本的概念对于分布式数据库来说并不新鲜,但它是一个关键功能,可以帮助用户轻松提高系统性能、提高数据库读取吞吐量,并提高硬件资源的利用率。

因此,本文首先解释了内存中的副本是什么以及为什么它很重要的原因,然后介绍了如何在人工智能的矢量数据库Milvus中启用这一新功能。  

与内存中副本相关的概念  

在了解内存中副本是什么以及为什么这么重要之前,需要先了解一些相关概念,其中包括副本组、分片副本、流副本、历史副本和分片领导者。下图是这些概念的说明。  

副本概念  

(1)副本组  

副本组由负责处理历史数据和副本的多个查询节点组成。更具体地说,Milvus向量数据库中的查询节点检索增量日志数据,并通过订阅日志代理、从对象存储中加载历史数据以及在向量和标量数据之间运行混合搜索,将其转变成为不断增长的片段。

(2)分片副本  

一个分片副本由一个流副本和一个历史副本组成,它们都属于同一个分片(即数据操作语言通道,在Milvus中缩写为DML通道)。多个分片副本组成一个副本组。并且副本组中的分片副本的确切数量由指定集合中的分片数量决定。  

(3)流副本  

流副本包含来自同一DML通道的所有不断增长的段。不断增长的段不断接收新插入的数据,直到它被密封。从技术上讲,一个流副本应该由一个副本中的一个查询节点提供服务。  

(4)历史副本 

历史副本包含来自同一DML通道的所有密封段。密封段不再接收任何新数据,并将被刷新到对象存储中,将新数据插入到新创建的增长段中。一个历史副本的密封段可以分布在同一副本组内的多个查询节点上。  

(5)分片领导者  

分片领导者是为分片副本中的流式副本提供服务的查询节点。  

什么是内存副本?  

启用内存中副本允许用户将数据加载到多个查询节点上的集合中,以便可以利用额外的CPU和内存资源。换句话说,当在集合中加载数据并指定要将其作为两个副本加载时,最终将在两个查询节点上拥有两个数据副本。如果有一个相对较小的数据集,但希望增加读取吞吐量,并提高硬件资源的利用率,则内存中副本的功能非常有用。  

在默认情况下,Milvus矢量数据库目前在内存中为每个段保存一个副本。但是,使用内存中的副本,用户可以在不同的查询节点上对一个段进行多次复制。这意味着如果一个查询节点正在对某个段进行搜索,则可以将传入的新搜索请求分配给另一个空闲查询节点,因为该查询节点具有完全相同的段的复制。其好处是不必再次重新加载数据。用户无需执行任何操作,空闲查询节点会自动进行搜索或查询,因为该查询节点已经复制并接收了数据。  

此外,如果有多个内存中的副本,可以更好地应对查询节点崩溃的情况。如果没有内存中的副本,则必须等待段重新加载才能继续并在另一个查询节点上搜索。但是,通过内存复制,可以立即将搜索请求重新发送到新的查询节点,而无需再次重新加载数据,如下图所示: 

内存中的副本  

为什么内存中的副本很重要?  

启用内存中副本的最显著好处之一是整体QPS(每秒查询数)和吞吐量的增加。如果在使用Milvus矢量数据库时启用了内存中的副本,将能够看到系统性能的巨大飞跃。此外,使用内存中的副本,可以维护多个段副本,并且系统在面对故障转移时更具弹性,就像上面的示例一样。  

在Milvus矢量数据库中启用内存中的副本  

在Milvus矢量数据库中启用内存中副本的新功能很容易。需要做的只是在加载集合时指定所需的副本数量(即调用collection.load( ))。  

在下面的教程中,将使用包含书籍信息的集合的示例。假设已经创建了一个名为“book”的集合,并将数据插入其中。然后,可以指定在加载集合数据时要创建的副本数。下面的示例代码将集合加载为两个副本。  

frompymilvusimportCollection
collection=Collection("book") # Getanexistingcollection.
collection.load(replica_number=2) # loadcollectionas2replicas

用户可以灵活修改上述示例代码中的副本数,以最适合应用场景。然后可以直接对多个副本进行向量相似性搜索或查询,而无需运行任何额外的命令。但是,应该注意,允许的最大副本数受到运行查询节点的可用内存总量的限制。如果指定的副本数量超过可用内存的限制,则在数据加载期间将返回错误。

用户还可以通过运行collection.get_replicas()检查其创建的内存中副本的信息。将返回副本组的信息以及相应的查询节点和分片。以下是输出示例:  

Replicagroups:
-Group: <group_id:435309823872729305>, <group_nodes:(21, 20)>, <shards:[Shard: <channel_name:milvus-zong-rootcoord-dml_27_435367661874184193v0>, <shard_leader:21>, <shard_nodes:[21]>, Shard: <channel_name:milvus-zong-rootcoord-dml_28_435367661874184193v1>, <shard_leader:20>, <shard_nodes:[20, 21]>]>
-Group: <group_id:435309823872729304>, <group_nodes:(25,)>, <shards:[Shard: <channel_name:milvus-zong-rootcoord-dml_28_435367661874184193v1>, <shard_leader:25>, <shard_nodes:[25]>, Shard: <channel_name:milvus-zong-rootcoord-dml_27_435367661874184193v0>, <shard_leader:25>, <shard_nodes:[25]>]>

原文标题:​​Increase Your Vector Database Read Throughput with In-Memory Replicas​​​,作者:Angela Ni​

文章来源网络,作者:运维,如若转载,请注明出处:https://shuyeidc.com/wp/236407.html<

(0)
运维的头像运维
上一篇2025-04-22 00:15
下一篇 2025-04-22 00:16

相关推荐

  • 个人主题怎么制作?

    制作个人主题是一个将个人风格、兴趣或专业领域转化为视觉化或结构化内容的过程,无论是用于个人博客、作品集、社交媒体账号还是品牌形象,核心都是围绕“个人特色”展开,以下从定位、内容规划、视觉设计、技术实现四个维度,详细拆解制作个人主题的完整流程,明确主题定位:找到个人特色的核心主题定位是所有工作的起点,需要先回答……

    2025-11-20
    0
  • 社群营销管理关键是什么?

    社群营销的核心在于通过建立有温度、有价值、有归属感的社群,实现用户留存、转化和品牌传播,其管理需贯穿“目标定位-内容运营-用户互动-数据驱动-风险控制”全流程,以下从五个维度展开详细说明:明确社群定位与目标社群管理的首要任务是精准定位,需明确社群的核心价值(如行业交流、产品使用指导、兴趣分享等)、目标用户画像……

    2025-11-20
    0
  • 香港公司网站备案需要什么材料?

    香港公司进行网站备案是一个涉及多部门协调、流程相对严谨的过程,尤其需兼顾中国内地与香港两地的监管要求,由于香港公司注册地与中国内地不同,其网站若主要服务内地用户或使用内地服务器,需根据服务器位置、网站内容性质等,选择对应的备案路径(如工信部ICP备案或公安备案),以下从备案主体资格、流程步骤、材料准备、注意事项……

    2025-11-20
    0
  • 如何企业上云推广

    企业上云已成为数字化转型的核心战略,但推广过程中需结合行业特性、企业痛点与市场需求,构建系统性、多维度的推广体系,以下从市场定位、策略设计、执行落地及效果优化四个维度,详细拆解企业上云推广的实践路径,精准定位:明确目标企业与核心价值企业上云并非“一刀切”的方案,需先锁定目标客户群体,提炼差异化价值主张,客户分层……

    2025-11-20
    0
  • PS设计搜索框的实用技巧有哪些?

    在PS中设计一个美观且功能性的搜索框需要结合创意构思、视觉设计和用户体验考量,以下从设计思路、制作步骤、细节优化及交互预览等方面详细说明,帮助打造符合需求的搜索框,设计前的规划明确使用场景:根据网站或APP的整体风格确定搜索框的调性,例如极简风适合细线条和纯色,科技感适合渐变和发光效果,电商类则可能需要突出搜索……

    2025-11-20
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注