高并发+海量数据下如何实现系统解耦?「下」

一、前情提示

上一篇文章《高并发+海量数据下如何实现系统解耦?【中】》分析了一下如何利用消息中间件对系统进行解耦处理。

同时,我们也提到了使用消息中间件还有利于一份数据被多个系统同时订阅,供多个系统来使用于不同的目的。

目前的一个架构如下图所示。

在这个图里,我们可以清晰的看到,实时计算平台发布的一份数据到消息中间件里,接着,会进行如下步骤:

  1. 数据查询平台,会订阅这份数据,并落入自己本地的数据库集群和缓存集群里,接着对外提供数据查询的服务
  2. 数据质量监控系统,会对计算结果按照一定的业务规则进行监控,如果发现有数据计算错误,则会立马进行报警
  3. 数据链路追踪系统,会采集计算结果作为一个链路节点,同时对一条数据的整个完整计算链路都进行采集并组装出来一系列的数据计算链路落地存储,最后如果某个数据计算错误了,就可以立马通过计算链路进行回溯排查问题

因此上述场景中,使用消息中间件一来可以解耦,二来还可以实现消息“Pub/Sub”模型,实现消息的发布与订阅。

这篇文章,咱们就来看看,假如说基于RabbitMQ作为消息中间件,如何实现一份数据被多个系统同时订阅的“Pub/Sub”模型。

二、基于消息中间件的队列消费模型

上面那个图,其实就是采用的RabbitMQ最基本的队列消费模型的支持。

也就是说,你可以理解为RabbitMQ内部有一个队列,生产者不断的发送数据到队列里,消息按照先后顺序进入队列中排队。

接着,假设队列里有4条数据,然后我们有2个消费者一起消费这个队列的数据。

此时每个消费者会均匀的被分配到2条数据,也就是说4条数据会均匀的分配给各个消费者,每个消费者只不过是处理一部分数据罢了,这个就是典型的队列消费模型。

三、基于消息中间件的“Pub/Sub”模型

但是消息中间件还可以实现一种“Pub/Sub”模型,也就是“发布/订阅”模型,Pub就是Publish,Sub就是Subscribe。

这种模型是可以支持多个系统同时消费一份数据的。也就是说,你发布出去的每条数据,都会广播给每个系统。

给大家来一张图,一起来感受一下。

如上图所示。也就是说,我们想要实现的上图的效果,实时计算平台发布一系列的数据到消息中间件里。

然后数据查询平台、数据质量监控系统、数据链路追踪系统,都会订阅数据,都会消费到同一份完整的数据,每个系统都可以根据自己的需要使用数据。

这,就是所谓的“Pub/Sub”模型,一个系统发布一份数据出去,多个系统订阅和消费到一模一样的一份数据。

那如果要实现上述的效果,基于RabbitMQ应该怎么来处理呢?

四、RabbitMQ中的exchange到底是个什么东西?

实际上来说,在RabbitMQ里面是不允许生产者直接投递消息到某个queue(队列)里的,而是只能让生产者投递消息给RabbitMQ内部的一个特殊组件,叫做“exchange”。

关于这个exchange,大概你可以把这个组件理解为一种消息路由的组件。

也就是说,实时计算平台发送出去的message到RabbitMQ中都是由一个exchange来接收的。

然后这个exchange会根据一定的规则决定要将这个message路由转发到哪个queue里去,这个实际上就是RabbitMQ中的一个核心的消息模型。

大家看下面的图,一起来理解一下。

五、默认的exchange

在之前的文章里,我们投递消息到RabbitMQ的时候,也没有用什么exchange,但是为什么就还是把消息投递到了queue里去呢?

那是因为我们用了默认的exchange,他会直接把消息路由到你指定的那个queue里去,所以如果简单用队列消费模型,不就省去了exchange的概念了吗。

上面这段就是之前我们给大家展示的,让消息持久化的一种投递消息的方式。

大家注意里面的第一个参数,是一个空的字符串,这个空字符串的意思,就是说投递消息到默认的exchange里去,然后他就会路由消息到我们指定的queue里去。

六、将消息投递到fanout exchange

​在RabbitMQ里,exchange这种组件有很多种类型,比如说:direct、topic、headers以及fanout。这里咱们就来看看最后一种,fanout这种类型的exchange组件。

这种exchange组件其实非常的简单,你可以创建一个fanout类型的exchange,然后给这个exchange绑定多个queue。

接着只要你投递一条消息到这个exchange,他就会把消息路由给他绑定的所有queue。

使用下面的代码就可以创建一个exchange,比如说在实时计算平台(生产者)的代码里,可以加入下面的一段,创建一个fanout类型的exchange。

第一个参数我们叫做“rt_compute_data”,这个就是exchange的名字,rt就是“RealTime”的缩写,意思就是实时计算系统的计算结果数据。

第二个参数就是定义了这个exchange的类型是“fanout”。​

channel.exchangeDeclare(
"rt_compute_data",
"fanout");

接着我们就采用下面的代码来投递消息到我们创建好的exchange组件里去:

大家会注意到,此时消息就是投递到指定的exchange里去了,但是路由到哪个queue里去呢?此时我们暂时还没确定,要让消费者自己来把自己的queue绑定到这个exchange上去才可以。

七、绑定自己的队列到exchange上去消费

我们对消费者的代码也进行修改,之前我们在这里关闭了autoAck机制,然后每次都是自己手动ack。

上面的代码里,每个消费者系统,都会有一些不一样,就是每个消费者都需要定义自己的队列,然后绑定到exchange上去。比如:

  • 数据查询平台的队列是“rt_compute_data_query”。
  • 数据质量监控平台的队列是“rt_compute_data_monitor”。
  • 数据链路追踪系统的队列是“rt_compute_data_link”。

这样,每个订阅这份数据的系统其实都有一个属于自己的队列,然后队列里被会被exchange路由进去实时计算平台生产的所有数据。

而且因为是多个队列的模式,每个系统都可以部署消费者集群来进行数据的消费和处理,非常的方便。

八、整体架构图

最后,给大家来一张大图,我们再跟着图,来捋一捋整个流程。

如上图所示,首先,实时计算平台会投递消息到“rt_compute_data”这个“exchange”里去,但是他没指定这个exchange要路由消息到哪个队列,因为这个他本身是不知道的。

接着数据查询平台、数据质量监控系统、数据链路追踪系统,就可以声明自己的队列,都绑定到exchange上去。

因为queue和exchange的绑定,在这里是要由订阅数据的平台自己指定的。而且因为这个exchange是fanout类型的,他只要接收到了数据,就会路由数据到所有绑定到他的队列里去,这样每个队列里都有同样的一份数据,供对应的平台来消费。

而且针对每个平台自己的队列,自己还可以部署消费服务集群来消费自己的一个队列,自己的队列里的数据还是会均匀分发给各个消费服务实例来​处理,每个消费服务实例会获取到一部分的数据。

大家思考一下,这样是不是就实现了不同的系统订阅一份数据的“Pub/Sub”的模型?

当然,其实RabbitMQ还支持各种不同类型的exchange,可以实现各种复杂的功能。​

文章来源网络,作者:管理,如若转载,请注明出处:https://shuyeidc.com/wp/296252.html<

(0)
管理的头像管理
上一篇2025-05-21 22:24
下一篇 2025-05-21 22:25

相关推荐

  • 隔离网络空间到底要多少钱?搭建独立虚拟网络空间费用

    “隔离网络空间”并非标准商业术语,通常指代企业级私有云部署、物理隔离网(Air-Gapped Network)建设或高安全等级内网改造,其费用从几十万元的单机隔离方案到数千万元的国家级专网建设不等,具体取决于隔离等级、硬件配置及安全合规要求,很多用户搜索“隔离网络空间多少钱”时,往往混淆了概念,在网络安全领域……

    2026-06-18
    0
  • 高主频ecs服务器试用怎么样?高主频ecs服务器租用价格

    高主频ECS服务器试用是解决计算密集型任务瓶颈的最优解,建议通过阿里云、腾讯云等主流云厂商提供的免费试用或按量付费模式,在真实业务场景中验证其性能优势后再进行正式采购,在云计算的广阔版图中,服务器并非千篇一律,对于需要处理复杂逻辑、高频交易或实时渲染的用户来说,普通的通用型实例往往显得力不从心,高主频ECS(E……

    2026-06-18
    0
  • 高主频ecs服务器能运行软件吗?高主频服务器适合跑什么程序

    高主频ECS服务器不仅能运行软件,更是运行对CPU单核性能要求极高的应用程序的首选方案,它在处理复杂逻辑运算、实时交易和高并发请求时,能提供远超普通实例的稳定性和响应速度,很多用户在选购云服务器时,往往会被“主频”这个参数搞得晕头转向,大家常问:高主频到底是个什么概念?它和普通服务器比起来,到底强在哪里?是不是……

    2026-06-18
    0
  • 高价语音标注项目数据标注公司

    选择高价语音标注项目时,核心在于平衡数据精度与成本控制,建议优先考察具备垂直领域深耕能力且拥有自动化预处理流程的专业数据标注公司,以确保最终交付数据的可用性与合规性,在人工智能大模型飞速迭代的当下,语音数据的价值被重新定义,很多企业在采购服务时,往往陷入“越贵越好”或“低价走量”的误区,高价语音标注项目并非简单……

    2026-06-18
    0
  • 计算机服务器高价按几年折旧?电脑设备折旧年限是多少

    高价计算机服务器通常按3到5年进行折旧,其中通用型服务器多采用3年,而高性能计算或AI训练集群等专用设备建议按5年折旧,具体年限需结合企业会计准则及硬件实际使用寿命确定,在数字化转型的浪潮中,数据中心已成为企业的核心资产枢纽,当你斥巨资购入一批高端服务器时,如何合理分摊其成本,不仅关乎财务报表的准确性,更直接影……

    2026-06-18
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注