一篇学会 Pulsar 部署与线上配置

一篇学会 Pulsar 部署与线上配置

作者:梁勇 2022-02-21 08:48:00

开发

前端

云原生 Apache Pulsar越来越多的公司使用,与Apache Kafka、Apache RocketMQ并列成为消息领域三家马车,有必要对其研究一番。下面以笔者曾在生产环境使用的配置梳理,希望对大家有所帮助!

一、Pulsar安装与部署

1.下载安装包

Pulsar安装包包含了zookeeper、broker、bookie三个组件。

下载Pulsar二进制包

https://pulsar.apache.org/download/

解压压缩包

tar -zvxf apache-pulsar-2.9.1-bin.tar.gz

2.部署zookeeper

2.1 修改zookeeper配置

创建目录

mkdir -p data/zookeeper

echo 1> data/zookeeper/myid

修改zk配置,文件位于conf/zookeeper.conf

# 数据目录
dataDir=data/zookeeper
# 日志目录
dataLogDir=data/zookeeper/logs
# zk集群配置,server.1~n
server.1=127.0.0.1:2888:3888

2.2 后台启动zookeeper

bin/pulsar-daemon start zookeeper
doing start zookeeper ...
starting zookeeper, logging to /Users/admin/work/software_install/apache-pulsar-2.9.1/logs/pulsar-zookeeper-M-C02GL1NTQ05P.log
Note:Set immediateFlush to truein conf/log4j2.yaml will guarantee the logging event is flushing to disk immediately. The default behavior is switched off due to performance considerations.

通过pulsar-daemon管理pulsar组件

bin/pulsar-daemon help
Error: no enough arguments provided.
Usage: pulsar-daemon (start|stop|restart)<command><args...>
where command is one of:
broker Run a broker server
bookie Run a bookie server
zookeeper Run a zookeeper server
configuration-store Run a configuration-store server
websocket Run a websocket proxy server
functions-worker Run a functions worker server
standalone Run a standalone Pulsar service
proxy Run a Proxy Pulsar service

备注:可以通过pulsar-daemon命令对broker、bookie、zookeeper等组件启动、关闭或者重启。

2.3 检查zookeeper是否启动成功

zookeeper启动日志和查看zookeeper进程

ps axu | grep zookeeper

3.元数据初始化

3.1 初始化命令说明

bin/pulsar initialize-cluster-metadata \
--cluster pulsar-cluster-1 \
--zookeeper 127.0.0.1:2181 \
--configuration-store 127.0.0.1:2181 \
--web-service-url http://127.0.0.1:8080 \
--web-service-url-tls https://127.0.0.1:8443 \
--broker-service-url pulsar://127.0.0.1:6650 \
--broker-service-url-tls pulsar+ssl://127.0.0.1:6651

参数说明

参数说明

参数

说明

cluster

默认集群名称

zookeeper

本地集群使用的zk地址

configuration-store

多个集群全局的zk集群地址,各个集群之间同步数据,单机群地址同上面参数zookeeper即可

web-service-url

Broker的管理流地址,例如创建删除主题等

web-service-url-tls

Broker开启TLS,管理流则使用该地址

broker-service-url

Broker数据流地址,发送接受消息等

broker-service-url-tls

Broker开启TLS,数据流则使用该地址

备注:生产环境可以使用域名。

3.2 查看初始化结果

bin/pulsar zookeeper-shell

[zk: localhost:2181(CONNECTED)1] ls /
[admin, bookies, ledgers, pulsar, stream, zookeeper]

4.部署BookKeeper集群

4.1 配置修改

bindAddress=127.0.0.1
advertisedAddress=127.0.0.1
zkServers=127.0.0.1:2181

参数说明

参数

说明

bindAddress

服务监听的地址,默认 0.0.0.0

advertisedAddress

服务向外发布的主机名或者IP,默认为IntetAddress.getLocalHost().getHostName

zkServers

zk集群地址,可与broker共用

4.2 命令启动

bin/pulsar-daemon start bookie
doing start bookie ...
starting bookie, logging to /Users/admin/work/software_install/apache-pulsar-2.9.1/logs/pulsar-bookie-M-C02GL1NTQ05P.log
Note:Set immediateFlush to truein conf/log4j2.yaml will guarantee the logging event is flushing to disk immediately. The default behavior is switched off due to performance considerations.

4.3 测试bookie集群

bin/bookkeeper shell simpletest --ensemble 1 --writeQuorum 1 --ackQuorum 1 -- numEntries 1000

...
2022-02-19T23:43:03,391+0800[main] INFO org.apache.bookkeeper.tools.cli.commands.client.SimpleTestCommand-722 entries written
2022-02-19T23:43:03,983+0800[main] INFO org.apache.bookkeeper.tools.cli.commands.client.SimpleTestCommand-1000 entries written to ledger 0
2022-02-19T23:43:04,041+0800[main] INFO org.apache.bookkeeper.proto.PerChannelBookieClient- Closing the per channel bookie client for 127.0.0.1:3181
...

备注:通过simpletest命令向bookie集群写入测试数据,完成测试后会自动删除。

5.部署Broker集群

5.1 修改配置

zookeeperServers=127.0.0.1:2181
configurationStoreServers=127.0.0.1:2181
bindAddress=127.0.0.1
# 默认InetAddress.getLocalHost().getHostName()
advertisedAddress=127.0.0.1
clusterName=pulsar-cluster-1

5.2 启动broker

bin/pulsar-daemon start broker
doing start broker ...
starting broker, logging to /Users/admin/work/software_install/apache-pulsar-2.9.1/logs/pulsar-broker-M-C02GL1NTQ05P.log
Note:Set immediateFlush to truein conf/log4j2.yaml will guarantee the logging event is flushing to disk immediately. The default behavior is switched off due to performance considerations.

5.3 验证集群

查看集群节点

bin/pulsar-admin brokers list cluster-1
"172.17.13.184:8080"

发送测试消息

bin/pulsar-client produce persistent://public/default/test -n 1-m "Hello Pulsar"
...
2022-02-20T13:31:18,469+0800[main] INFO org.apache.pulsar.client.cli.PulsarClientTool-1 messages successfully produced
...

消费测试消息

bin/pulsar-client consume persistent://public/default/test -n 100-s "consumer-test"-t "Exclusive"
...
----- got message -----
key:[null], properties:[], content:Hello Pulsar
...

小结:至此测试集群搭建完成,下文将介绍生产环境配置的调整项。

二、生产环境配置

1.机器配置

下面为生产环境搭建Pulsar集群,由3个zookeeper节点、3个broker节点和5个bookie节点构成。

组件配置

组件  配置
zookeeper 4C8G100G *3
broker 16C64G500G *3
bookie 16C64G500G *5

备注:每个组件集群部署时可以同城跨可用区部署,提高高可用。broker不存储消息100G即可,bookie存储消息通常需要较大磁盘,比如3T,具体根据消息量计算。

2.内存优化

配置项

内存大小或者比例,总大小

系统OS缓存

1~2G

Jvm内存和堆外内存

1/2(除去系统缓存后剩余缓存的一半),其中Jvm heap占1/3,堆外内存Direct Memory占2/3

PageCache内存大小

1/2(除去系统缓存后剩余缓存的一半)

2.1 broker内存调整

以内存64G大小,在文件conf/pulsar_env.sh修改如下内容:

PULSAR_MEM=${PULSAR_MEM:-"-Xms10g -Xmx10g -XX:MaxDirectMemorySize=20g"}

2.2 bookie内存调整

以内存64G大小,在文件conf/bkenv.sh修改如下内容:

BOOKIE_MEM=${BOOKIE_MEM:-${PULSAR_MEM:-"-Xms10g -Xmx10g -XX:MaxDirectMemorySize=20g"}}

3.Broker调整项

配置项

说明

zookeeperServers=x.x.x.x:2181,x.x.x.x:2181,x.x.x.x:2181

本地zookeeper集群地址

configurationStoreServers=x.x.x.x:2181,x.x.x.x:2181,x.x.x.x:2181

配置存储Zookeeper集群地址

bindAddress=x.x.x.x

服务监听的地址,可以为本机IP,默认为0.0.0.0

advertisedAddress=x.x.x.x

服务向外发布的主机名或者IP,默认为IntetAddress.getLocalHost().getHostName

clusterName=cluster-xxx

集群名称

brokerDeleteInactiveTopicsEnabled=false

关闭自动删除不活动的主题

defaultNumberOfNamespaceBundles=12

Bundle的数量应为broker数量的整数倍,默认为4

defaultRetentionSizeInMB=1T

消费确认过的消息超过该⼤⼩后会触发删除策略

defaultRetentionTimeInMinutes=1w

消费确认过的消息超过指定时间后触发删除策略

backlogQuotaDefaultLimitGB=-1

保持默认,未被消费确认的消息⼤存储⼤⼩

默认为-1表示没有限制,可以通过set-message-ttl设置过期时间,防⽌磁盘爆满

backlogQuotaDefaultRetentionPolicy=producer_request_hold

保持默认,未被消费确认的消息超过存储⼤⼩的策略

managedLedgerDefaultEnsembleSize=3

创建Ledger时指定Ensemble的⼤⼩

managedLedgerDefaultWriteQuorum=3

创建Ledger时指定Quorum的⼤⼩

managedLedgerDefaultAckQuorum=2

创建Ledger时指定ack Quorum的⼤⼩

dispatcherMaxReadBatchSize=500

⼀次从bookkeeper读取的数量,默认为100条

loadBalancerAutoBundleSplitEnabled=false

关闭auto bundle split功能,提⾼客户端稳定性

loadBalancerAutoUnloadSplitBundlesEnabled=false

关闭auto bundle split功能,提⾼客户端稳定性

loadBalancerSheddingEnabled=false

禁⽌Pulsar⾃动均衡

loadBalancerEnabled=false

禁⽌Pulsar⾃动均衡

备注:参数根据实际情况调整,在线上开启负载均衡时,发现有重复消息,此处先将其关闭。

4.Bookie调整项

配置项说明

配置项

说明

zkServers=x.x.x.x:2181,x.x.x.x:2181,x.x.x.x:2181

本地zookeeper集群地址

journalDirectory=/data/bookkeeper/journal01,/data/bookkeeper/journal02

BookKeeper存储其预写⽇志的⽬录,多个⽬录逗号进⾏分割,防⽌线程阻塞

ledgerDirectories=/data/bookkeeper/ledgers01,/data/bookkeeper/ledgers02

指定存储BookKeeper输出ledger的⽬录。多个ledger⽬录,需要使⽤逗号分割

备注:journalDirectory和ledgerDirectories在条件允许的情况可以配置到不同的磁盘。

本文转载自微信公众号「瓜农老梁」,可以通过以下二维码关注。转载本文请联系瓜农老梁公众号。

文章来源网络,作者:运维,如若转载,请注明出处:https://shuyeidc.com/wp/253525.html<

(0)
运维的头像运维
上一篇2025-04-29 22:51
下一篇 2025-04-29 22:52

相关推荐

  • 个人主题怎么制作?

    制作个人主题是一个将个人风格、兴趣或专业领域转化为视觉化或结构化内容的过程,无论是用于个人博客、作品集、社交媒体账号还是品牌形象,核心都是围绕“个人特色”展开,以下从定位、内容规划、视觉设计、技术实现四个维度,详细拆解制作个人主题的完整流程,明确主题定位:找到个人特色的核心主题定位是所有工作的起点,需要先回答……

    2025-11-20
    0
  • 社群营销管理关键是什么?

    社群营销的核心在于通过建立有温度、有价值、有归属感的社群,实现用户留存、转化和品牌传播,其管理需贯穿“目标定位-内容运营-用户互动-数据驱动-风险控制”全流程,以下从五个维度展开详细说明:明确社群定位与目标社群管理的首要任务是精准定位,需明确社群的核心价值(如行业交流、产品使用指导、兴趣分享等)、目标用户画像……

    2025-11-20
    0
  • 香港公司网站备案需要什么材料?

    香港公司进行网站备案是一个涉及多部门协调、流程相对严谨的过程,尤其需兼顾中国内地与香港两地的监管要求,由于香港公司注册地与中国内地不同,其网站若主要服务内地用户或使用内地服务器,需根据服务器位置、网站内容性质等,选择对应的备案路径(如工信部ICP备案或公安备案),以下从备案主体资格、流程步骤、材料准备、注意事项……

    2025-11-20
    0
  • 如何企业上云推广

    企业上云已成为数字化转型的核心战略,但推广过程中需结合行业特性、企业痛点与市场需求,构建系统性、多维度的推广体系,以下从市场定位、策略设计、执行落地及效果优化四个维度,详细拆解企业上云推广的实践路径,精准定位:明确目标企业与核心价值企业上云并非“一刀切”的方案,需先锁定目标客户群体,提炼差异化价值主张,客户分层……

    2025-11-20
    0
  • PS设计搜索框的实用技巧有哪些?

    在PS中设计一个美观且功能性的搜索框需要结合创意构思、视觉设计和用户体验考量,以下从设计思路、制作步骤、细节优化及交互预览等方面详细说明,帮助打造符合需求的搜索框,设计前的规划明确使用场景:根据网站或APP的整体风格确定搜索框的调性,例如极简风适合细线条和纯色,科技感适合渐变和发光效果,电商类则可能需要突出搜索……

    2025-11-20
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注