kafkakafka 发送消息息的时候报超时，有人遇到过吗

solidworks | PHP | c4d | 细胞生物学 | HTML | 冬奥会 | 基因 | 营销策划 | 扫地机器人 | 武侠 | 大学生就业 | 电学 | 国航 | 电子技术研发 | 几何学 | 外星人 | 语言学 | 秦时明月之天行九歌 | 金融数学 | 三国人物 | 休学 | 小店区 | 杨紫 | 植保无人机 | CSS | 陶渊明 | 少数民族 | AutoCAD | 3d打印机 | 香港购物 | 日语语法 | 对联 | matlab | 按键精灵 | 粉丝（Fans） | 语言学习 | 总决赛 | 驾驶经验 | Spss数据分析 | 日本漫画 | 数学建模 | 道德 | 项目管理 | 背景音乐（bgm） | 云主机 | 3D Max | onenote | 游戏原画 | 科学 | 网站建设 | 热血传奇（游戏） | 身高 | 网站运营 | 道教 | 社会学 | 迅雷（软件） | 爬虫（计算机网络） | O2O | 运载火箭 | 遗传学 | 率土之滨 | 百度输入法 | 极限挑战(综艺节目) | 电梯 | 女性主义 | Adobe After Effects | mysql | 办公软件 | 法国 | ps3 | 化学实验 | QQ群 | 中国中央电视台 | 前女友 | 性格 | 免费软件 | 分子生物学 | 金庸小说 | 留学生 | Microsoft SQL Server | 龙珠 | 设计院 | C#编程 | 虚拟机 | 字幕 | 微信群 | 创业项目 | 祛痘 | 图形处理器（gpu） | Microsoft Visual Studio | 动物保护 | C/C++ | facebook | 秦岭 | 燕窝 | 人性 | 下载 | 驾驶技术 | 大学数学 | 封神演义 | 整容 | 西装 | 马克思主义哲学 | 计算机专业 | pdf | thinkpad | 代理 | 参考文献 | 江苏大学 | 游戏手柄 | 城市规划 | 黑洞 | 旅行 | CAD制图 | 风水 | 直播 | 快捷键 | 编辑器 | 机器学习 | 暴走大事件 | 球球大作战 | unity（游戏引擎） | 永恒之塔 | DJI大疆创新 | 传统文化 | wordpress | 仙剑奇侠传（游戏） | 国际物流 | 安徽 | 配音 | 猎头公司 | 在线教育 | 欧洲冠军联赛 | ios游戏 | 洛奇英雄传 | 暗恋 | 网盘 | 星座爱情 | 剧场版 | 面相 | 讯飞输入法 | 记忆力 | 超级战队 | stm32 | 亚马逊中国 | Apple ID | 服装设计 | 网络主播 | 品牌营销 | 情侣 | 新加坡 | 调酒 | 雷欧奥特曼 | 花样姐姐 | 物联网 | 任天堂3ds | 易经 | 户型 | 流氓软件 | 圣经 | 进化 | 垃圾分类 | 函数 | 星际穿越（电影） | 山东工艺美术学院 | 优酷视频 | github | 舰队 Collection | 流行音乐 | 进击的巨人 | playstation vita | 科学研究 | 欢乐麻将 | 史莱姆 | 海关 | Internet Explorer | 刑事案件 | 取名 | 江苏银行 | eDonkey网络 | 表情包 | mfc | 大学军训 | 诸葛亮 | Apple WATCH | 嵌入式系统 | 私募证券投资基金 | iOS应用 | 对外经贸大学 | 最强大脑（电视节目） | 青蛙 | 日本代购 | 巧克力 | 天涯明月刀ol（游戏） | 食用油 | 曹操 | SEO | 生命 | 乌贼 | 我的英雄学院 |

你的位置：网站首页 >> 频道首页 >>手机 >>kafkakafka 发送消息息的时候报超时，有人遇到过吗

kafkakafka 发送消息息的时候报超时，有人遇到过吗

来源：蜘蛛抓取(WebSpider) 时间：2016-08-12 06:01 标签： kafka批量发送

966,690 七月独立访问用户
语言 & 开发
架构 & 设计
文化 & 方法
您目前处于：
Apache Kafka —一个不同的消息系统
Apache Kafka —一个不同的消息系统
Bienvenido David
注意:，500+CTO技聚重新定义技术领导力！
Author Contacted
相关厂商内容
相关赞助商
QCon全球软件开发大会上海站，日-22日，上海宝华万豪酒店，！
告诉我们您的想法
允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p
当有人回复此评论时请E-mail通知我
感觉还不错
允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p
当有人回复此评论时请E-mail通知我
允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p
当有人回复此评论时请E-mail通知我
赞助商链接
架构 & 设计
文化 & 方法
<及所有内容，版权所有 ©
C4Media Inc.
服务器由提供, 我们最信赖的ISP伙伴。
北京创新网媒广告有限公司
京ICP备号-7
注意：如果要修改您的邮箱，我们将会发送确认邮件到您原来的邮箱。
使用现有的公司名称
修改公司名称为：
公司性质：
使用现有的公司性质
修改公司性质为:
使用现有的公司规模
修改公司规模为：
使用现在的国家
使用现在的省份
Subscribe to our newsletter?
Subscribe to our industry email notices?966,690 七月独立访问用户
语言 & 开发
架构 & 设计
文化 & 方法
您目前处于：
Kafka设计解析（三）：Kafka High Availability （下）
Kafka设计解析（三）：Kafka High Availability （下）
相关厂商内容
相关赞助商
CNUTCon2016容器实践经验谈专场，日即将开启，北京喜来登长城饭店芙蓉厅，！
3.2 决定该Partition的新Leader。如果当前ISR中有至少一个Replica还幸存，则选择其中一个作为新Leader，新的ISR则包含当前ISR中所有幸存的Replica。否则选择该Partition中任意一个幸存的Replica作为新的Leader以及ISR（该场景下可能会有潜在的数据丢失）。如果该Partition的所有Replica都宕机了，则将新的Leader设置为-1。
3.3 将新的Leader，ISR和新的leader_epoch及controller_epoch写入/brokers/topics/[topic]/partitions/[partition]/state。注意，该操作只有Controller版本在3.1至3.3的过程中无变化时才会执行，否则跳转到3.1。
直接通过RPC向set_p相关的Broker发送LeaderAndISRRequest命令。Controller可以在一个RPC操作中发送多个命令从而提高效率。
Broker failover顺序图如下所示。
LeaderAndIsrRequest结构如下
LeaderAndIsrResponse结构如下
创建/删除Topic
Controller在ZooKeeper的/brokers/topics节点上注册Watch，一旦某个Topic被创建或删除，则Controller会通过Watch得到新创建/删除的Topic的Partition/Replica分配。
对于删除Topic操作，Topic工具会将该Topic名字存于/admin/delete_topics。若delete.topic.enable为true，则Controller注册在/admin/delete_topics上的Watch被fire，Controller通过回调向对应的Broker发送StopReplicaRequest，若为false则Controller不会在/admin/delete_topics上注册Watch，也就不会对该事件作出反应。
对于创建Topic操作，Controller从/brokers/ids读取当前所有可用的Broker列表，对于set_p中的每一个Partition：
3.1 从分配给该Partition的所有Replica（称为AR）中任选一个可用的Broker作为新的Leader，并将AR设置为新的ISR（因为该Topic是新创建的，所以AR中所有的Replica都没有数据，可认为它们都是同步的，也即都在ISR中，任意一个Replica都可作为Leader）
3.2 将新的Leader和ISR写入/brokers/topics/[topic]/partitions/[partition]
直接通过RPC向相关的Broker发送LeaderAndISRRequest。
创建Topic顺序图如下所示。
Broker响应请求流程
Broker通过kafka.network.SocketServer及相关模块接受各种请求并作出响应。整个网络通信模块基于Java NIO开发，并采用Reactor模式，其中包含1个Acceptor负责接受客户请求，N个Processor负责读写数据，M个Handler处理业务逻辑。
Acceptor的主要职责是监听并接受客户端（请求发起方，包括但不限于Producer，Consumer，Controller，Admin Tool）的连接请求，并建立和客户端的数据传输通道，然后为该客户端指定一个Processor，至此它对该客户端该次请求的任务就结束了，它可以去响应下一个客户端的连接请求了。其核心代码如下。
Processor主要负责从客户端读取数据并将响应返回给客户端，它本身并不处理具体的业务逻辑，并且其内部维护了一个队列来保存分配给它的所有SocketChannel。Processor的run方法会循环从队列中取出新的SocketChannel并将其SelectionKey.OP_READ注册到selector上，然后循环处理已就绪的读（请求）和写（响应）。Processor读取完数据后，将其封装成Request对象并将其交给RequestChannel。
RequestChannel是Processor和KafkaRequestHandler交换数据的地方，它包含一个队列requestQueue用来存放Processor加入的Request，KafkaRequestHandler会从里面取出Request来处理；同时它还包含一个respondQueue，用来存放KafkaRequestHandler处理完Request后返还给客户端的Response。
Processor会通过processNewResponses方法依次将requestChannel中responseQueue保存的Response取出，并将对应的SelectionKey.OP_WRITE事件注册到selector上。当selector的select方法返回时，对检测到的可写通道，调用write方法将Response返回给客户端。
KafkaRequestHandler循环从RequestChannel中取Request并交给kafka.server.KafkaApis处理具体的业务逻辑。
LeaderAndIsrRequest响应过程
对于收到的LeaderAndIsrRequest，Broker主要通过ReplicaManager的becomeLeaderOrFollower处理，流程如下：
若请求中controllerEpoch小于当前最新的controllerEpoch，则直接返回ErrorMapping.StaleControllerEpochCode。
对于请求中partitionStateInfos中的每一个元素，即（(topic, partitionId), partitionStateInfo)：
2.1 若partitionStateInfo中的leader epoch大于当前ReplicManager中存储的(topic, partitionId)对应的partition的leader epoch，则：
2.1.1 若当前brokerid（或者说replica id）在partitionStateInfo中，则将该partition及partitionStateInfo存入一个名为partitionState的HashMap中
2.1.2 否则说明该Broker不在该Partition分配的Replica list中，将该信息记录于log中
2.2 否则将相应的Error code（ErrorMapping.StaleLeaderEpochCode）存入Response中
筛选出partitionState中Leader与当前Broker ID相等的所有记录存入partitionsTobeLeader中，其它记录存入partitionsToBeFollower中。
若partitionsTobeLeader不为空，则对其执行makeLeaders方。
若partitionsToBeFollower不为空，则对其执行makeFollowers方法。
若highwatermak线程还未启动，则将其启动，并将hwThreadInitialized设为true。
关闭所有Idle状态的Fetcher。
LeaderAndIsrRequest处理过程如下图所示
Broker启动过程
Broker启动后首先根据其ID在ZooKeeper的/brokers/idszonde下创建临时子节点（），创建成功后Controller的ReplicaStateMachine注册其上的Broker Change Watch会被fire，从而通过回调KafkaController.onBrokerStartup方法完成以下步骤：
向所有新启动的Broker发送UpdateMetadataRequest，其定义如下。
将新启动的Broker上的所有Replica设置为OnlineReplica状态，同时这些Broker会为这些Partition启动high watermark线程。
通过partitionStateMachine触发OnlinePartitionStateChange。
Controller Failover
Controller也需要Failover。每个Broker都会在Controller Path (/controller)上注册一个Watch。当前Controller失败时，对应的Controller Path会自动消失（因为它是Ephemeral Node），此时该Watch被fire，所有&活&着的Broker都会去竞选成为新的Controller（创建新的Controller Path），但是只会有一个竞选成功（这点由ZooKeeper保证）。竞选成功者即为新的Leader，竞选失败者则重新在新的Controller Path上注册Watch。因为，所以需要重新注册。
Broker成功竞选为新Controller后会触发KafkaController.onControllerFailover方法，并在该方法中完成如下操作：
读取并增加Controller Epoch。
在ReassignedPartitions Patch(/admin/reassign_partitions)上注册Watch。
在PreferredReplicaElection Path(/admin/preferred_replica_election)上注册Watch。
通过partitionStateMachine在Broker Topics Patch(/brokers/topics)上注册Watch。
若delete.topic.enable设置为true（默认值是false），则partitionStateMachine在Delete Topic Patch(/admin/delete_topics)上注册Watch。
通过replicaStateMachine在Broker Ids Patch(/brokers/ids)上注册Watch。
初始化ControllerContext对象，设置当前所有Topic，&活&着的Broker列表，所有Partition的Leader及ISR等。
启动replicaStateMachine和partitionStateMachine。
将brokerState状态设置为RunningAsController。
将每个Partition的Leadership信息发送给所有&活&着的Broker。
若auto.leader.rebalance.enable配置为true（默认值是true），则启动partition-rebalance线程。
若delete.topic.enable设置为true且Delete Topic Patch(/admin/delete_topics)中有值，则删除相应的Topic。
Partition重新分配
管理工具发出重新分配Partition请求后，会将相应信息写到/admin/reassign_partitions上，而该操作会触发ReassignedPartitionsIsrChangeListener，从而通过执行回调函数KafkaController.onPartitionReassignment来完成以下操作：
将ZooKeeper中的AR（Current Assigned Replicas）更新为OAR（Original list of replicas for partition） + RAR（Reassigned replicas）。
强制更新ZooKeeper中的leader epoch，向AR中的每个Replica发送LeaderAndIsrRequest。
将RAR - OAR中的Replica设置为NewReplica状态。
等待直到RAR中所有的Replica都与其Leader同步。
将RAR中所有的Replica都设置为OnlineReplica状态。
将Cache中的AR设置为RAR。
若Leader不在RAR中，则从RAR中重新选举出一个新的Leader并发送LeaderAndIsrRequest。若新的Leader不是从RAR中选举而出，则还要增加ZooKeeper中的leader epoch。
将OAR - RAR中的所有Replica设置为OfflineReplica状态，该过程包含两部分。第一，将ZooKeeper上ISR中的OAR - RAR移除并向Leader发送LeaderAndIsrRequest从而通知这些Replica已经从ISR中移除；第二，向OAR - RAR中的Replica发送StopReplicaRequest从而停止不再分配给该Partition的Replica。
将OAR - RAR中的所有Replica设置为NonExistentReplica状态从而将其从磁盘上删除。
将ZooKeeper中的AR设置为RAR。
删除/admin/reassign_partition。
注意：最后一步才将ZooKeeper中的AR更新，因为这是唯一一个持久存储AR的地方，如果Controller在这一步之前crash，新的Controller仍然能够继续完成该过程。
以下是Partition重新分配的案例，OAR = ｛1，2，3｝，RAR = ｛4，5，6｝，Partition重新分配过程中ZooKeeper中的AR和Leader/ISR路径如下
leader/isr
(initial state)
{1,2,3,4,5,6}
{1,2,3,4,5,6}
1/{1,2,3,4,5,6}
{1,2,3,4,5,6}
4/{1,2,3,4,5,6}
{1,2,3,4,5,6}
Follower从Leader Fetch数据
Follower通过向Leader发送FetchRequest获取消息，FetchRequest结构如下
从FetchRequest的结构可以看出，每个Fetch请求都要指定最大等待时间和最小获取字节数，以及由TopicAndPartition和PartitionFetchInfo构成的Map。实际上，Follower从Leader数据和Consumer从Broker Fetch数据，都是通过FetchRequest请求完成，所以在FetchRequest结构中，其中一个字段是clientID，并且其默认值是ConsumerConfig.DefaultClientId。
Leader收到Fetch请求后，Kafka通过KafkaApis.handleFetchRequest响应该请求，响应过程如下：
replicaManager根据请求读出数据存入dataRead中。
如果该请求来自Follower则更新其相应的LEO（log end offset）以及相应Partition的High Watermark
根据dataRead算出可读消息长度（单位为字节）并存入bytesReadable中。
满足下面4个条件中的1个，则立即将相应的数据返回
Fetch请求不希望等待，即fetchRequest.macWait &= 0
Fetch请求不要求一定能取到消息，即fetchRequest.numPartitions &= 0，也即requestInfo为空
有足够的数据可供返回，即bytesReadable &= fetchRequest.minBytes
读取数据时发生异常
若不满足以上4个条件，FetchRequest将不会立即返回，并将该请求封装成DelayedFetch。检查该DeplayedFetch是否满足，若满足则返回请求，否则将该请求加入Watch列表
Leader通过以FetchResponse的形式将消息返回给Follower，FetchResponse结构如下
Replication工具
Topic Tool
$KAFKA_HOME/bin/kafka-topics.sh，该工具可用于创建、删除、修改、查看某个Topic，也可用于列出所有Topic。另外，该工具还可修改某个Topic的以下配置。
unclean.leader.election.enable
delete.retention.ms
segment.jitter.ms
retention.ms
segment.bytes
flush.messages
segment.ms
retention.bytes
cleanup.policy
segment.index.bytes
min.cleanable.dirty.ratio
max.message.bytes
file.delete.delay.ms
min.insync.replicas
index.interval.bytes
Replica Verification Tool
$KAFKA_HOME/bin/kafka-replica-verification.sh，该工具用来验证所指定的一个或多个Topic下每个Partition对应的所有Replica是否都同步。可通过topic-white-list这一参数指定所需要验证的所有Topic，支持正则表达式。
Preferred Replica Leader Election Tool
有了Replication机制后，每个Partition可能有多个备份。某个Partition的Replica列表叫作AR（Assigned Replicas），AR中的第一个Replica即为&Preferred Replica&。创建一个新的Topic或者给已有Topic增加Partition时，Kafka保证Preferred Replica被均匀分布到集群中的所有Broker上。理想情况下，Preferred Replica会被选为Leader。以上两点保证了所有Partition的Leader被均匀分布到了集群当中，这一点非常重要，因为所有的读写操作都由Leader完成，若Leader分布过于集中，会造成集群负载不均衡。但是，随着集群的运行，该平衡可能会因为Broker的宕机而被打破，该工具就是用来帮助恢复Leader分配的平衡。
事实上，每个Topic从失败中恢复过来后，它默认会被设置为Follower角色，除非某个Partition的Replica全部宕机，而当前Broker是该Partition的AR中第一个恢复回来的Replica。因此，某个Partition的Leader（Preferred Replica）宕机并恢复后，它很可能不再是该Partition的Leader，但仍然是Preferred Replica。
1. 在ZooKeeper上创建/admin/preferred_replica_election节点，并存入需要调整Preferred Replica的Partition信息。
2. Controller一直Watch该节点，一旦该节点被创建，Controller会收到通知，并获取该内容。
3. Controller读取Preferred Replica，如果发现该Replica当前并非是Leader并且它在该Partition的ISR中，Controller向该Replica发送LeaderAndIsrRequest，使该Replica成为Leader。如果该Replica当前并非是Leader，且不在ISR中，Controller为了保证没有数据丢失，并不会将其设置为Leader。
$KAFKA_HOME/bin/kafka-preferred-replica-election.sh --zookeeper localhost:2181
在包含8个Broker的Kafka集群上，创建1个名为topic1，replication-factor为3，Partition数为8的Topic，使用如下命令查看其Partition/Replica分布。
$KAFKA_HOME/bin/kafka-topics.sh --describe --topic topic1 --zookeeper localhost:2181
查询结果如下图所示，从图中可以看到，Kafka将所有Replica均匀分布到了整个集群，并且Leader也均匀分布。
手动停止部分Broker，topic1的Partition/Replica分布如下图所示。从图中可以看到，由于Broker 1/2/4都被停止，Partition 0的Leader由原来的1变为3，Partition 1的Leader由原来的2变为5，Partition 2的Leader由原来的3变为6，Partition 3的Leader由原来的4变为7。
再重新启动ID为1的Broker，topic1的Partition/Replica分布如下。可以看到，虽然Broker 1已经启动（Partition 0和Partition5的ISR中有1），但是1并不是任何一个Parititon的Leader，而Broker 5/6/7都是2个Partition的Leader，即Leader的分布不均衡&&一个Broker最多是2个Partition的Leader，而最少是0个Partition的Leader。
运行该工具后，topic1的Partition/Replica分布如下图所示。由图可见，除了Partition 1和Partition 3由于Broker 2和Broker 4还未启动，所以其Leader不是其Preferred Repliac外，其它所有Partition的Leader都是其Preferred Replica。同时，与运行该工具前相比，Leader的分配更均匀&&一个Broker最多是2个Parittion的Leader，最少是1个Partition的Leader。
启动Broker 2和Broker 4，Leader分布与上一步相比并未变化，如下图所示。
再次运行该工具，所有Partition的Leader都由其Preferred Replica承担，Leader分布更均匀&&每个Broker承担1个Partition的Leader角色。
除了手动运行该工具使Leader分配均匀外，Kafka还提供了自动平衡Leader分配的功能，该功能可通过将auto.leader.rebalance.enable设置为true开启，它将周期性检查Leader分配是否平衡，若不平衡度超过一定阈值则自动由Controller尝试将各Partition的Leader设置为其Preferred Replica。检查周期由leader.imbalance.check.interval.seconds指定，不平衡度阈值由leader.imbalance.per.broker.percentage指定。
Kafka Reassign Partitions Tool
该工具的设计目标与Preferred Replica Leader Election Tool有些类似，都旨在促进Kafka集群的负载均衡。不同的是，Preferred Replica Leader Election只能在Partition的AR范围内调整其Leader，使Leader分布均匀，而该工具还可以调整Partition的AR。
Follower需要从Leader Fetch数据以保持与Leader同步，所以仅仅保持Leader分布的平衡对整个集群的负载均衡来说是不够的。另外，生产环境下，随着负载的增大，可能需要给Kafka集群扩容。向Kafka集群中增加Broker非常简单方便，但是对于已有的Topic，并不会自动将其Partition迁移到新加入的Broker上，此时可用该工具达到此目的。某些场景下，实际负载可能远小于最初预期负载，此时可用该工具将分布在整个集群上的Partition重装分配到某些机器上，然后可以停止不需要的Broker从而实现节约资源的目的。
需要说明的是，该工具不仅可以调整Partition的AR位置，还可调整其AR数量，即改变该Topic的replication factor。
该工具只负责将所需信息存入ZooKeeper中相应节点，然后退出，不负责相关的具体操作，所有调整都由Controller完成。
1. 在ZooKeeper上创建/admin/reassign_partitions节点，并存入目标Partition列表及其对应的目标AR列表。
2. Controller注册在/admin/reassign_partitions上的Watch被fire，Controller获取该列表。
3. 对列表中的所有Partition，Controller会做如下操作：
启动RAR - AR中的Replica，即新分配的Replica。（RAR = Reassigned Replicas， AR = Assigned Replicas）
等待新的Replica与Leader同步
如果Leader不在RAR中，从RAR中选出新的Leader
停止并删除AR - RAR中的Replica，即不再需要的Replica
删除/admin/reassign_partitions节点
该工具有三种使用模式
generate模式，给定需要重新分配的Topic，自动生成reassign plan（并不执行）
execute模式，根据指定的reassign plan重新分配Partition
verify模式，验证重新分配Partition是否成功
下面这个例子将使用该工具将Topic的所有Partition重新分配到Broker 4/5/6/7上，步骤如下：
1. 使用generate模式，生成reassign plan
指定需要重新分配的Topic （{&topics&:[{&topic&:&topic1&}],&version&:1}），并存入/tmp/topics-to-move.json文件中，然后执行如下命令
$KAFKA_HOME/bin/kafka-reassign-partitions.sh --zookeeper localhost:2181
--topics-to-move-json-file /tmp/topics-to-move.json
--broker-list &4,5,6,7& --generate
结果如下图所示
2. 使用execute模式，执行reassign plan
将上一步生成的reassignment plan存入/tmp/reassign-plan.json文件中，并执行
$KAFKA_HOME/bin/kafka-reassign-partitions.sh --zookeeper localhost:2181
--reassignment-json-file /tmp/reassign-plan.json --execute
此时，ZooKeeper上/admin/reassign_partitions节点被创建，且其值与/tmp/reassign-plan.json文件的内容一致。
3. 使用verify模式，验证reassign是否完成
执行verify命令
$KAFKA_HOME/bin/kafka-reassign-partitions.sh --zookeeper localhost:2181
--reassignment-json-file /tmp/reassign-plan.json --verify
结果如下所示，从图中可看出topic1的所有Partititon都根据reassign plan重新分配成功。
接下来用Topic Tool再次验证。
bin/kafka-topics.sh --zookeeper localhost:2181 --describe --topic topic1
结果如下图所示，从图中可看出topic1的所有Partition都被重新分配到Broker 4/5/6/7，且每个Partition的AR与reassign plan一致。
需要说明的是，在使用execute之前，并不一定要使用generate模式自动生成reassign plan，使用generate模式只是为了方便。事实上，某些场景下，generate模式生成的reassign plan并不一定能满足需求，此时用户可以自己设置reassign plan。
State Change Log Merge Tool
该工具旨在从整个集群的Broker上收集状态改变日志，并生成一个集中的格式化的日志以帮助诊断状态改变相关的故障。每个Broker都会将其收到的状态改变相关的的指令存于名为state-change.log的日志文件中。某些情况下，Partition的Leader election可能会出现问题，此时我们需要对整个集群的状态改变有个全局的了解从而诊断故障并解决问题。该工具将集群中相关的state-change.log日志按时间顺序合并，同时支持用户输入时间范围和目标Topic及Partition作为过滤条件，最终将格式化的结果输出。
bin/kafka-run-class.sh kafka.tools.StateChangeLogMerger
--logs /opt/kafka_2.11-0.8.2.1/logs/state-change.log
--topic topic1 --partitions 0,1,2,3,4,5,6,7
郭俊（Jason），硕士，从事大数据平台研发工作，精通Kafka等分布式消息系统，Storm等流式处理系统及数据库性能调优。
新浪微博：
个人博客：
下篇文章将详细介绍Kafka High Level Consumer，Consumer Group，Consumer Group Rebalance和Simple Consumer，以及未来新版本中对Kafka High Level Consumer的重新设计&&使用Consumer Controller解决Split Brain和Herd等问题。
感谢对本文的策划和审校。
给InfoQ中文站投稿或者参与内容翻译工作，请邮件至。也欢迎大家通过新浪微博（，），微信（微信号：）关注我们，并与我们的编辑和其他读者朋友交流（欢迎加入InfoQ读者交流群）。
Author Contacted
告诉我们您的想法
允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p
当有人回复此评论时请E-mail通知我
允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p
当有人回复此评论时请E-mail通知我
允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p
当有人回复此评论时请E-mail通知我
赞助商链接
InfoQ每周精要
通过个性化定制的新闻邮件、RSS Feeds和InfoQ业界邮件通知，保持您对感兴趣的社区内容的时刻关注。
架构 & 设计
文化 & 方法
<及所有内容，版权所有 ©
C4Media Inc.
服务器由提供, 我们最信赖的ISP伙伴。
北京创新网媒广告有限公司
京ICP备号-7
注意：如果要修改您的邮箱，我们将会发送确认邮件到您原来的邮箱。
使用现有的公司名称
修改公司名称为：
公司性质：
使用现有的公司性质
修改公司性质为:
使用现有的公司规模
修改公司规模为：
使用现在的国家
使用现在的省份
Subscribe to our newsletter?
Subscribe to our industry email notices?logstash联合python kafka进行异常数据监控 | 峰云就她了
6,051 views
kafka的优点，我想大家应该知道…. 一个可以支撑大流量的消息系统, 要比redis靠谱点，毕竟人家数据可以落地硬盘…
现在所有的日志都通过logstash收集到了elasticsearch里面。我们可以通过kibana来进行查看各种日志报表，但是问题是我们如何针对某些异常进行告警… & 比如我临时要过滤些条件，比如出现某种ERROR，又或者爬虫服务的xx.com出现了大量的超时，某些页面因为改版，导致我们抓不到他的具体信息了。
文章写的不是很严谨，欢迎来喷，另外该文后续有更新的，请到原文地址查看更新.&
对于kafka服务端的安装是有些麻烦的，另外它是需要zookeeper协同调度的。 & 我这边就不说kafka安装流程了，大家自己找个文档搞搞就行了。&我们的模块都是在docker服务器上，就顺手也pull了一个docker化的kafka和zookeeper。&
docker pull spotify/kafka
docker run -p
--env ADVERTISED_HOST=`boot2docker ip` --env ADVERTISED_PORT=9092 spotify/kafka
export KAFKA=`boot2docker ip`:9092
kafka-console-producer.sh --broker-list $KAFKA --topic test
export ZOOKEEPER=`boot2docker ip`:2181
kafka-console-consumer.sh --zookeeper $ZOOKEEPER --topic test
&docker pull spotify/kafkadocker run -p 2181:2181 -p 9092:9092 --env ADVERTISED_HOST=`boot2docker ip` --env ADVERTISED_PORT=9092 spotify/kafkaexport KAFKA=`boot2docker ip`:9092kafka-console-producer.sh --broker-list $KAFKA --topic testexport ZOOKEEPER=`boot2docker ip`:2181kafka-console-consumer.sh --zookeeper $ZOOKEEPER --topic test
下面的是logstash相关的配置，我们以前是直接在agent端把output扔到es里面，随着量级的增大，就改放到了redis里做broker消息队列。 &现在要利用kafka做发布，那么我们只需要加入kafka就可以了。&
这里有人可能疑惑了，为毛不直接解析进行监控？ &直接Elasticsearch？你怎么知道什么时候会出现某个条件的异常？ &难道要实时的去query es？ & 大家要知道logstash很好的帮助大家做好了日志的切分，tail，offset机制。
zk_connect =& ... # string (optional), default: "localhost:2181"
group_id =& ... # string (optional), default: "logstash"
topic_id =& ... # string (optional), default: "test"
reset_beginning =& ... # boolean (optional), default: false
consumer_threads =& ... # number (optional), default: 1
queue_size =& ... # number (optional), default: 20
rebalance_max_retries =& ... # number (optional), default: 4
rebalance_backoff_ms =& ... # number (optional), default:
consumer_timeout_ms =& ... # number (optional), default: -1
consumer_restart_on_error =& ... # boolean (optional), default: true
consumer_restart_sleep_ms =& ... # number (optional), default: 0
decorate_events =& ... # boolean (optional), default: false
consumer_id =& ... # string (optional) default: nil
fetch_message_max_bytes =& ... # number (optional) default: 1048576
12345678910111213141516171819
&# input {&&&&kafka {&&&&&&&&zk_connect =& ... # string (optional), default: "localhost:2181"&&&&&&&&group_id =& ... # string (optional), default: "logstash"&&&&&&&&topic_id =& ... # string (optional), default: "test"&&&&&&&&reset_beginning =& ... # boolean (optional), default: false&&&&&&&&consumer_threads =& ... # number (optional), default: 1&&&&&&&&queue_size =& ... # number (optional), default: 20&&&&&&&&rebalance_max_retries =& ... # number (optional), default: 4&&&&&&&&rebalance_backoff_ms =& ... # number (optional), default:&&2000&&&&&&&&consumer_timeout_ms =& ... # number (optional), default: -1&&&&&&&&consumer_restart_on_error =& ... # boolean (optional), default: true&&&&&&&&consumer_restart_sleep_ms =& ... # number (optional), default: 0&&&&&&&&decorate_events =& ... # boolean (optional), default: false&&&&&&&&consumer_id =& ... # string (optional) default: nil&&&&&&&&fetch_message_max_bytes =& ... # number (optional) default: 1048576&&&&}}
这是output输出
# output {
broker_list =& ... # string (optional), default: "localhost:9092"
topic_id =& ... # string (optional), default: "test"
compression_codec =& ... # string (optional), one of ["none", "gzip", "snappy"], default: "none"
compressed_topics =& ... # string (optional), default: ""
request_required_acks =& ... # number (optional), one of [-1, 0, 1], default: 0
serializer_class =& ... # string, (optional) default: "kafka.serializer.StringEncoder"
partitioner_class =& ... # string (optional) default: "kafka.producer.DefaultPartitioner"
request_timeout_ms =& ... # number (optional) default: 10000
producer_type =& ... # string (optional), one of ["sync", "async"] default =& 'sync'
key_serializer_class =& ... # string (optional) default: "kafka.serializer.StringEncoder"
message_send_max_retries =& ... # number (optional) default: 3
retry_backoff_ms =& ... # number (optional) default: 100
topic_metadata_refresh_interval_ms =& ... # number (optional) default: 600 * 1000
queue_buffering_max_ms =& ... # number (optional) default: 5000
queue_buffering_max_messages =& ... # number (optional) default: 10000
queue_enqueue_timeout_ms =& ... # number (optional) default: -1
batch_num_messages =& ... # number (optional) default: 200
send_buffer_bytes =& ... # number (optional) default: 100 * 1024
client_id =& ... # string (optional) default: ""
123456789101112131415161718192021222324
&# output {&&&&kafka {&&&&&&&&broker_list =& ... # string (optional), default: "localhost:9092"&&&&&&&&topic_id =& ... # string (optional), default: "test"&&&&&&&&compression_codec =& ... # string (optional), one of ["none", "gzip", "snappy"], default: "none"&&&&&&&&compressed_topics =& ... # string (optional), default: ""&&&&&&&&request_required_acks =& ... # number (optional), one of [-1, 0, 1], default: 0&&&&&&&&serializer_class =& ... # string, (optional) default: "kafka.serializer.StringEncoder"&&&&&&&&partitioner_class =& ... # string (optional) default: "kafka.producer.DefaultPartitioner"&&&&&&&&request_timeout_ms =& ... # number (optional) default: 10000&&&&&&&&producer_type =& ... # string (optional), one of ["sync", "async"] default =& 'sync'&&&&&&&&key_serializer_class =& ... # string (optional) default: "kafka.serializer.StringEncoder"&&&&&&&&message_send_max_retries =& ... # number (optional) default: 3&&&&&&&&retry_backoff_ms =& ... # number (optional) default: 100&&&&&&&&topic_metadata_refresh_interval_ms =& ... # number (optional) default: 600 * 1000&&&&&&&&queue_buffering_max_ms =& ... # number (optional) default: 5000&&&&&&&&queue_buffering_max_messages =& ... # number (optional) default: 10000&&&&&&&&queue_enqueue_timeout_ms =& ... # number (optional) default: -1&&&&&&&&batch_num_messages =& ... # number (optional) default: 200&&&&&&&&send_buffer_bytes =& ... # number (optional) default: 100 * 1024&&&&&&&&client_id =& ... # string (optional) default: ""&&&&}}
上线是关于logstash里面关于kafka的input output的配置，我们再来看看同时订阅kafka broker的python程序是如何跑的。 & 具体代码我就不贴了，你可以通过一个demo很容易进行扩展.&
#!/usr/bin/env python
#blog: xiaorui.cc
import threading, logging, time
from kafka.client import KafkaClient
from kafka.consumer import SimpleConsumer
from kafka.producer import SimpleProducer
#这个是喂数据的
class Producer(threading.Thread):
daemon = True
def run(self):
client = KafkaClient("localhost:9092")
producer = SimpleProducer(client)
while True:
producer.send_messages('my-topic', "test")
producer.send_messages('my-topic', "\xc2Hola, mundo!")
time.sleep(1)
#这个是消费者，也就是咱们从kafka取数据的逻辑。
class Consumer(threading.Thread):
daemon = True
def run(self):
client = KafkaClient("localhost:9092")
consumer = SimpleConsumer(client, "test-group", "my-topic")
for message in consumer:
print(message)
def main():
threads = [
Producer(),
Consumer()
for t in threads:
time.sleep(5)
if __name__ == "__main__":
logging.basicConfig(
format='%(asctime)s.%(msecs)s:%(name)s:%(thread)d:%(levelname)s:%(process)d:%(message)s',
level=logging.DEBUG
123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051
&#!/usr/bin/env python#blog: xiaorui.ccimport threading, logging, time&from kafka.client import KafkaClientfrom kafka.consumer import SimpleConsumerfrom kafka.producer import SimpleProducer&#这个是喂数据的class Producer(threading.Thread):&&&&daemon = True&&&&&def run(self):&&&&&&&&client = KafkaClient("localhost:9092")&&&&&&&&producer = SimpleProducer(client)&&&&&&&&&while True:&&&&&&&&&&&&producer.send_messages('my-topic', "test")&&&&&&&&&&&&producer.send_messages('my-topic', "\xc2Hola, mundo!")&&&&&&&&&&&&&time.sleep(1)&#这个是消费者，也就是咱们从kafka取数据的逻辑。 class Consumer(threading.Thread):&&&&daemon = True&&&&&def run(self):&&&&&&&&client = KafkaClient("localhost:9092")&&&&&&&&consumer = SimpleConsumer(client, "test-group", "my-topic")&&&&&&&&&for message in consumer:&&&&&&&&&&&&print(message)&def main():&&&&threads = [&&&&&&&&Producer(),&&&&&&&&Consumer()&&&&]&&&&&for t in threads:&&&&&&&&t.start()&&&&&time.sleep(5)&if __name__ == "__main__":&&&&logging.basicConfig(&&&&&&&&format='%(asctime)s.%(msecs)s:%(name)s:%(thread)d:%(levelname)s:%(process)d:%(message)s',&&&&&&&&level=logging.DEBUG&&&&&&&&)&&&&main()
另外python kafka里面是支持多个consumer的, &要注意kafka的分区数量.
from kafka import KafkaClient, MultiProcessConsumer
kafka = KafkaClient("localhost:9092")
consumer = MultiProcessConsumer(kafka, "my-group", "my-topic", num_procs=2)
consumer = MultiProcessConsumer(kafka, "my-group", "my-topic",
partitions_per_proc=2)
for message in consumer:
print(message)
for message in consumer.get_messages(count=5, block=True, timeout=4):
print(message)
12345678910111213141516
&from kafka import KafkaClient, MultiProcessConsumer&kafka = KafkaClient("localhost:9092")&&consumer = MultiProcessConsumer(kafka, "my-group", "my-topic", num_procs=2)&consumer = MultiProcessConsumer(kafka, "my-group", "my-topic",&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&partitions_per_proc=2)&for message in consumer:&&&&print(message)&for message in consumer.get_messages(count=5, block=True, timeout=4):&&&&print(message)
本来是想写监控跟报警的….&就先这样了，文章写得有些乱. & 主题是，推荐大家使用kafka替换redis，如果出现后端的存储出现问题，那么就需要使用redis内存抗住数据…. kafka明显更合适.
如果大家觉得文章对你有些作用！ &
帮忙点击广告. 一来能刺激我写博客的欲望，二来好维护云主机的费用.
如果想赏钱，可以用微信扫描下面的二维码. 另外再次标注博客原地址 && …… &&感谢！
您可能也喜欢:
暂无相关产品

kafkakafka 发送消息息的时候报超时，有人遇到过吗

我要回帖

更多关于 kafka批量发送的文章

随机推荐

kafkakafka 发送消息息的时候报超时，有人遇到过吗

我要回帖

更多关于 kafka批量发送 的文章

随机推荐

更多关于 kafka批量发送的文章