Flume聚合的原理与实现
发布日期:2021-09-27 12:34:39 浏览次数:2 分类:技术文章

本文共 1351 字,大约阅读时间需要 4 分钟。

原理

在这里插入图片描述

在每个服务器部署flume采集日志,由这些flume传输数据到统一收集日志的flume节点,最后由此flume将数据写入指定位置。

案例

hadoop01上的Flume-1监控文件/opt/module/group.log,

hadoop02上的Flume-2监控某一个端口的数据流,
Flume-1与Flume-2将数据发送给hadoop03上的Flume-3,Flume-3将最终数据打印到控制台。
在这里插入图片描述

实现

# agent1# 定义sources、channels、sinksa1.sources = r1a1.channels = c1a1.sinks = k1# 配置sourcea1.sources.r1.type = TAILDIR# 日志索引记录a1.sources.r1.positionFile = /opt/module/flume/inode/taildir_position.json# 文件组a1.sources.r1.filegroups = f1a1.sources.r1.filegroups.f1 = /opt/module/group.log# 配置channela1.channels.c1.type = memory# 配置sinka1.sinks.k1.type = avroa1.sinks.k1.hostname = hadoop03a1.sinks.k1.port = 6666# 配置source、channel、sink关系a1.sources.r1.channels = c1a1.sinks.k1.channel = c1
# agent2# 定义sources、channels、sinksa1.sources = r1a1.channels = c1a1.sinks = k1# 配置sourcea1.sources.r1.type = netcata1.sources.r1.bind = hadoop02a1.sources.r1.port = 44444# channela1.channels.c1.type = memory# sinka1.sinks.k1.type = avroa1.sinks.k1.hostname = hadoop03a1.sinks.k1.port = 6666# 配置关系a1.sources.r1.channels = c1a1.sinks.k1.channel = c1
# agent3# 定义sources、channels、sinksa1.sources = r1a1.channels = c1a1.sinks = k1# 配置sourcea1.sources.r1.type = avroa1.sources.r1.bind = hadoop03a1.sources.r1.port = 6666# channela1.channels.c1.type = memory# sinka1.sinks.k1.type = logger# 配置关系a1.sources.r1.channels = c1a1.sinks.k1.channel = c1

先启动数据接收端,再启动数据发送端。

转载地址:https://blog.csdn.net/FlatTiger/article/details/114022601 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:使用NetCat0.7.1进行消息传递
下一篇:Flume负载均衡与故障转移原理及实现

发表评论

最新留言

留言是一种美德,欢迎回访!
[***.207.175.100]2024年04月21日 11时18分03秒