博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
flume1.8实现hdfsSink整点滚动文件
阅读量:5884 次
发布时间:2019-06-19

本文共 819 字,大约阅读时间需要 2 分钟。

由于官方的1.8版本hdfs-sink不能在每天的0点滚动文件,所以修改了flume-hdfs-sink源码。

flume-hdfs-sink中修改了HDFSEventSink.java文件,其他文件未改动。

使用该程序打包,替换掉官方到flume-hdfs-sink.jar(建议备份一份), 也可以直接下载编译后的jjar包。

然后在配置hdfsSink时增加以下配置项
timeRollerFlag     

默认值: day

可以设置minutes, hour, day 

minutes 每分钟滚动文件

hour 每小时滚动文件

day 每天0点滚动文件

 
 
 
 
 
 
 
 
 
 
hdfsSink的配置如下:
paas2.sinks.k1.type = hdfspaas2.sinks.k1.hdfs.path = hdfs://ns1/user/hive/warehouse/dw_stg.db/tg_paas_business/dt=%Y%m%dpaas2.sinks.k1.hdfs.filePrefix = paas_business_%Y%m%dpaas2.sinks.k1.hdfs.fileSuffix = .jsonpaas2.sinks.k1.hdfs.rollInterval = 0paas2.sinks.k1.hdfs.rollCount = 0paas2.sinks.k1.hdfs.round = falsepaas2.sinks.k1.hdfs.roundValue=12paas2.sinks.k1.hdfs.roundUnit=hourpaas2.sinks.k1.hdfs.rollSize = 134217728paas2.sinks.k1.hdfs.fileType = DataStreampaas2.sinks.k1.hdfs.timeRollerFlag=day

 

源程序gitee地址如下:

编译后的jar包如下地址:

转载地址:http://mblix.baihongyu.com/

你可能感兴趣的文章
MySQL库和表的操作
查看>>
shell编程:编译器、解释器 变量
查看>>
yum仓库一些简单介绍
查看>>
HashMap----工作原理
查看>>
nodejs 安装 postgresql module
查看>>
【转】iOS学习之iOS禁止Touch事件
查看>>
【小记录】解决链接libcufft_static.a库出现的错误
查看>>
两列布局的几种实现方案
查看>>
Java8新特性之Collectors
查看>>
怎么用CorelDRAW制作表格
查看>>
eclipse智能配置
查看>>
安装Scrapy遇到的问题处理
查看>>
个人作业——软件产品案例分析
查看>>
Java学习:方法重载的使用规则
查看>>
ASP.NET MVC 防止CSRF攻击
查看>>
EF:无法检查模型兼容性,因为数据库不包含模型元数据。
查看>>
0和5
查看>>
C# WinFrom一些技术小结
查看>>
hdu5001 Walk 概率DP
查看>>
模拟select控件&&显示单击的坐标&&用户按下键盘,显示keyCode
查看>>