Flume扩展实现日志数据高效收集至PostgreSQL和ES

ZIP文件

下载需积分: 50 | 38.41MB | 更新于2025-03-12 | 149 浏览量 | 举报收藏

立即下载

根据给定文件的信息，我们可以得到几个关键的知识点： 1. Flume简介与架构 Flume是一个分布式、可靠且可用的系统，用于有效地收集、聚合和移动大量日志数据。它的主要特点是简单、可靠，能够将不同来源的数据流汇聚到一个中心位置。Flume的核心是基于流式数据流的模型，其中包含source、sink和channel三个主要组件。 2. Flume扩展与自定义Sink 文档中提到的“flume收集日志到postgresql, es扩展”意味着我们可以通过编写自定义的sink来扩展Flume的功能。在这个案例中，扩展的目标是将数据不仅收集到传统的存储系统中，还包括关系型数据库postgresql和搜索引擎Elasticsearch（ES）。 3. Maven构建与部署在描述部分提到使用Maven进行项目构建和安装，即通过`mvn clean mvn install`命令将代码打包成jar包。这一步骤是Java开发中常见的构建过程，用以生成可部署的构件。打包后的jar文件需要上传到Flume安装目录下的lib文件夹中，以供Flume在运行时加载自定义sink。 4. 配置Flume Agent的组件文件中提及了如何在Flume的配置文件中命名和描述各个组件。具体来说，一个Flume Agent包含了source、sink和channel三个部分，其中source负责数据采集，sink负责数据输出，而channel则作为两者之间的缓冲队列。在配置文件中定义这些组件是启动Flume服务前的关键步骤。 5. 编写自定义Sink 文档中描述了如何配置source组件为exec类型，这表示数据源是一个可执行命令或脚本，能定期或按需运行来生成日志。同时，描述中提到配置文件名为`dbsql_sink.conf`，这暗示了自定义sink的目的是将数据输出到数据库（可能是postgresql）和搜索引擎（可能是ES）。 6. Flume与SQL驱动在描述中也提到了上传SQL的驱动jar包，这表示我们需要使用特定的数据库连接驱动来实现Flume与数据库的交互。在实际应用中，为了使Flume能够与postgresql等数据库进行连接，必须引入相应的JDBC驱动包。 7. Flume配置文件的示例描述中给出了部分配置文件的代码片段，例如： ``` a1.sources = r1 a1.sinks = k1 a1.channels = c1 a1.sources.r1.type = exec ... ``` 这些代码片段展示了配置文件的基本结构和内容，其中指定了source、sink和channel的名称和类型，以及source的类型为exec（执行外部命令或脚本）。 8. 文件压缩包内容最后，文件压缩包的名称为`flume_sink_ext-master`，暗示了解压缩后的内容包含了一个主目录，里面可能包含了一个完整的Flume扩展项目。综上所述，从给定的文件信息中，我们可以理解到Flume是一个用于日志数据聚合的工具，并且可以通过自定义sink来拓展其功能，将数据不仅限于输出到常规的存储系统，还可以将数据流引入到其他系统如postgresql和Elasticsearch中。开发自定义sink的过程涉及使用Java和Maven进行开发构建，并将编译出的jar包以及数据库驱动包部署到Flume环境中。最后，通过配置Flume agent的各个组件，实现自定义数据流的收集和处理路径。

资源目录

收起资源包目录

Flume扩展实现日志数据高效收集至PostgreSQL和ES （110个子文件）

EsRestClientExt.java 7KB

hadoop-common-2.5.1.jar 2.83MB

x1_dir_to_db_flume.conf 1KB

all_dir_flume_to_kafka2.conf 2KB

ExtendsEsRestSink.java 17KB

plexus-container-default-1.6.jar 218KB

aspectjrt-1.5.4.jar 112KB

db_flumex2.conf 918B

x2_dir.sh 162B

hbase-common-1.3.1.jar 577KB

netty-3.9.4.Final.jar 1.25MB

.project 668B

dir_all_to_flume_gdata.conf 2KB

supervisord.conf 12KB

all_dir_flume_to_pg.conf 2KB

plexus-classworlds-2.5.1.jar 49KB

Mains.java 213B

es_db_x1_dir_flume_back.conf 2KB

AvroSinkExt.java 17KB

commons-configuration-1.6.jar 292KB

ExtendsEsHttpSink.java 16KB

flume_kafka_to_hdfs.conf 1KB

es_db_x1_dir_flume.conf 1KB

httpclient-4.2.1.jar 417KB

rest-5.5.0.jar 34KB

EsUtil.java 1KB

flume_to_hbase.conf 1KB

elasticsearch-5.0.0.jar 8.99MB

htrace-core-3.1.0-incubating.jar 1.41MB

httpasyncclient-4.1.2.jar 173KB

x9_dir_to_db_flume.conf 948B

PgSqlSink.java 8KB

httpcore-4.1.3.jar 177KB

x3_dir_to_db_flume.conf 948B

x3_dir_to_db_flume.conf 947B

ElasticSearchTransportClientExt.java 7KB

httpclient-4.5.2.jar 719KB

foundation-service-2.5.0.jar 289KB

ConverDataYH.java 6KB

x8_dir.sh 162B

httpcore-nio-4.4.5.jar 348KB

log_flume_to_hbase.conf 1KB

ConverData.java 7KB

x8_dir_to_db_flume.conf 947B

JsonDBsqlSink.java 10KB

HBaseSink.java 22KB

x2_dir_to_db_flume.conf 981B

supervisord_back.conf 12KB

db_flumex1.conf 946B

DBsqlSink.java 10KB

x9_dir_to_db_flume.conf 947B

x2_dir_to_db_flume.conf 980B

x1_dir_flume_to_kafka.conf 1KB

README.md 2KB

mon 58B

ExtSimpleAsyncHbaseEventSerializer.java 5KB

plexus-utils-3.0.2.jar 221KB

x4_dir_to_db_flume.conf 947B

new.conf 2KB

fastjson-1.2.29.jar 450KB

xbean-reflect-3.7.jar 145KB

hbase-client-1.3.1.jar 1.27MB

all_dir_flume_to_pg_and_file.conf 3KB

Main.java 1KB

TestMain.java 738B

AvroSinkExitTest2.java 20KB

justone-kafka-sink-pg-json-standalone.properties 2KB

ExtSimpleHbaseEventSerializer.java 7KB

x1_dir_to_db_flume.conf 1020B

app.properties 23B

justone-kafka-sink-pg-json-connector.properties 2KB

x4_dir_to_db_flume.conf 948B

x1_dir.sh 162B

ConverDataObject.java 6KB

guava-19.0.jar 2.2MB

flume_arvo_to_pg_and_file.conf 2KB

ConverDataInterceptor.java 4KB

EsHttpClientExt.java 8KB

pg_connect.sh 176B

org.eclipse.jdt.core.prefs 723B

all_dir_flume_to_kafka.conf 2KB

netty-all-4.0.24.Final.jar 1.7MB

org.eclipse.core.resources.prefs 150B

lucene-core-4.3.0.jar 2.11MB

cat-client-1.4.0.jar 226KB

PgSqlSinkBack.java 9KB

hadoop-auth-2.5.1.jar 51KB

elasticsearch-0.90.1.jar 10.44MB

x1_dir_to_db_flume.conf 1021B

zookeeper-3.4.6.jar 774KB

DatePathManager.java 3KB

postgresql-9.4.1210.jre7.jar 658KB

.gitignore 9B

httpcore-4.4.5.jar 320KB

x8_dir_to_db_flume.conf 947B

hbase-protocol-1.3.1.jar 4.29MB

org.eclipse.m2e.core.prefs 86B

TransportExtendsSink.java 16KB

.classpath 1KB

AvroSinkExitTest.java 7KB

共 110 条

tafan

粉丝: 46

Flume扩展实现日志数据高效收集至PostgreSQL和ES

flume-pg-sink:水槽-ng postgresql 数据库接收器

Log-Analysis:使用Flume + Spark + HDFS + HIVE + PostgreSQL构建日志分析系统

flume_kafka_sink:卡夫卡水槽

zabbix_monitor_flume_es:监控flumekafkaelasticsearch通过zabbix

export JAVA_HOME=/usr/java/jdk1.8.0_361 export FLUME_HOME=/usr/local/flume export FLUME_CONF_DIR=$FLUME_HOME/conf export PATH=$PATH:$FLUME_HOME/bin:/usr/local/hbase/bin export ZOOKEEPER_HOME=/home/hadoop/zookeeper export PATH=$ZOOKEEPER_HOME/bin:$PATH

# .bashrc export JAVA_HOME=/usr/java/jdk1.8.0_361 export FLUME_HOME=/usr/local/flume export FLUME_CONF_DIR=$FLUME_HOME/conf export PATH=$PATH:$FLUME_HOME/bin # Source global definitions if [ -f /etc/bashrc ]; then . /etc/bashrc fi

flume-ng-kafka-sink:将数据发布到 Apache Kafka 的 Apache Flume Sink 实现

flume-ng-log4jappender:定制log日志重定向到flume-ng中

Flume_离线处理_日志收集1

Flume_实时分析_日志收集1

最新资源