无法使用水槽将推特数据流式传输到 hdfs

问题描述

我正在尝试使用 Flume 将数据从 twitter 流式传输到 hdfs,我使用的是 Cloudera Quickstart VM 5.13,我没有任何错误,但目标目录为空。

这是我的flume.conf文件

pm2 serve /home/site/wwwroot --no-daemon --spa

我正在调用此命令进行流式传输:

Twitteragent.channels = MemChannel Twitteragent.sinks = HDFS Twitteragent.sources.Twitter.type = org.apache.flume.source.twitter.TwitterSource Twitteragent.sources.Twitter.channels = MemChannel Twitteragent.sources.Twitter.consumerKey = Sp0ti7peTvFPDJSWMGk2ChMZM Twitteragent.sources.Twitter.consumerSecret = Cncmq5b6rKxWPb6qNSPkqpzIR7L3EcQ8WUCeG0gX4L9sPIzflN Twitteragent.sources.Twitter.accesstoken = 1370386818609377287-IsLuhCt54wK4T2Ua9Cb0TC14rrs1c5 Twitteragent.sources.Twitter.accesstokenSecret = AL7oYsVUQXz5KXtQSj0tu36R85MyvAsBjcgktdZD63Ou6 Twitteragent.sources.Twitter.keywords = hadoop,big data,analytics,bigdata,cloudera,data science,data scientist,business intelligence,mapreduce,data warehouse,data warehousing,mahout,hbase,nosql,newsql,businessintelligence,cloudcomputing Twitteragent.sinks.HDFS.channel = MemChannel Twitteragent.sinks.HDFS.type = hdfs Twitteragent.sinks.HDFS.hdfs.path = hdfs://quickstart.cloudera:8020/user/flume/tweets/ Twitteragent.sinks.HDFS.hdfs.fileType = DataStream Twitteragent.sinks.HDFS.hdfs.writeFormat = text Twitteragent.sinks.HDFS.hdfs.batchSize = 1000 Twitteragent.sinks.HDFS.hdfs.rollSize = 0 Twitteragent.sinks.HDFS.hdfs.rollCount = 10000 Twitteragent.sinks.HDFS.hdfs.rollInterval = 600 Twitteragent.channels.MemChannel.type = memory Twitteragent.channels.MemChannel.capacity = 10000 Twitteragent.channels.MemChannel.transitionCapacity = 100

请我想知道我做错了哪一部分。非常感谢任何宝贵的建议。

提前致谢。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)