问题描述
我正在尝试使用 Flume 将数据从 twitter 流式传输到 hdfs,我使用的是 Cloudera Quickstart VM 5.13,我没有任何错误,但目标目录为空。
这是我的flume.conf文件:
pm2 serve /home/site/wwwroot --no-daemon --spa
我正在调用此命令进行流式传输:
Twitteragent.channels = MemChannel
Twitteragent.sinks = HDFS
Twitteragent.sources.Twitter.type = org.apache.flume.source.twitter.TwitterSource
Twitteragent.sources.Twitter.channels = MemChannel
Twitteragent.sources.Twitter.consumerKey = Sp0ti7peTvFPDJSWMGk2ChMZM
Twitteragent.sources.Twitter.consumerSecret = Cncmq5b6rKxWPb6qNSPkqpzIR7L3EcQ8WUCeG0gX4L9sPIzflN
Twitteragent.sources.Twitter.accesstoken = 1370386818609377287-IsLuhCt54wK4T2Ua9Cb0TC14rrs1c5
Twitteragent.sources.Twitter.accesstokenSecret = AL7oYsVUQXz5KXtQSj0tu36R85MyvAsBjcgktdZD63Ou6
Twitteragent.sources.Twitter.keywords = hadoop,big data,analytics,bigdata,cloudera,data science,data scientist,business intelligence,mapreduce,data warehouse,data warehousing,mahout,hbase,nosql,newsql,businessintelligence,cloudcomputing
Twitteragent.sinks.HDFS.channel = MemChannel
Twitteragent.sinks.HDFS.type = hdfs
Twitteragent.sinks.HDFS.hdfs.path = hdfs://quickstart.cloudera:8020/user/flume/tweets/
Twitteragent.sinks.HDFS.hdfs.fileType = DataStream
Twitteragent.sinks.HDFS.hdfs.writeFormat = text
Twitteragent.sinks.HDFS.hdfs.batchSize = 1000
Twitteragent.sinks.HDFS.hdfs.rollSize = 0
Twitteragent.sinks.HDFS.hdfs.rollCount = 10000
Twitteragent.sinks.HDFS.hdfs.rollInterval = 600
Twitteragent.channels.MemChannel.type = memory
Twitteragent.channels.MemChannel.capacity = 10000
Twitteragent.channels.MemChannel.transitionCapacity = 100
请我想知道我做错了哪一部分。非常感谢任何宝贵的建议。
提前致谢。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)