我如何从 Python 中的 mrjob 映射器中的文本文件中获取每一行的第一个字母?

问题描述

我是 python 新手,我试图从 Mrjob 的文本文件获取每一行的第一个字母,下面是我的代码

def mapper(self,key,value):
    numCharacters = len(value.strip().replace(" ",""))
    numWords = len(value.strip().split())
        for word in value.strip().split():
            yield value[0],(numCharacters,numWords)

text.txt 文件是:

      I want to Remove all white      spaces.   
      new lines  and tabs.   
      not the whitespace.   

当我执行: python text.py text.txt 时, 返回的首字母是空格,不是首字母

" "     4.0
" "     4.0
" "     4.0
" "     4.0
" "     4.0
" "     4.0
" "     4.0
" "     4.0
" "     4.0
" "     4.0
" "     4.0
" "     5.67
" "     5.67
" "     5.67

这种支持是:

"I"     4.0
"I"     4.0
"I"     4.0
"I"     4.0
"I"     4.0
"I"     4.0
"I"     4.0
"n"     4.0
"n"     4.0
"n"     4.0
"n"     4.0
"n"     5.67
"n"     5.67
"n"     5.67

我的代码有什么问题?请帮我脱光。谢谢

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)