似乎无法将先前读取的内容传递到后续子进程中

问题描述

这是在运行Python 3.8.5和3.90rc1的Windows 10 Linux(wsl)中。不使用Windows本机。

我正在遍历目录层次结构,该目录层次结构由首先由“专辑标题”列出的多个已录制的专辑组成,并且在该标题中按曲目顺序排列有歌曲列表。我正在尝试使用歌曲的全名并将其输出到Popen进程,该进程会打开一个外部程序/ usr / bin / flac -ts,该程序会扫描单个文件并以任何方式报告(通常通过stderr)有缺陷的。轨道都是.FLAC文件。我尝试了多种方法来使用此处和其他站点的示例技术来完成此任务。无论如何,总会有一些问题,例如flac程序从不获取文件名,或者导致Python(似乎)由于一些奇怪的错误而失败。 这是我当前版本的摘录:

    for path,dirs,files in os.walk(StartScanDir):
        i=0
        runout=[ ]
#       runout[i]=path
        runout.append(path)
        print (runout[i])
#       print (path)
        for f in files:
            if not f.endswith('.flac'):
                continue
            i=i+1
#           print(i)
            runout.append(f)
            print (runout[i]) # > FLAClistOut
#           print ("f")
            pipe=Popen("/usr/bin/flac","-ts",stdout=PIPE,stderr=PIPE)
            text = pipe.communicate()[0]
#           text = pipe.communicate(b"f")
            print(text)
            print (stdout)
            print (stderr)

这一句从/usr/lib/python3.9/subprocess.py引发了异常,“ bufsize必须是整数”。有时我会明白这一点,但是在我的编码的其他变体中,我抱怨输入要二进制并获得str。在任何一个版本的Python上都是相同的行为。

有人可以发现我可能做错了什么和/或提出更好的建议吗?注释了一些仅用于测试的行。

谢谢。

我已经更新并注释了代码,因此发生的事情更加清楚了。

    os.chdir(StartScanDir)  #start at the top of the directory hierarchy
#   print(os.getcwd())
    for path,files in os.walk(StartScanDir):
        i=0
        runout=[ ]  #clear logging string array
        runout.append(path) #add album title
        print (runout[i])
        for f in files:
            if not f.endswith('.flac'):
                continue
            i=i+1
            runout.append(f)    #add individual song titles
            cmd = ['/usr/bin/flac','-t','-s']
            print (runout[i]) # > FLAClistOut
            p=subprocess.Popen(cmd,stdout = subprocess.PIPE,stdin = subprocess.PIPE)
            out,err=p.communicate('f' ) 
            print (out)
            print (err)
This produces the error:
Traceback (most recent call last):
  File "/mnt/x/incoming/py-work/fixflac.py",line 35,in <module>
    out,err=p.communicate('f' )
  File "/usr/lib/python3.9/subprocess.py",line 1130,in communicate
    stdout,stderr = self._communicate(input,endtime,timeout)
  File "/usr/lib/python3.9/subprocess.py",line 1957,in _communicate
    input_view = memoryview(self._input)
TypeError: memoryview: a bytes-like object is required,not 'str'

解决方法

out,err = p.communicate('f')

可以替换为

out,err = p.communicate(b'f')

,只要您只希望b'f'作为唯一输入即可。输入必须是一个字节数组,因为str可以编码为ISO-8859-1,UTF8,UCS16等。Python不知道flac会采用哪种编码。

但是,p.communicate()执行几个不同的步骤,因此分别处理每个步骤可能会更清楚。例如,err变量将始终为None,因为您对Popen()的调用不包括stderr=subprocess.PIPE。代替p.communicate(),您可以编写:

p.stdout.write(b'f')
p.stdout.close()
out = p.stdin.read()
exit_code = p.wait()

在第一个示例中遇到的错误是因为所有flac参数都必须位于subprocess.Popen()的第一个参数中。如果将str用作第一个参数,则不能将任何其他参数传递给flacPopen("/usr/bin/flac","-ts",stdout=PIPE,stderr=PIPE)传递"-ts"作为第二个参数,它是bufsize参数,它需要一个整数。

我以前没有使用过flac,但是我相信您需要将文件名作为参数传递。例如:

subprocess.Popen(["flac",f],stdout=subprocess.PIPE,stdin=subprocess.PIPE)

我认为您不需要将数据发送到flac,因此您可以致电out_bytes = p.stdout.read()。它将返回一个字节数组。如果要将其转换为str,可以调用out_str = out_bytes.decode('utf-8')flac可能只是输出ascii,但UTF-8是ascii的超集,并且是最常见的编码。

,
    os.chdir(StartScanDir)  #start at the top of the directory hierarchy
#   print(os.getcwd())  #1
    for path,dirs,files in os.walk(StartScanDir):
        i=0
        runout=[ ]  #clear logging string array
        runout.append(path) #add album title
        print (runout[i])   #2 album title
        os.chdir(runout[i])  #cd to album
        for f in files:
            if not f.endswith('.flac'):
                continue
            i=i+1
            runout.append(f)    #add individual song titles
            print (runout[i])   #3 > FLAClistOut
            print(os.getcwd())  #4  confirm we're in the right dir
            
            p=subprocess.Popen(["flac",'f'],stderr=subprocess.PIPE)
#           p.stdout.write('f')     #produces error io.Unsupported operation
#           p.stdout.close()        #closes io too soon
            exit_code = p.wait()    #doesn't make any diff
            print(exit_code)        # always 1 since flac reports error reading everytime
            out_bytes =p.stdout.read()
            out_str = out_bytes.decode('utf-8')
            err_bytes =p.stderr.read()
            err_str = err_bytes.decode('utf-8')
#           print (out_str)     #never seen anything here
            print (err_str)     #error info comes out here

这就是我现在所拥有的,并添加了额外的注释。仍然无法获取发送到flac的实际文件名。错误提示它无法读取文件名或文件不存在。 这是我输入的典型目录名称: / mnt / y / FLAC / flac-oldies-albums /各种艺术家/ 60年代的#1电台热播 以及该目录中文件名的格式: 01-正义兄弟-(You're My)Soul and Inspiration.flac

我想我已经尝试了所有建议,您在上面看到的是结果。我被卡住了。

我可以复制歌曲名称,然后在bash命令行上手动输入或粘贴文件名称为“ flac -ts 4 Seasons-Hurt Yourself.flac”,它可以正常工作,也可以通过bash脚本运行用find和-exec编写。只是无法在python中正确获取名称...