Python - 将文本文件拆分为具有字符长度限制的多个文件

问题描述

我正在尝试将 PYTHON 中的大文本文件拆分为多个具有以下条件的子文件：

子文件的字符数限制为 1024 个字符
完整的英语句子（即句号到下一个句号）必须在同一个文件中结束。
还要确保如果一行没有以 1.txt 结尾，那么它必须在 2.txt 中，并且必须重新计算 2.txt 文件的长度（并且不超过 1024 个字符）。

我一直在尝试的代码如下（我能够遵守条件 1 但无法满足条件 2 和 3）：

maxChar = len(doc_text) #doc_text is the string containing the large text
excesstext = []
times = [1024 * i for i in range(0,int(maxChar/1024))]

for i in range(0,len(times)-1):
  tempchar = ''
  tempchar = tempchar + doc_text[times[i]:times[i+1]]
  tempchar = tempchar.rsplit('.',1)
  excesstext.append(tempchar[1])
  with open( f'/content/trunc/{i}.txt',encoding='utf-8',mode='w') as f:
    if len(excesstext)>1:
      print(tempchar[0] + excesstext[i-1])
      f.write(tempchar[0] + excesstext[i-1])
    else:
      print(tempchar[0])
      f.write(tempchar[0])

如果可能，请帮助我。谢谢！！

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

filesplitting python text-files