youtube VTT 字幕中的空行

问题描述

我正在解析来自 youtube 的示例 VTT 字幕文件并找到这种格式:

WEBVTT
Kind: captions
Language: es

00:00:00.000 --> 00:00:01.910 align:start position:0%
 
tenemos<00:00:00.480><c> una</c><00:00:00.719><c> oportunidad</c><00:00:01.260><c> de</c><00:00:01.410><c> oro</c><00:00:01.560><c> para</c><00:00:01.890><c> que</c>

00:00:01.910 --> 00:00:01.920 align:start position:0%
tenemos una oportunidad de oro para que
 

00:00:01.920 --> 00:00:04.130 align:start position:0%
tenemos una oportunidad de oro para que
la<00:00:02.250><c> salud</c><00:00:02.580><c> mental</c><00:00:02.760><c> deje</c><00:00:03.720><c> de</c><00:00:03.840><c> ser</c><00:00:04.020><c> la</c>

00:00:04.130 --> 00:00:04.140 align:start position:0%
la salud mental deje de ser la
 

00:00:04.140 --> 00:00:06.619 align:start position:0%
la salud mental deje de ser la
cenicienta<00:00:04.319><c> de</c><00:00:05.009><c> la</c><00:00:05.130><c> salud</c><00:00:05.430><c> pública</c><00:00:05.879><c> escuchen</c>

  1. 根据 WebVTT api 2 换行符制作一个“空行”,标志着提示的结束。我看到了 2 个换行符/1 个换行符/2 个换行符 1 个换行符的模式……但它们似乎都是完全形成的提示提示间的额外换行符有何意义?

  2. 从示例中可以明显看出,提示之间存在大量文本内容重叠。有没有办法根据重叠来识别线索之间的关系?例如。 Cue 1 第 2 行包含在 Cue 2 第 1 行等中。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)