问题描述
我使用代码从 rtf 文档创建了一个对象:sample_doc <- read_rtf("sample.doc")
(我必须使用 read_rtf,因为该文档实际上是一个 rtf)。
我知道文档中的某处有两个短语(字符向量中的一个元素)apple
和 orange
,并且它们之间必须有一个元素。我只想提取那个中间元素。我该怎么办?
谢谢!
解决方法
您可以使用正 lookbehind
和 lookahead
来定位两者之间的模式,这个正则表达式应该可以满足您的需求:
(?<=orange)(.*)(?=apple)