使用正则表达式在 Google Sheets 中将两个重复的句子分开在同一个单元格中,没有空格

问题描述

我在谷歌表格中有许多单元格,每个单元格有不同的重复句子或短语,合并时没有空格。 我试图用正则表达式将它们分开但无济于事。这只是很多单元格的两个例子,有的大写,有的小写,或组合,除了重复没有明确的模式)

示例单元格 A1:

“2000 年 1 月程序-英特尔-英特尔程序 2000 年 1 月-英特尔-英特尔”

所需结果单元格 B1:

“2000 年 1 月计划-英特尔-英特尔”

示例单元格 A2:

“1996 年 3 月的会议 1996 年 3 月的会议”

所需结果单元格 B2:

“1996 年 3 月的会议”

**公式意图**

1rsts Regex I've tried: "(?s)\b((?i)[áéíóúñü\w\s\W0-9]+?)\B\1"
Result: I thing Google Sheets REGEX cannot use the "\1" to detect duplicates,but this formula worked in: https://regex101.com/ and http://regexstorm.net/tester

2nd Regex I'm trying is something like this,but cannot get it right:
"regexreplace(A1,"(^[A-ZáéíóúüñÁÉÍÓÚÜÑ\w0-9]+[A-ZáéíóúüñÁÉÍÓÚÜÑ\w0-9]+)\b|([A-ZáéíóúüñÁÉÍÓÚÜÑ\w0-9]+\B[A-ZáéíóúüñÁÉÍÓÚÜÑ\w0-9]+)","$1")

解决方法

使用:

=ARRAYFORMULA(REGEXEXTRACT(A1:A; ".{"&LEN(A1:A)/2&"}"))

enter image description here