使用正则表达式提取由分隔符分隔的文本的某些部分

我有一个示例输入文件,如下所示,列ID,名称,开始日期,结束日期,年龄,描述,位置

220;John;23/11/2008;22/12/2008;28;Working as a Professor in University;Hyderabad
221;Paul;30;23/11/2008;22/12/2008;He is a Software engineer at MNC;Bangalore
222;emma;23/11/2008;22/12/200825;Working as a mechanical enginner;Chennai

它包含30行数据.我的要求是只从上面的文本文件中提取描述.

我的输出应该包含

Working as a Professor in University

He is a Software enginner at MNC

working as a mechanical enginner

我需要找到一个正则表达式来提取描述,并尝试了很多种但却无法找到解决方案.有什么建议？

解决方法

你可以使用这个正则表达式

[^;]+(?=;[^;]*$)

[^;]匹配任何字符除外;

是一个量词,它匹配前面的char或group 1到很多次

*是一个量词,它匹配前面的char或0组到多次

$是字符串的结尾

(？= pattern)是一个先行,它检查特定模式是否发生在前面

使用正则表达式提取由分隔符分隔的文本的某些部分

解决方法

相关文章