使用正则表达式提取由分隔符分隔的文本的某些部分

我有一个示例输入文件,如下所示,列ID,名称,开始日期,结束日期,年龄,描述,位置

220;John;23/11/2008;22/12/2008;28;Working as a Professor in University;Hyderabad
221;Paul;30;23/11/2008;22/12/2008;He is a Software engineer at MNC;Bangalore
222;emma;23/11/2008;22/12/200825;Working as a mechanical enginner;Chennai

它包含30行数据.我的要求是只从上面的文本文件提取描述.

我的输出应该包含

Working as a Professor in University

He is a Software enginner at MNC

working as a mechanical enginner

我需要找到一个正则表达式来提取描述,并尝试了很多种但却无法找到解决方案.有什么建议?

解决方法

你可以使用这个正则表达式

[^;]+(?=;[^;]*$)

[^;]匹配任何字符除外;

  是一个量词,它匹配前面的char或group 1到很多次

*是一个量词,它匹配前面的char或0组到多次

$是字符串的结尾

(?= pattern)是一个先行,它检查特定模式是否发生在前面

相关文章

正则替换html代码中img标签的src值在开发富文本信息在移动端...
正则表达式
AWK是一种处理文本文件的语言,是一个强大的文件分析工具。它...
正则表达式是特殊的字符序列,利用事先定义好的特定字符以及...
Python界一名小学生,热心分享编程学习。
收集整理每周优质开发者内容,包括、、等方面。每周五定期发...