正则表达式获取特定字符下标，分割字符串

在开发中遇到这样的一个报文：

00000123000003RQ0 ################ 000003 <tellerLvl0>0</><brc>3004</><fPIflag>0</><termIP>6.1.14.11</><channelId>12</><teller>300403</><authFlag>0</><termId>pts1</>

这个报文忽略“00000123000003RQ0 ################ 000003”不看，后边的内容初看有点像xml，但是细看，它的结束标签缺少了结束名称。实质上它只是一张自定义的key-value格式的报文。“00000123000003RQ0 ################ 000003”是报文头内容，现在我要做的是把报文头和报文头分离，并且报文头不是一个固定的字符串，因此确定不了它的位数和下标。试了很多种方法，在这里就不一一细说了，其实最简单最容易最方便最省事的方法就是采用正则表达式匹配的方式，如下代码：

public static void main(String[] args) {
String xml=

"00000123000003RQ0################000003<tellerLvl0>0</><brc>3004</><fPIflag>0</><termIP>6.1.14.11</><channelId>12</><teller>300403</><authFlag>0</><termId>pts1</>";

String messageHead="",messageBody="";
int index=0;
xml=xml.trim();
//正则匹配，查找第一次出现"<"的位置
int num = 0;
Pattern p = Pattern.compile("<"); //根据需求，指定特定字符，可以是任何字符
Matcher m = p.matcher(xml);
while(m.find()){
num++;
if(1 == num){ //这里在别的场景里可以随便指定第几次出现，本场景中是需要第一次出现的位置
index=m.start();
break;//注意加break，否则它会一直循环下去，直到字符串的最后一个字符
}
}
//报文头报文体分离
messageHead=xml.substring(0,index-1);
messageBody=xml.substring(index-1);
logger.info("报文头内容为:"+messageHead);
messageBody=replaceString(messageBody);
logger.info("报文体内容为:"+messageBody);

}

希望读大家有所帮助，如果有什么更好的方法也可以提出，互相学习，谢谢！

正则表达式获取特定字符下标，分割字符串

相关文章