java – 用于将德语地址拆分为其部分的正则表达式

晚上好,

我试图通过Java将德国地址字符串的各个部分拆分成它的部分.有没有人知道正则表达式或图书馆这样做?要拆分它,如下所示:

NamederStraße25a88489 Teststadt

NamederStraße| 25a | 88489 | Teststadt

要么

Teststr. 3 88489 Beispielort(GroßerKreis)

Teststr.|​​ 3 | 88489 | Beispielort(GroßerKreis)

如果系统/正则表达式仍然有效,如果缺少像邮政编码或城市这样的部分,那将是完美的.

有没有我可以存档的正则表达式或库?

编辑:德国地址规则:
街:人物,数字和空格
房屋号码:数字和任何字符(或空格),直到一系列数字(zip)(至少在这些例子中)
邮编:5位数
地方或城市:其余的也可能有空格,逗号或大括号

解决方法

我遇到了类似的问题,并稍微调整了这里提供的解决方案,并找到了这个解决方案也可以工作,但(imo)有点简单易懂和扩展:
/^([a-zäöüß\s\d.,-]+?)\s*([\d\s]+(?:\s?[-|+/]\s?\d+)?\s*[a-z]?)?\s*(\d{5})\s*(.+)?$/i

这里有一些example matches.

它还可以处理丢失的街道号码,并且可以通过向字符类添加特殊字符来轻松扩展.

[a-zäöüß\s\d,.-]+?                         # Street name (lazy)
[\d\s]+(?:\s?[-|+/]\s?\d+)?\s*[a-z]?)?     # Street number (optional)

在那之后,必须有邮政编码,这是绝对必要的唯一部分,因为它是唯一不变的部分.邮政编码后的所有内容都被视为城市名称.

相关文章

最近看了一下学习资料,感觉进制转换其实还是挺有意思的,尤...
/*HashSet 基本操作 * --set:元素是无序的,存入和取出顺序不...
/*list 基本操作 * * List a=new List(); * 增 * a.add(inde...
/* * 内部类 * */ 1 class OutClass{ 2 //定义外部类的成员变...
集合的操作Iterator、Collection、Set和HashSet关系Iterator...
接口中常量的修饰关键字:public,static,final(常量)函数...