用于文本归一化的Java库

我正在寻找允许文本“归一化”的 java库.类似于 Normalizer,但更宽(像 utf8proc LUMP这样的东西).

它应该将所有类型的特殊字符替换为ASCII等价物(如果可能的话).所有变体的空间代码32,所有变体的minuses(长,短,薄等)到代码45等等.

解决方法

你应该看看 CLDR Latin-ASCII变形,它将在 ICU 4.6

相关文章

最近看了一下学习资料,感觉进制转换其实还是挺有意思的,尤...
/*HashSet 基本操作 * --set:元素是无序的,存入和取出顺序不...
/*list 基本操作 * * List a=new List(); * 增 * a.add(inde...
/* * 内部类 * */ 1 class OutClass{ 2 //定义外部类的成员变...
集合的操作Iterator、Collection、Set和HashSet关系Iterator...
接口中常量的修饰关键字:public,static,final(常量)函数...