问题描述
||
我想知道在UTF8代码页中是否有任何关系或现有算法允许从本国字符转换为等效的拉丁字符?
例如(波兰语):
Ą-> A
Ó-> O
ż-> z
ź-> z
...
像这样的短语:'zażółćgęśląjażń\'
转换为:'zazolc gesla jazn \'
目前,我正在为波兰语使用转换数组,但是我正在寻找一种通用解决方案,可以处理所有基于拉丁语的语言。
谢谢
解决方法
检查一下:
http://sourceforge.net/projects/iconvnet/
通常,搜索名为iconv的内容
, 为了使答案更完整,\'Unicode分解+ C#\'使我读到此CodeProject文章(codeproject.com/KB/cs/UnicodeNormalization.aspx?display=Print)提供了一种随时可用的解决方案。不能低估您正在寻找的名称的能力;)感谢您的所有回答。
, 不能完全确定这是否是您需要的明确答案,但是当我过去不得不这样做时,我已将所有\'special \'字符转换为一个命名或数字实体,以便它们成为在转换过程中受到保护。