问题描述
|
我想知道在代码点之后组合音符号的出现顺序是否会改变音符号在字符上方或下方堆叠的方式;或其他语义上的差异。
归一化是否指定重新排序变音符号的某种方法,例如G。加快字符串比较?
解决方法
根据此Wikipedia文章,在某些情况下,组合字符的顺序是相关的,在其他情况下,应将其标准化。
具体地,必须保留具有相同组合类的字符的顺序(即,这是相关的),而字符组必须按其组合类进行排序。
, 是的,这很重要,必须使某些情况明确无误:
普通格式D:
U
,U + 0308,U + 0304->普通格式C U + 01D6带有小写字母和Macron的拉丁小写字母ǖ
范式D:U
,U + 0304,U + 0308->范式C U + 1E7B带Macron和Diaeresis的拉丁小写字母Uṻ
通常,在结合班中,您会更靠近字母,然后逐渐远离字母。