问题描述
D91 UTF-16 编码形式:分配每个字符的 Unicode 编码形式 U+0000..U+D7FF 和 U+E000..U+FFFF 范围内的 Unicode 标量值 到具有相同数值的单个无符号 16 位代码单元 Unicode 标量值,并且 分配每个 Unicode 标量值 在 U+10000..U+10FFFF 到代理对的范围内。
术语“标量值”是指 unicode 代码点,即必须通过不同编码形式(UTF-16 等)编码为特定字节序列的抽象概念的范围。因此,似乎这个摘录要点是鉴于并非所有代码点都可以容纳到一个 UTF-16 代码单元(两个字节)中,有些代码点应该编码成一对代码单元 - 4 个字节(称为“一个代理对").
然而,术语“标量值”的定义如下:
D76 Unicode 标量值: 除高代理外的任何 Unicode 代码点 和低代理代码点。
等等... Unicode 是否有代理代码点? UTF-16 可以用 4 个字节来表示标量点的原因是什么?谁能解释一下基本原理以及 UTF-16 如何使用这些代码点?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)