UTF-16 编码如何使用代理代码点？

问题描述

D91 UTF-16 编码形式：分配每个字符的 Unicode 编码形式 U+0000..U+D7FF 和 U+E000..U+FFFF 范围内的 Unicode 标量值到具有相同数值的单个无符号 16 位代码单元 Unicode 标量值，并且 分配每个 Unicode 标量值在 U+10000..U+10FFFF 到代理对的范围内。

术语“标量值”是指 unicode 代码点，即必须通过不同编码形式（UTF-16 等）编码为特定字节序列的抽象概念的范围。因此，似乎这个摘录要点是鉴于并非所有代码点都可以容纳到一个 UTF-16 代码单元（两个字节）中，有些代码点应该编码成一对代码单元 - 4 个字节（称为“一个代理对").

然而，术语“标量值”的定义如下：

D76 Unicode 标量值： 除高代理外的任何 Unicode 代码点和低代理代码点。

等等... Unicode 是否有代理代码点？ UTF-16 可以用 4 个字节来表示标量点的原因是什么？谁能解释一下基本原理以及 UTF-16 如何使用这些代码点？

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

unicode utf-16