问题描述
我当前正在使用Telegram API,在its methods之一中,它返回以下信息:
- 一段文字
- 以UTF-16代码单位的偏移量
- 以UTF-16代码单位表示的长度
在我的编程语言Rust中,所有字符串都是有效的UTF-8。这意味着UTF-16偏移量不是立即可用的,因为它们可以偏移可变的量(由于1或3个字节的代码点)。 UTF-8中的一字节代码点对应于UTF-16中的两字节代码点,因此我不能简单地为UTF-8字符串建立索引,因为我可能位于代码点边界之外。
我现在想知道:是否有一种方法可以将其转换为有效的UTF-8,而无需遍历UTF-8字符串,或者该信息在UTF-8中一次都没有用?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)