Swift基础:String数据存储和长度

Swift中字符串的存储机制与其它语言不同,采用的不是固定字节方式存储字符,每个字符占用的字节数可能不同。

当我们需要知道一个字符串有多少字符串时,我们往往想知道的是我们所看到的字符数,而非存储的字节数。

一个字符可能需要1,2,3,4个字节来存储。

英文:1个字节

xxx: 2 个字节? --- 没找到例子

中文:3个字节

emoji表情字符:4个字节

charaters.count表示有多少字符,也就是我们所见到有几个字符,而不关心其存储方式。

与unicodeScalars.count是一样的。



for codeUnit in language.utf8
{
    print("utf8:\(codeUnit) ",terminator: "")
}
print("\n")
for codeUnit in language.utf16
{
    print("utf16:\(codeUnit) ",terminator: "")
}

结果:
utf8:83 utf8:119 utf8:105 utf8:102 utf8:116 utf8:232 utf8:175 utf8:173 utf8:232 utf8:168 utf8:128 

utf16:83 utf16:119 utf16:105 utf16:102 utf16:116 utf16:35821 utf16:35328 


为了方便使用,我们可以扩展String的属性:

//自定义字符串长度的计算属性
extension String
{
    var length: Int {
        return self.characters.count
    }
}
language.length   //returns 7


我们再看看官方的例子,说的比较清楚:



这是一个混有不同类型字符的例子,狗头是表情字符,占用4个字节。


1. utf8 表达:




可以看到占用了10个字节,即dogString.utf8.count == 10

每个单位是 UInt8 类型


2. utf16表达:dogString.utf16.count == 6

每个单位是 unsigned int16类型


一个表情符号需要2个UInt16表示。


3. unicodeScalar 标量表示

dogString.unicodeScalars.count == 5

每个单位是UnicodeScalar,占用UInt32的内存,持有21bit的数据。

EachUnicodeScalarhas avalueproperty that returns the scalar’s 21-bit value,represented within aUInt32value。


这种表达方式最接近我们所见到的内容。


参考链接:

Swift_Programming_Language:StringsAndCharacters

相关文章

软件简介:蓝湖辅助工具,减少移动端开发中控件属性的复制和粘...
现实生活中,我们听到的声音都是时间连续的,我们称为这种信...
前言最近在B站上看到一个漂亮的仙女姐姐跳舞视频,循环看了亿...
【Android App】实战项目之仿抖音的短视频分享App(附源码和...
前言这一篇博客应该是我花时间最多的一次了,从2022年1月底至...
因为我既对接过session、cookie,也对接过JWT,今年因为工作...