java – 具有极大变化长度的输入的最佳StringBuffer初始容量是多少?

大家下午好,我用 java.lang.StringBuilder来存储一些角色.我不知道我要提前存储多少个角色,除了:

> 60%的时间,它只是(确切地)7个字符
> 39%的时间,(大约)3500个字符
> 1%的时间,大约是20k个字符

我们如何计算应该使用的最佳初始缓冲区长度?

目前我正在使用新的java.lang.StringBuilder(4000)但这只是因为我以前懒得思考.

解决方法

这里有两个因素:时间和内存消耗.时间主要受调用java.lang.AbstractStringBuilder.expandCapacity()的次数的影响.当然,每次调用的成本与缓冲区的当前大小成线性关系,但我在这里简化并计算它们:

expandCapacity()的数量(时间)

认配置(16个字符容量)

>在60%的情况下,StringBuilder将扩展0次
>在39%的情况下,StringBuilder将扩展8次
>在1%的情况下,StringBuilder将扩展11次

预期的expandCapacity数量为3,23.

初始容量为4096个字符

>在99%的情况下,StringBuilder将扩展0次
>在1%的情况下,StringBuilder将扩展3次

预期的expandCapacity数为0,03.

正如您所看到的,第二种情况似乎要快得多,因为它很少需要扩展StringBuilder(每100个输入三次).但请注意,第一次扩展不太重要(复制少量内存);此外,如果您以巨大的块为构建器添加字符串,它将在更少的迭代中更加热切地扩展.

另一方面,内存消耗增长:

内存消耗

认配置(16个字符容量)

>在60%的情况下,StringBuilder将占用16个字符
>在39%的情况下,StringBuilder将占用4K个字符
>在1%的情况下,StringBuilder将占用32K字符

预期的平均内存消耗为:1935个字符.

初始容量为4096个字符

>在99%的情况下,StringBuilder将占用32K字符

预期的平均内存消耗为:4383个字符.

TL; DR

这让我相信将初始缓冲区扩大到4K会使内存消耗增加两倍以上,同时将程序加速两个数量级.

底线是:试试!编写一个能够处理具有不同初始容量的不同长度的百万字符串的基准并不难.但我相信更大的缓冲区可能是一个不错的选择.

相关文章

最近看了一下学习资料,感觉进制转换其实还是挺有意思的,尤...
/*HashSet 基本操作 * --set:元素是无序的,存入和取出顺序不...
/*list 基本操作 * * List a=new List(); * 增 * a.add(inde...
/* * 内部类 * */ 1 class OutClass{ 2 //定义外部类的成员变...
集合的操作Iterator、Collection、Set和HashSet关系Iterator...
接口中常量的修饰关键字:public,static,final(常量)函数...