Java中的String不再纠结

发表于:2017-1-12 10:32

字体: | 上一篇 | 下一篇 | 我要投稿

 作者:搁浅    来源:51Testing软件测试网采编

#
java
分享:
  这两天在淘测试文章里看到一篇关于Java string的文章,谈到了StringBuilder和StringBuffer的使用效率的问题,然后发现自己忽略了capacity这个概念。比如说下面的一段代码:
1        StringBuffer sf = new StringBuffer("");
2         sf.append("leeon");
3         System.out.println("length: "+sf.length());
4         System.out.println("capacity: "+sf.capacity());
  这个打印的结果就是
  length:5
  capacity:16
  length我们可以理解,那么capacity是什么呢?
  JDK源码中给出的解释就是用来存储新插入的字符空间的容量,可见一个默认的容量就是16了,当然如果我们像下面这样的去重写上面的代码,就会得到不一样的结果。
1         StringBuffer sf = new StringBuffer("leeon");
2         System.out.println("length: "+sf.length());
3         System.out.println("capacity: "+sf.capacity());
  这次的结果就是
  length:5
  capacity:21
  原因就是我们在构造sf的时候本身的value已经是5了,再加上了新准备插入的初始化容量,也就是5+16.具体实现的细节是:
  ----------------------------------------------------------------------------------------------------------
  以上是背景知识,下面开始讨论如何从capacity这个特性出发来优化性能。再仔细阅读jdk源码中append方法的实现的时候会发现,每次调用append都要进行容量的检查,因为要确保StringBuffer足够的大才能装得下新添加的字符串。不妨再一起看下代码:
  当调用append的时候,首先会通过ensureCapacityInternal检查所需的容量,如果容量不足再调用expandCapacity进行扩容,可以看见扩容的方式是将现在的字符串大小增加一倍然后再加上2.如果容量仍然不足,则直接扩展到所需的大小。我们发现扩展容量就是一个耗时的操作,虽然处理大量字符串的时候采用StringBuffer会比用String更加的提升性能,但是却仍然存在可优化的耗时部分。
  其实StringBuffer和StringBuilder在初始化的时候是可以指定capacity的,如果有一个大概的预估,初始化一个比较合适的capacity,减少扩展容量的操作,效率就会有更大的提高。比如下面的测试代码,我们对同样的字符串操作五百万次,统计一下结果。
1         StringBuilder sb = new StringBuilder(10*5000000);
2         StringBuffer sf = new StringBuffer(10*5000000);
3
4
5         long start = System.currentTimeMillis();
6         for(int i = 0; i < 5000000; i++)
7         {
8             sb.append("1234567890");
9         }
10         long end = System.currentTimeMillis();
11         System.out.println("the StringBuilder run time is "+(end -start)+" ms");
12
13         start = System.currentTimeMillis();
14         for(int i = 0; i < 5000000; i++)
15         {
16             sf.append("1234567890");
17         }
18         end = System.currentTimeMillis();
19         System.out.println("the StringBuffer run time is "+(end -start)+" ms");
  上面的结果我没有求平均值,测试也只是在单线程下进行的,但是数据波动不大,大致可以看出一些变化,我们发现当恰当的初始化了StringBuffer后,他的性能已经和未初始化的StringBuilder相当甚至超过了,这样我们就能够在保持和原来StringBuilder相当效率的基础上有更好的安全性了。
  可以看到采用了初始化的容量,我们获得的性能提升要高于从SF切换到SB。
  淘测试总结的结论中有一个我很喜欢,引用一下
  “ 用好现有的类比引入新的类更重要。很多程序员在使用 StringBuffer 时是不指定其容量的(至少我见到的情况是这样),如果这样的习惯带入 StringBuilder 的使用中,你将只能获得 10 %左右的性能提升(不要忘了,你可要冒多线程的风险噢);但如果你使用指定容量的 StringBuffer ,你将马上获得 45% 左右的性能提升,甚至比不使用指定容量的 StirngBuilder 都快 30% 左右。”
  这个问题其实后续还值得讨论,现在我们看到都是单线程的情况,那么多线程情况下,StringBuffer是不是可以优化的更多了?
  忽然发现,自己忽略了很多java的特性,学在当下。
《2023软件测试行业现状调查报告》独家发布~

关注51Testing

联系我们

快捷面板 站点地图 联系我们 广告服务 关于我们 站长统计 发展历程

法律顾问:上海兰迪律师事务所 项棋律师
版权所有 上海博为峰软件技术股份有限公司 Copyright©51testing.com 2003-2024
投诉及意见反馈:webmaster@51testing.com; 业务联系:service@51testing.com 021-64471599-8017

沪ICP备05003035号

沪公网安备 31010102002173号