灿烂的阳光,苦涩的生活,认真做,你能行!

发布新日志

  • GC工作机制

    2012-09-07 15:11:05

    SUN的jvm内存池被划分为以下几个部分:
    Eden Space (heap)
    内存最初从这个线程池分配给大部分对象。
    Survivor Space (heap)
    用于保存在eden space内存池中经过垃圾回收后没有被回收的对象。
    Tenured Generation (heap)
    用于保持已经在survivor space内存池中存在了一段时间的对象。
    Permanent Generation (non-heap)
    保存虚拟机自己的静态(reflective)数据,例如类(class)和方法(method)对象。Java虚拟机共享这些类数据。这个区域被分割为只读的和只写的。
    Code Cache (non-heap)
    HotSpot Java虚拟机包括一个用于编译和保存本地代码(native code)的内存,叫做“代码缓存区”(code cache)。
    jvm的内存回收过程是这样的:
    对象在Eden Space创建,当Eden Space满了的时候,gc就把所有在Eden Space中的对象扫描一次,把所有有效的对象复制到第一个Survivor Space,同时把无效的对象所占用的空间释放。当Eden Space再次变满了的时候,就启动移动程序把Eden Space中有效的对象复制到第二个Survivor Space,同时,也将第一个Survivor Space中的有效对象复制到第二个Survivor Space。如果填充到第二个Survivor Space中的有效对象被第一个Survivor Space或Eden Space中的对象引用,那么这些对象就是长期存在的,此时这些对象将被复制到Permanent Generation。

    若垃圾收集器依据这种小幅度的调整收集不能腾出足够的空间,就会运行Full GC,此时jvm gc停止所有在堆中运行的线程并执行清除动作

  • JAVA测试模式

    2009-05-15 15:34:10

    测试模式是一种针对软件测试领域的某种高频率出现问题而采取并经过实践证明行之有效的专门化、高效的解决途径(方法),它在软件理论和实践两者之间起着 “ 桥梁 ” 的作用。在面向对象语言 JAVA 程序测试的过程中,一个较为棘手的问题就是 JAVA 类的可视性问题。 “ 信息隐蔽 ” 固然是面向对象语言设计的一个突出的优点,但是同时也给测试带来诸多不便,有关 “ 隐蔽信息 ” 的可测试性成为这类测试的一大突出结症。为此我们针对 JAVA 类不同的 “ 可视性 ” 要求的场合,采取相应的测试模式来支撑相关 JAVA 类(包)的测试。本文主要总结五个常用的 JAVA 测试模式,以飨读者。这五个模式同样适合于其它面向对象类(包)的测试,只不过在具体细节上要考虑与 JAVA 语言信息隐蔽性的差异。比如: JAVA 的可视性以包为界,同一个包内的类对其他类具有相同的存取权限。而 C++ 则以类为界,只有子类和友员函数方可对基类的隐蔽信息进行存取。

    我们在下面以图表的方式给出 五个常用 JAVA 测试模式详细描述,有关模式的描述类目分别是模式名称、测试对象、针对问题、约束条件、解决方法、实例、约束解决方式和该测试的设计原理。

    模式(一) Main 模式

    模式名称

    Main

    测试对象

    JAVA 类

    针对问题

    测试人员不知道在何处编写驱动和初始化被测试类的测试代码

    约束

    测试必须容易运行、测试代码能够访问该类所有的特征(所有的属性和方法)

    解决方法

    将测试代码放入类的 public static void main(String[] args) 方法中去

    实例

    public static void main(String[] args){

    SomeClass result;

    // perform. the test…

    System.out.print(“result is..”);

    }

    约束解决

    该测试代码能够率先被激活和执行、并能够访问被测试类所有的特征

    设计原理

    JAVA 类可以拥有 public static void main(String[] args) 方法,它是类在 JVM 中被率先执行的方法,控制着整个类的执行逻辑, main 方法能够访问所在类的所有属性和方法

    模式(二) toString 模式

    模式名称

    toString

    测试对象

    作为运算结果的类

    针对问题

    测试人员不知道如何检验一个运算对象的中间结果和最终结果

    约束

    测试结果代表对象内部的一个状态,而该状态必须能够被测试

    解决方法

    通过使用 toString 方法来对类状态进行描述,描述结果可以通过打印与预期结果进行比较

    实例

    class SomeClass {

    //…

    public String toString(){

    // custom representation

    }

    }

    约束解决

    类的内部状态通过字符串来进行表示因而得以解决

    设计原理

    在基类定义的 toString() 方法能够提供特定对象的状态的描述,通过将对象状态描述进行打印和显示来判定对象状态是否与预期相符

    模式(三) Equal 模式

    模式名称

    Equal

    测试对象

    JAVA 类

    针对问题

    作为运算结果的类

    约束

    测试人员不知道如何检验一个运算对象的中间结果和最终结果

    解决方法

    定义 equals 方法比较实际结果与预期结果进行比较

    实例

    class SomeClass {

    //…

    public boolean equals(Object o){

    // custom comparison

    }

    }

    约束解决

    保持某个状态的对象需要与预期对象进行比较,通过比较后的布尔值来确定是否与预期结果相符合

    设计原理

    在基类定义的 public boolean equals(Object) 能够对比对象间的差异并以布尔值形式返回比较结果

    模式(四) Internal Tester Class 模式

    模式名称

    Internal Tester Class

    测试对象

    JAVA 包

    针对问题

    测试人员不知在何处编写测试代码测试包中的类

    约束

    测试代码与运行代码必须分开来,测试代码能够访问到类的所有特性,测试代码起到的是一个包的客户端的角色。

    解决方法

    新建一个类并将该类的包路径与被测试类的包路径相同,然后在该类里写入所有的测试代码

    实例

    package theOne;

    public class InternalTestClass {

    //…

    }

    约束解决

    所有的测试代码均与运行代码分离,由于它与运行代码在同一包路径下,所以它与普通的客户端相比具有更多的可视性

    设计原理

    将测试代码定义在一个特定的类中。由于测试类与运行类在同一个包路径下,因此它能访问测试类的类的所有特性。因此,它远比客户端测试具有更大的可视性。

    模式(五) Extern Tester Class 模式

    模式名称

    Extern Tester Class 模式

    测试对象

    JAVA 包

    针对问题

    测试人员不知在何处编写测试代码测试包中的类

    约束

    测试代码与运行代码必须分开来,测试代码能够访问到类的可视特征,测试代码起到的是一个包的客户端的角色。

    解决方法

    新建一个类,指定与被测试类不同的包路径,然后在该类里写入所有的测试代码

    实例

    package anotherOne;

    public class ExternalTestClass {

    //…

    }

    约束解决

    所有的测试代码均与运行代码分离,由于它与运行代码在不同的包路径下,所以它与普通的客户端的可视性相同

    设计原理

    将测试代码定义在一个特定的类中。由于测试类与运行类不在同一个包路径下,因此它不能访问测试类的所有属性和方法。但是它与客户端具有相同的可视性。因此,它可以替代客户端进行测试。

    上面五个模式的作用关系如图-1所示:

     

    图-1 JAVA 测试模式图解

    了解上述所述的模式有助于测试人员在具体 JAVA 代码测试中编写测试类,同时上述的这些 JAVA 测试模式还可以借助 JUnit 这样的测试框架来实现。

    注:本文根据 Marco Torchiano 的《 Patterns for Java Program Testing 》删减改编而成

  • Java性能

    2008-12-23 23:25:03

    "本附录由Joe Sharp投稿,并获得他的同意在这儿转载。请联系SharpJoe@aol.com"

    Java语言特别强调准确性,但可靠的行为要以性能作为代价。这一特点反映在自动收集垃圾、严格的运行期检查、完整的字节码检查以及保守的运行期同步等等方面。对一个解释型的虚拟机来说,由于目前有大量平台可供挑选,所以进一步阻碍了性能的发挥。

    "先做完它,再逐步完善。幸好需要改进的地方通常不会太多。"Steve McConnell的《About performance[16]

    本附录的宗旨就是指导大家寻找和优化"需要完善的那一部分"

     

    1       基本方法

    只有正确和完整地检测了程序后,再可着手解决性能方面的问题:

    (1)   在现实环境中检测程序的性能。若符合要求,则目标达到。若不符合,则转到下一步。

    (2)   寻找最致命的性能瓶颈。这也许要求一定的技巧,但所有努力都不会白费。如简单地猜测瓶颈所在,并试图进行优化,那么可能是白花时间。

    (3)   运用本附录介绍的提速技术,然后返回步骤1

    为使努力不至白费,瓶颈的定位是至关重要的一环。Donald Knuth[9]曾改进过一个程序,那个程序把50%的时间都花在约4%的代码量上。在仅一个工作小时里,他修改了几行代码,使程序的执行速度倍增。此时,若将时间继续投入到剩余代码的修改上,那么只会得不偿失。

    Knuth在编程界有一句名言:"过早的优化是一切麻烦的根源"Premature optimization is the root of all evil)。最明智的做法是抑制过早优化的冲动,因为那样做可能遗漏多种有用的编程技术,造成代码更难理解和操控,并需更大的精力进行维护。

    2       寻找瓶颈

    为找出最影响程序性能的瓶颈,可采取下述几种方法:

     

    1)     安插自己的测试代码

    插入下述"显式"计时代码,对程序进行评测:

    long start = System.currentTimeMillis();

    // 要计时的运算代码放在这儿

    long time = System.currentTimeMillis() - start;

    利用System.out.println(),让一种不常用到的方法将累积时间打印到控制台窗口。由于一旦出错,编译器会将其忽略,所以可用一个"静态最终布尔值"Static final boolean)打开或关闭计时,使代码能放心留在最终发行的程序里,这样任何时候都可以拿来应急。尽管还可以选用更复杂的评测手段,但若仅仅为了量度一个特定任务的执行时间,这无疑是最简便的方法。

    System.currentTimeMillis()返回的时间以千分之一秒(1毫秒)为单位。然而,有些系统的时间精度低于1毫秒(如Windows PC),所以需要重复n次,再将总时间除以n,获得准确的时间。

     

    2)     JDK性能评测[2]

    JDK配套提供了一个内建的评测程序,能跟踪花在每个例程上的时间,并将评测结果写入一个文件。不幸的是,JDK评测器并不稳定。它在JDK 1.1.1中能正常工作,但在后续版本中却非常不稳定。

    为运行评测程序,请在调用Java解释器的未优化版本时加上-prof选项。例如:

    java_g -prof myClass

    或加上一个程序片(Applet):

    java_g -prof sun.applet.AppletViewer applet.html

    理解评测程序的输出信息并不容易。事实上,在JDK 1.0中,它居然将方法名称截短为30字符。所以可能无法区分出某些方法。然而,若您用的平台确实能支持-prof选项,那么可试试Vladimir Bulatov"HyperPorf"[3]或者Greg White"ProfileViewer"来解释一下结果。

     

    3)     特殊工具

    如果想随时跟上性能优化工具的潮流,最好的方法就是作一些Web站点的常客。比如由Jonathan Hardwick制作的"Tools for Optimizing Java"Java优化工具)网站:

    http://www.cs.cmu.edu/~jch/java/tools.html

     

    4)     性能评测的技巧

    ■由于评测时要用到系统时钟,所以当时不要运行其他任何进程或应用程序,以免影响测试结果。

    ■如对自己的程序进行了修改,并试图(至少在开发平台上)改善它的性能,那么在修改前后应分别测试一下代码的执行时间。

    ■尽量在完全一致的环境中进行每一次时间测试。

    ■如果可能,应设计一个不依赖任何用户输入的测试,避免用户的不同反应导致结果出现误差。

     

    3       提速方法

    现在,关键的性能瓶颈应已隔离出来。接下来,可对其应用两种类型的优化:常规手段以及依赖Java语言。

     

    1)     常规手段

    通常,一个有效的提速方法是用更现实的方式重新定义程序。例如,在《Programming Pearls》(编程拾贝)一书中[14]Bentley利用了一段小说数据描写,它可以生成速度非常快、而且非常精简的拼写检查器,从而介绍了Doug McIlroy对英语语言的表述。除此以外,与其他方法相比,更好的算法也许能带来更大的性能提升--特别是在数据集的尺寸越来越大的时候。欲了解这些常规手段的详情,请参考本附录末尾的"一般书籍"清单。

     

    2)     依赖语言的方法

    为进行客观的分析,最好明确掌握各种运算的执行时间。这样一来,得到的结果可独立于当前使用的计算机--通过除以花在本地赋值上的时间,最后得到的就是"标准时间"

     

    运算 示例 标准时间

     

    本地赋值 i=n; 1.0

    实例赋值 this.i=n; 1.2

    int增值 i++; 1.5

    byte增值 b++; 2.0

    short增值 s++; 2.0

    float增值 f++; 2.0

    double增值 d++; 2.0

    空循环 while(true) n++; 2.0

    三元表达式 (x<0) ?-x : x 2.2

    算术调用 Math.abs(x); 2.5

    数组赋值 a[0] = n; 2.7

    long增值 l++; 3.5

    方法调用 funct(); 5.9

    throwcatch异常 try{ throw e; }catch(e){} 320

    同步方法调用 synchMehod(); 570

    新建对象 new Object(); 980

    新建数组 new int[10]; 3100

     

    通过自己的系统(如我的Pentium 200 ProNetscape 3JDK 1.1.5),这些相对时间向大家揭示出:新建对象和数组会造成最沉重的开销,同步会造成比较沉重的开销,而一次不同步的方法调用会造成适度的开销。参考资源[5][6]为大家总结了测量用程序片的Web地址,可到自己的机器上运行它们。

     

    1. 常规修改

    下面是加快Java程序关键部分执行速度的一些常规操作建议(注意对比修改前后的测试结果)。

     

    ... 修改成... 理由

     

    接口 抽象类(只需一个父时) 接口的多个继承会妨碍性能的优化

    非本地或数组循环变量 本地循环变量 根据前表的耗时比较,一次实例整数赋值的时间是本地整数赋值时间的1.2倍,但数组赋值的时间是本地整数赋值的2.7

    链接列表(固定尺寸) 保存丢弃的链接项目,或将列表替换成一个循环数组(大致知道尺寸) 每新建一个对象,都相当于本地赋值980次。参考"重复利用对象"(下一节)、Van Wyk[12] p.87以及Bentley[15] p.81

    x/2(或2的任意次幂) X>>2(或2的任意次幂) 使用更快的硬件指令

     

    3)     特殊情况

    ■字串的开销:字串连接运算符+看似简单,但实际需要消耗大量系统资源。编译器可高效地连接字串,但变量字串却要求可观的处理器时间。例如,假设st是字串变量:

    System.out.println("heading" + s + "trailer" + t);

    上述语句要求新建一个StringBuffer(字串缓冲),追加自变量,然后用toString()将结果转换回一个字串。因此,无论磁盘空间还是处理器时间,都会受到严重消耗。若准备追加多个字串,则可考虑直接使用一个字串缓冲--特别是能在一个循环里重复利用它的时候。通过在每次循环里禁止新建一个字串缓冲,可节省980单位的对象创建时间(如前所述)。利用substring()以及其他字串方法,可进一步地改善性能。如果可行,字符数组的速度甚至能够更快。也要注意由于同步的关系,所以StringTokenizer会造成较大的开销。

    ■同步:在JDK解释器中,调用同步方法通常会比调用不同步方法慢10倍。经JIT编译器处理后,这一性能上的差距提升到50100倍(注意前表总结的时间显示出要慢97倍)。所以要尽可能避免使用同步方法--若不能避免,方法的同步也要比代码块的同步稍快一些。

    ■重复利用对象:要花很长的时间来新建一个对象(根据前表总结的时间,对象的新建时间是赋值时间的980倍,而新建一个小数组的时间是赋值时间的3100倍)。因此,最明智的做法是保存和更新老对象的字段,而不是创建一个新对象。例如,不要在自己的paint()方法中新建一个Font对象。相反,应将其声明成实例对象,再初始化一次。在这以后,可在paint()里需要的时候随时进行更新。参见Bentley编著的《编程拾贝》,p.81[15]

    ■异常:只有在不正常的情况下,才应放弃异常处理模块。什么才叫"不正常"呢?这通常是指程序遇到了问题,而这一般是不愿见到的,所以性能不再成为优先考虑的目标。进行优化时,将小的"try-catch"块合并到一起。由于这些块将代码分割成小的、各自独立的片断,所以会妨碍编译器进行优化。另一方面,若过份热衷于删除异常处理模块,也可能造成代码健壮程度的下降。

    散列处理:首先,Java 1.01.1的标准"散列表"Hashtable)类需要造型以及特别消耗系统资源的同步处理(570单位的赋值时间)。其次,早期的JDK库不能自动决定最佳的表格尺寸。最后,散列函数应针对实际使用项(Key)的特征设计。考虑到所有这些原因,我们可特别设计一个散列类,令其与特定的应用程序配合,从而改善常规散列表的性能。注意Java 1.2集合库的散列映射(HashMap)具有更大的灵活性,而且不会自动同步。

    方法内嵌:只有在方法属于final(最终)、private(专用)或static(静态)的情况下,Java编译器才能内嵌这个方法。而且某些情况下,还要求它绝对不可以有局部变量。若代码花大量时间调用一个不含上述任何属性的方法,那么请考虑为其编写一个"final"版本。

    I/O:应尽可能使用缓冲。否则,最终也许就是一次仅输入/输出一个字节的恶果。注意JDK 1.0I/O类采用了大量同步措施,所以若使用象readFully()这样的一个"大批量"调用,然后由自己解释数据,就可获得更佳的性能。也要注意Java 1.1"reader""writer"类已针对性能进行了优化。

    造型和实例:造型会耗去2200个单位的赋值时间。开销更大的甚至要求上溯继承(遗传)结构。其他高代价的操作会损失和恢复更低层结构的能力。

    图形:利用剪切技术,减少在repaint()中的工作量;倍增缓冲区,提高接收速度;同时利用图形压缩技术,缩短下载时间。来自JavaWorld"Java Applets"以及来自Sun"Performing Animation"是两个很好的教程。请记着使用最贴切的命令。例如,为根据一系列点画一个多边形,和drawLine()相比,drawPolygon()的速度要快得多。如必须画一条单像素粗细的直线,drawLine(x,y,x,y)的速度比fillRect(x,y,1,1)快。

    使用API类:尽量使用来自Java API的类,因为它们本身已针对机器的性能进行了优化。这是用Java难于达到的。比如在复制任意长度的一个数组时,arraryCopy()比使用循环的速度快得多。

    替换API类:有些时候,API类提供了比我们希望更多的功能,相应的执行时间也会增加。因此,可定做特别的版本,让它做更少的事情,但可更快地运行。例如,假定一个应用程序需要一个容器来保存大量数组。为加快执行速度,可将原来的Vector(矢量)替换成更快的动态对象数组。

     

    1. 其他建议

    将重复的常数计算移至关键循环之外--比如计算固定长度缓冲区的buffer.length

    static final(静态最终)常数有助于编译器优化程序。

    实现固定长度的循环。

    使用javac的优化选项:-O。它通过内嵌staticfinal以及private方法,从而优化编译过的代码。注意类的长度可能会增加(只对JDK 1.1而言--更早的版本也许不能执行字节查证)。新型的"Just-in-time"JIT)编译器会动态加速代码。

    尽可能地将计数减至0--这使用了一个特殊的JVM字节码。

     

    4       参考资源

     

    1)     性能工具

    [1] 运行于Pentium Pro 200Netscape 3.0JDK 1.1.4MicroBenchmark(参见下面的参考资源[5]

    [2] SunJava文档页--JDK Java解释器主题:

    http://java.sun.com/products/JDK/tools/win32/java.html

    [3] Vladimir BulatovHyperProf

    http://www.physics.orst.edu/~bulatov/HyperProf

    [4] Greg WhiteProfileViewer

    http://www.inetmi.com/~gwhi/ProfileViewer/ProfileViewer.html

     

    2)     Web站点

    [5] 对于Java代码的优化主题,最出色的在线参考资源是Jonathan Hardwick"Java Optimization"网站:

    http://www.cs.cmu.edu/~jch/java/optimization.html

    "Java优化工具"主页:

    http://www.cs.cmu.edu/~jch/java/tools.html

    以及"Java Microbenchmarks"(有一个45秒钟的评测过程):

    http://www.cs.cmu.edu/~jch/java/benchmarks.html

     

    3)     文章

Open Toolbar