空间管理您的位置: 51Testing软件测试网 » yuxgu的个人空间 » 日志

通过 JVM 查看关于 Apache Geronimo 的统计信息

上一篇 / 下一篇 2010-07-19 19:56:21

Apache Geronimo 应用服务器不仅是开放源码的，而且性能很高。所以它是运行高性能应用程序的自然选择。但是，只是将应用程序运行在 Geronimo 中还不能保证它满足您的性能要求。有时候，可能需要分析和优化应用程序的效率。有许多工具可用于该任务，但您可以通过分析 Java™ 虚拟机 (JVM) 统计信息基本完成该任务。本文将帮您体验如何从 JVM 获得统计信息，从而对应用程序进行概要分析和优化，以满足性能需要。

JVM 统计信息

JVM 提供许多统计信息。这些统计信息涉及诸如即时 (JIT) 编译、类加载、内存分配以及最有趣的垃圾收集之类基本的 JVM 特性。

即时编译

JVM 可将字节代码即时编译为机器代码。该动作类似于像您用于脚本语言的解释器（如 Perl）所执行的动作。但是它更先进，提供许多优化措施，使得已解释的字节代码几乎与预编译的代码运行得一样快（有时更快）。显然，执行 JIT 编译需要开销。度量应用程序需要多大开销的两个有用的统计信息是 JIT 编译次数和执行这些编译花费的时间总量。（有关 JIT 编译的更多详细信息，请参阅参考资料。）

类加载

JVM 负责从应用程序的类使用的库向应用程序和类中加载类。因此，这些类可能是从已部署在 Geronimo 中的 WAR 或 EAR 中加载的类，也可能是包含在 WAR 或 EAR 中的 JAR 文件，或者是由 Geronimo 容器加载的 JAR 中的类。如果类不用于延长的时间，则 JVM 还可以选择卸载这些类。这将导致几项重要的统计信息：加载的类的数量、卸载的类的数量、加载和卸载类花费的时间。

内存（堆）分配

在 Java 技术中没有malloc()函数，这是因为 JVM 可自动为对象分配内存。对象从堆中分配；因此，使用的和空闲的堆内存数量是两个非常重要的统计信息。监视堆分配是检测可怕的内存泄漏最简单的方法之一。

垃圾收集

这可能是 JVM 最有趣的统计信息。正像 JVM 为对象分配内存一样，它还回收不再使用的对象上的内存。关于垃圾收集如何工作，包括您可以指示 JVM 用于其垃圾收集器的不同算法，有很多有趣的读物。

还有许多关于垃圾收集器本身的有趣的统计信息。首先是调用垃圾收集器的频率和垃圾收集过程中花费的时间。垃圾收集的开销很大，因为本质上它会中止应用程序的执行以便可以检验对象。显然，大量的垃圾收集可以真正减慢应用程序的运行速度。

其他有趣的统计信息与对象分代有关。垃圾收集器按代对对象进行分类，每代都指示对象已经经历了一定次数的垃圾收集。（经历很多次垃圾收集的对象比未经历或者经历了很少次数垃圾收集的对象被垃圾收集的可能性更小。）这样的对象分类允许垃圾收集器检验更少的对象，使每次垃圾收集速度更快。因此，每代中对象的数量可能相当有趣，提供更好的方法来查找内存泄漏和很好的方法来考察潜在优化（如对象缓存和对象池）的影响。

回页首

访问 JVM 统计信息

有几个可用的 JVM 实现，但最常见的是 Sun 的 HotSpot JVM（有关技术链接，请参阅参考资料）。从 Java 2 Platform, Standard Edition (J2SE) 1.4.2 开始，HotSpot 进行了全面配备，提供许多上面描述的有用的统计信息。有好几个方法用于获得和分析这一数据。获得 JVM 生成的统计信息之后，您可以访问 Geronimo 的 JVM 并分析您的应用程序。

访问方法

获得一些 JVM 统计信息的最简单的方法是通过命令行。HotSpot 识别许多命令行选项，其中几个选项允许您定制堆大小和垃圾收集选项。也可以使用-verbose:gc选项。这可使 JVM 打印出以下形式的行：

[GC 70333K->65666K(98896K), 0.0007817 secs]
[Full GC 65666K->59333K(98896K), 0.0205250 secs]

上面示例中的第一行指示发生了一次垃圾收集。收集之前堆上使用了 70,333KB，收集之后使用了 65,666KB。第一行还指示总共有 98,896KB 的可用空间。最后，指出垃圾收集花费的时间，也即应用程序中止的时间量。第二行指示相同的信息，但表示一个完整的垃圾收集。完整的垃圾收集涉及 JVM 对堆上所有的对象进行检验，包括经历了许多代、在部分垃圾收集上不会被分析的对象。

有关更详细的信息，请使用-XX:+PrintGCDetails和-XX:+PrintGCTimeStamps选项。这些选项提供关于堆上对象的不同代的详细信息。

对于看上去更为有趣的统计信息，可以使用专门的工具。开放源码的工具和商业工具都可以使用。还可以使用 Sun 提供的一些用于与 HotSpot 一起使用的工具。jvmstat项目包含几个用于监视 JVM 统计信息的工具，包括一个叫做 Visual Garbage Collector 或visualgc的图形工具，它使用起来相对简单。您需要 Java 5 或更高版本来运行jvmstat，尽管它可以附加和监视 1.4.2 或更高版本的 JVM。只需下载和解压即可（有关下载链接，请参阅参考资料）。将它添加到您的路径，即可准备运行。启动了 Java 进程时，请使用jps工具来通过键入jps标识其 JVM。它向您提供一个正在运行的 Java 进程的列表，这些进程以其 JVM 作为 ID。然后使用您想监视的进程的 ID 调用visualgc。jvmstat发行版包括一个用于调用visualgc的 shell 脚本。如果安装了cygwin这样的工具，就可以在 *nix 或 Microsoft® Windows® 上调用visualgc了。此外，也可以按以下方式调用它：

java -Xbootclasspath/p:%JAVA_HOME%\lib\tools.jar -jar %JVMSTAT_HOME%\jars\visualgc.jar 316

其中JAVA_HOME环境变量指定安装 JDK 的位置，而JVMSTAT_HOME指示安装jvmstat包的位置。该行末尾的 316 是您想监视的 JVM 的 ID。该jvmstat包还包括一个 jstat 工具。它提供在visualgc中看到的绝大部分相同信息，只不过将其作为文本输出。这对收集统计信息而言至关重要，然后可以将这些统计信息拖入另一个程序，以对其进行深入分析、生成有关它的报告，等等。本文集中讨论使用visualgc对这些统计信息进行可视化。

清单 1提供一个短程序，您可以运行来测试使用jvmstat进行监视。

清单 1. 测试用 jvmstat 进行监视

StatGen.java
import java.util.ArrayList;
import java.util.List;

public class StatGen {

    static final int MAX_BLOCK = 8*1024*100;

    public static void main(String[] args) {
        try{
            int numLoops = 1;
            if (args.length > 0){
                 numLoops = Integer.parseInt(args[0]);
            }
            System.out.println("#loops="+numLoops);
            
            List<long[]> list = new ArrayList<long[]>(numLoops);
            for (int i=0;i<numLoops;i++){
                int sz = (int) (Math.random()*MAX_BLOCK);
                long[] garbage = new long[sz];
                if (sz % 5 == 0){
                    list.add(garbage);
                }
                System.out.println("Sleeping 0.5s");
                Thread.sleep(500);
            }
            System.out.println("Done");
        } catch (Throwable t) {
              t.printStackTrace();
        }
        System.exit(0);
    }
}

这是一个简单的程序。它使用了泛型，所以您需要 Java 5 。如果愿意，您可以容易地改变它以不使用泛型，然后它将用较旧的 JDK 运行。它通过创建可随机调整大小的长整数数组导致内存分配。它通过随机将这些数组的一部分（大约 20%）放入一个列表来模拟内存泄漏。因此，垃圾收集器可以回收在每个循环上分配的大多数内存，但它不能回收添加到列表中的数组。您可以试验一些参数，比如睡眠大小和最大块大小。它还可以接收命令行参数，所以您可以容易地告知它要执行多少次循环。

编译StatGen之后，您可以简单地从java StatGen 100开始。这执行 100 次循环。记住，您可以在命令行指定最小和最大堆大小。采用不同的最小和最大堆大小在运行visualgc时将产生截然不同的视觉效果。您还可以指定不同的垃圾收集算法；用visualgc监视StatGen时，将很好地理解这些算法的区别。

图 1展示了一些用StatGen运行visualgc的示例输出。

图 1. 用StatGen运行visualgc
用 StatGen 运行 visualgc