在论坛混了多日,发现越来越多的性能测试工程师基本上都能够掌握利用测试工具来作负载压力测试,但多数人对怎样去分析工具收集到的测试结果感到无从下手,下面我就把个人工作中的体会和收集到的有关资料整理出来,希望能对大家分析测试结果有所帮助。51Testing软件测试网(hBe6o'B;`7Wln,D:a
分析原则:51Testing软件测试网]A SO IBv1r+F{
• 具体问题具体分析(这是由于不同的应用系统,不同的测试目的,不同的性能关注点)51Testing软件测试网)_im K5~.|/]
t*E
• 查找瓶颈时按以下顺序,由易到难。
'k0];t0X]$S
n.z n(u0 服务器硬件瓶颈-〉网络瓶颈(对局域网,可以不考虑)-〉服务器操作系统瓶颈(参数配置)-〉中间件瓶颈(参数配置,数据库,web服务器等)-〉应用瓶颈(SQL语句、数据库设计、业务逻辑、算法等)51Testing软件测试网'V1t-M[W
注:以上过程并不是每个分析中都需要的,要根据测试目的和要求来确定分析的深度。对一些要求低的,我们分析到应用系统在将来大的负载压力(并发用户数、数据量)下,系统的硬件瓶颈在哪儿就够了。
"~$D,h0S%t0• 分段排除法 很有效51Testing软件测试网;skj LZ"DZ
分析的信息来源:51Testing软件测试网F$}#b,V:R|
•1 根据场景运行过程中的错误提示信息
'M#F%cB7|W#Uj0•2 根据测试结果收集到的监控指标数据51Testing软件测试网n+[D6^Bu'hE
一.错误提示分析
K1l7F;gay"n{?S/~0分析实例:51Testing软件测试网r%C#@,JPFu
1 •Error: Failed to connect to server “10.10.10.30:8080″: [10060] Connection51Testing软件测试网9X:|$t~I _;W-d4M&V
•Error: timed out Error: Server “10.10.10.30″ has shut down the connection prematurely
lCJ2ai^0分析:51Testing软件测试网4V5p%_X jVp
•A、应用服务死掉。51Testing软件测试网6ok(P3Q!B"A D%GR!T
(小用户时:程序上的问题。程序上处理数据库的问题)
,_*Av~;Dj"g.E0•B、应用服务没有死
g#i{TC2RM0(应用服务参数设置问题)
9x.HorrN I0 例:在许多客户端连接Weblogic应用服务器被拒绝,而在服务器端没有错误显示,则有可能是Weblogic中的server元素的AcceptBacklog属性值设得过低。如果连接时收到connection refused消息,说明应提高该值,每次增加25%
7F{0_B|7l5y U6K4O0•C、数据库的连接
'D
f%G5?}$@{i5O0(1、在应用服务的性能参数可能太小了 2、数据库启动的最大连接数(跟硬件的内存有关))
liFDH02 Error: Page download timeout (120 seconds) has expired51Testing软件测试网8YNI0z%r
分析:可能是以下原因造成51Testing软件测试网.fr*Db$d"GNK,E
•A、应用服务参数设置太大导致服务器的瓶颈51Testing软件测试网8O
p#qajI
•B、页面中图片太多
f?9A_%tQ0•C、在程序处理表的时候检查字段太大多51Testing软件测试网&f\#[9D
k-w
二.监控指标数据分析
S ElV.QX01.最大并发用户数:
Z9{ ~8]:F h)b7g0应用系统在当前环境(硬件环境、网络环境、软件环境(参数配置))下能承受的最大并发用户数。51Testing软件测试网3dz2t7|V!J'ZUZ4T+Da
在方案运行中,如果出现了大于3个用户的业务操作失败,或出现了服务器shutdown的情况,则说明在当前环境下,系统承受不了当前并发用户的负载压力,那么最大并发用户数就是前一个没有出现这种现象的并发用户数。
~^_S
TBt0 如果测得的最大并发用户数到达了性能要求,且各服务器资源情况良好,业务操作响应时间也达到了用户要求,那么OK。否则,再根据各服务器的资源情况和业务操作响应时间进一步分析原因所在。
v&A(]nR)\02.业务操作响应时间:
6c-OQb)}ZikT0 • 分析方案运行情况应从平均事务响应时间图和事务性能摘要图开始。使用“事务性能摘要”图,可以确定在方案执行期间响应时间过长的事务。
d*mz~*O1d!Pw*? d0• 细分事务并分析每个页面组件的性能。查看过长的事务响应时间是由哪些页面组件引起的?问题是否与网络或服务器有关?51Testing软件测试网:Gz$Kp"w
• 如果服务器耗时过长,请使用相应的服务器图确定有问题的服务器度量并查明服务器性能下降的原因。如果网络耗时过长,请使用“网络监视器”图确定导致性能瓶颈的网络问题51Testing软件测试网-F[U'xb'W(EH
3.服务器资源监控指标:51Testing软件测试网&g#@,[/j
d
内存:
*I,p4Q:JOLEh4_01 UNIX资源监控中指标内存页交换速率(Paging rate),如果该值偶尔走高,表明当时有线程竞争内存。如果持续很高,则内存可能是瓶颈。也可能是内存访问命中率低。
)u*Yr`|MjU*k02 Windows资源监控中,如果Process\Private Bytes计数器和Process\Working Set计数器的值在长时间内持续升高,同时Memory\Available bytes计数器的值持续降低,则很可能存在内存泄漏。
\o$D4k.wS0内存资源成为系统性能的瓶颈的征兆:51Testing软件测试网j0l@jn&Z3c/U-Qb?
很高的换页率(high pageout rate);
.MPUs lW0进程进入不活动状态;
Uj9q
^(d [a*d0交换区所有磁盘的活动次数可高;
0|`%C
`TY#Ci0可高的全局系统CPU利用率;
hMA g$Z L.sZ0内存不够出错(out of memory errors)
m0f)D(JofMJ0处理器:51Testing软件测试网}9L1w2q`v Tj
1 UNIX资源监控(Windows操作系统同理)中指标CPU占用率(CPU utilization),如果该值持续超过95%,表明瓶颈是CPU。可以考虑增加一个处理器或换一个更快的处理器。如果服务器专用于SQL Server,可接受的最大上限是80-85% 51Testing软件测试网 B[Z `m
合理使用的范围在60%至70%。51Testing软件测试网5UYw
V9a$B
2 Windows资源监控中,如果System\Processor Queue Length大于2,而处理器利用率(Processor Time)一直很低,则存在着处理器阻塞。
/o/{2Dn|1M5gb0CPU资源成为系统性能的瓶颈的征兆: 51Testing软件测试网UR9x^g
很慢的响应时间(slow response time) 51Testing软件测试网!^#c NnSm _i
CPU空闲时间为零(zero percent idle CPU) 51Testing软件测试网 h[
C6^{/L.eR Fq4b
过高的用户占用CPU时间(high percent user CPU)
]8L*j5jT^$[0过高的系统占用CPU时间(high percent system CPU)
*C4@*r-Ta
zs_0长时间的有很长的运行进程队列(large run queue size sustained over time)51Testing软件测试网y/ao
qdN
磁盘I/O:51Testing软件测试网Q&c&D0Qv/AP'}4T.H
1 UNIX资源监控(Windows操作系统同理)中指标磁盘交换率(Disk rate),如果该参数值一直很高,表明I/O有问题。可考虑更换更快的硬盘系统。
5B`b8Gc2nTE02 Windows资源监控中,如果 Disk Time和Avg.Disk Queue Length的值很高,而Page Reads/sec页面读取操作速率很低,则可能存在磁盘瓶径。51Testing软件测试网lu_B2J
I/O资源成为系统性能的瓶颈的征兆 :51Testing软件测试网(E mt
oP7Wx)F9A8F
过高的磁盘利用率(high disk utilization)
eOXk4[0太长的磁盘等待队列(large disk queue length) 51Testing软件测试网4EevkL`(uvq
等待磁盘I/O的时间所占的百分率太高(large percentage of time waiting for disk I/O) 51Testing软件测试网1H:Sjw*\9@%@.dG
太高的物理I/O速率:large physical I/O rate(not sufficient in itself) 51Testing软件测试网FXX
ZN!A
过低的缓存命中率(low buffer cache hit ratio(not sufficient in itself)) 51Testing软件测试网f{(J6n
A
太长的运行进程队列,但CPU却空闲(large run queue with idle CPU)
}S_
I6Xu
i^;F([E6~04.数据库服务器:
w(`4^wJ#r0KO0SQL Server数据库:51Testing软件测试网!L*cdF*Nz[EF
1 SQLServer资源监控中指标缓存点击率(Cache Hit Ratio),该值越高越好。如果持续低于80%,应考虑增加内存。
3x.deh"b3M9tb02 如果Full Scans/sec(全表扫描/秒)计数器显示的值比1或2高,则应分析你的查询以确定是否确实需要全表扫描,以及SQL查询是否可以被优化。 51Testing软件测试网a4I5LQ7fO^`E'jB
3 Number of Deadlocks/sec(死锁的数量/秒):死锁对应用程序的可伸缩性非常有害,并且会导致恶劣的用户体验。该计数器的值必须为0。
,~K_id04 Lock Requests/sec(锁请求/秒),通过优化查询来减少读取次数,可以减少该计数器的值。51Testing软件测试网\qqnX"d'a
Oracle数据库:51Testing软件测试网r6wS j%_8n
1 如果自由内存接近于0而且库快存或数据字典快存的命中率小于0.90,那么需要增加SHARED_POOL_SIZE的大小。
C@jX*pGx0快存(共享SQL区)和数据字典快存的命中率: 51Testing软件测试网3[_
d @![L
select(sum(pins-reloads))/sum(pins) from v$librarycache; 51Testing软件测试网j'XoX0C+m
select(sum(gets-getmisses))/sum(gets) from v$rowcache; 51Testing软件测试网.\1A-DMB"_
自由内存: select * from v$sgastat where name=’free memory’; 51Testing软件测试网 U*[;TB+nr L
2 如果数据的缓存命中率小于0.90,那么需要加大DB_BLOCK_BUFFERS参数的值(单位:块)。
h0d\J e-WIQ~\.Q"x0缓冲区高速缓存命中率:
w SDH|0A^-a8i0select name,value from v$sysstat where name in (’db block gets’,51Testing软件测试网4Z2qETQ
‘consistent gets’,'physical reads’) ;51Testing软件测试网;L(c~o-Fu/c.sQ-gK!d
Hit Ratio = 1-(physical reads / ( db block gets + consistent gets))
Qx9c,D:Vp5e03 如果日志缓冲区申请的值较大,则应加大LOG_BUFFER参数的值。
;o
o&\|Gu+V;[K0日志缓冲区的申请情况 :
&Rd\P3yW0select name,value from v$sysstat where name = ‘redo log space requests’ ;51Testing软件测试网^1]3r-y+y3J[
|
4 如果内存排序命中率小于0.95,则应加大SORT_AREA_SIZE以避免磁盘排序 。51Testing软件测试网;H ?'p
HK}k
内存排序命中率 :
*eZf@2G4x0select round((100*b.value)/decode((a.value+b.value), 0, 1, (a.value+b.value)), 2)from v$sysstat a, v$sysstat b where a.name=’sorts (disk)’ and b.name=’sorts (memory)’51Testing软件测试网9VDL)},stF5~
注:上述SQL Server和Oracle数据库分析,只是一些简单、基本的分析,特别是Oracle数据库的分析和优化,是一门专门的技术,进一步的分析可查相关资料。51Testing软件测试网Q3[H?7Y#M9q6JM uR
51Testing软件测试网]"SUko(br
源文档 <http://www.51testing.com/html/8/1913.html>51Testing软件测试网l q+_mtVB${