性能测试测试分析
上一篇 / 下一篇 2007-06-21 18:06:37 / 个人分类:Mercury LoadRunner
注明:转贴!
.pc$s L5t0分析原则:
8vp[5e@N6]"j0 •具体问题具体分析(这是由于不同的应用系统,不同的测试目的,不同的性能关注点)51Testing软件测试网"R.Z#dD,RC(p+b%tN)L
•查找瓶颈时按以下顺序,由易到难。
f5} SF z4K!D3kof;H0 服务器硬件瓶颈-〉网络瓶颈(对局域网,可以不考虑)-〉服务器操作系统瓶颈(参数配置)-〉中间件瓶颈(参数配置,数据库,web服务器等)-〉应用瓶颈(SQL语句、数据库设计、业务逻辑、算法等)
@7Ii!g1Lg(P0 注:以上过程并不是每个分析中都需要的,要根据测试目的和要求来确定分析的深度。对一些要求低的,我们分析到应用系统在将来大的负载压力(并发用户数、数据量)下,系统的硬件瓶颈在哪儿就够了。51Testing软件测试网m'u3@yTc Gw
•分段排除法很有效
}C*f,Xg_j0
-i6|7Ey&e0c6y;aV0分析的信息来源:
E0h-s#d6A:n[Ow0 •1根据场景运行过程中的错误提示信息51Testing软件测试网-Ej(Ur3tS
•2根据测试结果收集到的监控指标数据
&RO:q6oX0
[oEJlff0一.错误提示分析
?+@.[yv h5ar-Sc0分析实例:51Testing软件测试网VDAg1?9R
1 •Error: Failed to connect to server "10.10.10.30:8080": [10060] Connection51Testing软件测试网rv-_#tv5|#y%bi:[a
•Error: timed out Error: Server "10.10.10.30" has shut down the connection prematurely
$~y K~6uK{N0
&[:T4c$mPf0 分析:51Testing软件测试网6V [7wvGzTu
•A、应用服务死掉。51Testing软件测试网)EA/?;L5Twaa
(小用户时:程序上的问题。程序上处理数据库的问题)51Testing软件测试网8m%q?;tr
•B、应用服务没有死51Testing软件测试网$z d(h1L |-]"k!AT
(应用服务参数设置问题)51Testing软件测试网SF"g yxK
例:在许多客户端连接Weblogic应用服务器被拒绝,而在服务器端没有错误显示,则有可能是Weblogic中的server元素的AcceptBacklog属性值设得过低。如果连接时收到connection refused消息,说明应提高该值,每次增加25%51Testing软件测试网zu d2|!C Z"a;Q
•C、数据库的连接
/UP8x!xk s0 (1、在应用服务的性能参数可能太小了2、数据库启动的最大连接数(跟硬件的内存有关))
9jms&j5`"AxI-I051Testing软件测试网ZPA'm$SD
2 Error: Page download timeout (120 seconds) has expired51Testing软件测试网M8U bSK8B
uGi ?j.i|0分析:可能是以下原因造成51Testing软件测试网 |!VU:V0YKS_
•A、应用服务参数设置太大导致服务器的瓶颈
&_${ Tb4~0•B、页面中图片太多51Testing软件测试网$w/e;pr? T
•C、在程序处理表的时候检查字段太大多51Testing软件测试网x pXq4}BPF3`
)i,S.T_ }Vn5m1IeK&t0二.监控指标数据分析
n S-m.yp[01.最大并发用户数:
d;v3L'NQb.NDW`2Y1m*k0应用系统在当前环境(硬件环境、网络环境、软件环境(参数配置))下能承受的最大并发用户数。
1T SH2v AJ0在方案运行中,如果出现了大于3个用户的业务操作失败,或出现了服务器shutdown的情况,则说明在当前环境下,系统承受不了当前并发用户的负载压力,那么最大并发用户数就是前一个没有出现这种现象的并发用户数。51Testing软件测试网f{ h%UT)U9gR
如果测得的最大并发用户数到达了性能要求,且各服务器资源情况良好,业务操作响应时间也达到了用户要求,那么OK。否则,再根据各服务器的资源情况和业务操作响应时间进一步分析原因所在。
S pfRz&Z#oXa051Testing软件测试网,\ Y]` P i;Dl!sUO
2.业务操作响应时间:51Testing软件测试网7j d3c Fz
•分析方案运行情况应从平均事务响应时间图和事务性能摘要图开始。使用“事务性能摘要”图,可以确定在方案执行期间响应时间过长的事务。51Testing软件测试网|0u2dV6q
•细分事务并分析每个页面组件的性能。查看过长的事务响应时间是由哪些页面组件引起的?问题是否与网络或服务器有关?51Testing软件测试网$H:l+~4~0U;Eq(S&Q%~
•如果服务器耗时过长,请使用相应的服务器图确定有问题的服务器度量并查明服务器性能下降的原因。如果网络耗时过长,请使用“网络监视器”图确定导致性能瓶颈的网络问题
0i(v8~5R+s.M:fh ZUI03.服务器资源监控指标:51Testing软件测试网 @l ON_:h
内存:51Testing软件测试网I5ol(~oHz
1 UNIX资源监控中指标内存页交换速率(Paging rate),如果该值偶尔走高,表明当时有线程竞争内存。如果持续很高,则内存可能是瓶颈。也可能是内存访问命中率低。51Testing软件测试网#kd3l"tK3Br{:Kj
51Testing软件测试网 eY2y2a8V5mx!m
2 Windows资源监控中,如果Process\Private Bytes计数器和Process\Working Set计数器的值在长时间内持续升高,同时Memory\Available bytes计数器的值持续降低,则很可能存在内存泄漏。
2C;V"d.N_,s$FH051Testing软件测试网P%rN/ft
内存资源成为系统性能的瓶颈的征兆:51Testing软件测试网&HZ.zrq^*U
很高的换页率(high pageout rate);
FH+Jkjg(r0 进程进入不活动状态;
GjX1]2pp.{Sst.V0 交换区所有磁盘的活动次数可高;51Testing软件测试网oC|~a+iS1P2\#@
可高的全局系统CPU利用率;
7U$?hd+e0 内存不够出错(out of memory errors)51Testing软件测试网h8_$JiQX
M4Be\7WV hZ3j%QX0处理器:51Testing软件测试网th{:E'{LmC-k O
1 UNIX资源监控(Windows操作系统同理)中指标CPU占用率(CPU utilization),如果该值持续超过95%,表明瓶颈是CPU。可以考虑增加一个处理器或换一个更快的处理器。如果服务器专用于SQL Server,可接受的最大上限是80-85%
Wz%s@+n#i0 合理使用的范围在60%至70%。
&\T/o}$vx0 2 Windows资源监控中,如果System\Processor Queue Length大于2,而处理器利用率(Processor Time)一直很低,则存在着处理器阻塞。51Testing软件测试网I$H{1d1W*Csl$Cd1[
51Testing软件测试网+l:K,^9QI
CPU资源成为系统性能的瓶颈的征兆: 51Testing软件测试网 rCN#n:q_ @:^
很慢的响应时间(slow response time)
M Wn ^d)d)J,S0 CPU空闲时间为零(zero percent idle CPU)
't+Y!B W:}0 过高的用户占用CPU时间(high percent user CPU)
JLGIbW$L^0 过高的系统占用CPU时间(high percent system CPU)
#M~4[3r#CR9C0 长时间的有很长的运行进程队列(large run queue size sustained over time)
A%CjLrp051Testing软件测试网6Rt!X9_%wE3r
磁盘I/O:
7De+?n ^s0 1 UNIX资源监控(Windows操作系统同理)中指标磁盘交换率(Disk rate),如果该参数值一直很高,表明I/O有问题。可考虑更换更快的硬盘系统。51Testing软件测试网7fbX_1{k(L.A
2 Windows资源监控中,如果Disk Time和Avg.Disk Queue Length的值很高,而Page Reads/sec页面读取操作速率很低,则可能存在磁盘瓶径。51Testing软件测试网q@/zNp5R
51Testing软件测试网I^[2VP a
I/O资源成为系统性能的瓶颈的征兆:
sN*D4w2V m@#E0 过高的磁盘利用率(high disk utilization)
)`%XJ'Gh7H7U#gr6Q c3{0 太长的磁盘等待队列(large disk queue length)
\Q;Edz Z.NO0 等待磁盘I/O的时间所占的百分率太高(large percentage of time waiting for disk I/O)51Testing软件测试网&G cZaI!Fmz
太高的物理I/O速率:large physical I/O rate(not sufficient in itself)
H$?r-dD4{O2c~0 过低的缓存命中率(low buffer cache hit ratio(not sufficient in itself))51Testing软件测试网6S;G d?P7y#?
太长的运行进程队列,但CPU却空闲(large run queue with idle CPU)51Testing软件测试网;@ a*[g4PE7S3xG
51Testing软件测试网F-|;yV:Y$O%U
4.数据库服务器:
6x4I%n#L4a-e%b0SQL Server数据库:51Testing软件测试网5U3R0B|ltq
1 SQLServer资源监控中指标缓存点击率(Cache Hit Ratio),该值越高越好。如果持续低于80%,应考虑增加内存。51Testing软件测试网@ @K'E Be7Z/II
2如果Full Scans/sec(全表扫描/秒)计数器显示的值比1或2高,则应分析你的查询以确定是否确实需要全表扫描,以及SQL查询是否可以被优化。51Testing软件测试网1Ii+A? O0o
3 Number of Deadlocks/sec(死锁的数量/秒):死锁对应用程序的可伸缩性非常有害,并且会导致恶劣的用户体验。该计数器的值必须为0。51Testing软件测试网 hN)Q\\U
4 Lock Requests/sec(锁请求/秒),通过优化查询来减少读取次数,可以减少该计数器的值。
#zc8v.y3@%c|9}0
z?S.N-m&Y'O6Gx:h0Oracle数据库:
Be1o U%KY'J0 1如果自由内存接近于0而且库快存或数据字典快存的命中率小于0.90,那么需要增加SHARED_POOL_SIZE的大小。51Testing软件测试网4Wg6y%V5wV
快存(共享SQL区)和数据字典快存的命中率:
A5zzDu!B @4u`0 select(sum(pins-reloads))/sum(pins) from v$librarycache;51Testing软件测试网 A0`:f mft
select(sum(gets-getmisses))/sum(gets) from v$rowcache;51Testing软件测试网|6b(M&sX
自由内存: select * from v$sgastat where name=’free memory’;51Testing软件测试网 x-J x M1h~Y9~(XA$u
2如果数据的缓存命中率小于0.90,那么需要加大DB_BLOCK_BUFFERS参数的值(单位:块)。
XXF!YE0 缓冲区高速缓存命中率:
c0],R(^KU0 select name,value from v$sysstat where name in ('db block gets’,51Testing软件测试网(^+w}8kh9Bx z
'consistent gets','physical reads') ;
l;a!R3z:|UH:id ^0
.TJo hm\0 Hit Ratio = 1-(physical reads / ( db block gets + consistent gets))
i!a1S"{R03如果日志缓冲区申请的值较大,则应加大LOG_BUFFER参数的值。51Testing软件测试网O#i*D4u[a6vM1A
日志缓冲区的申请情况:
3H4V S,Bo'\5P0 select name,value from v$sysstat where name = 'redo log space requests' ;51Testing软件测试网yXe)Q"ZE0q+Jt
4如果内存排序命中率小于0.95,则应加大SORT_AREA_SIZE以避免磁盘排序。
p1uC[IM6Izn0 内存排序命中率:
.pc$s L5t0分析原则:
8vp[5e@N6]"j0 •具体问题具体分析(这是由于不同的应用系统,不同的测试目的,不同的性能关注点)51Testing软件测试网"R.Z#dD,RC(p+b%tN)L
•查找瓶颈时按以下顺序,由易到难。
f5} SF z4K!D3kof;H0 服务器硬件瓶颈-〉网络瓶颈(对局域网,可以不考虑)-〉服务器操作系统瓶颈(参数配置)-〉中间件瓶颈(参数配置,数据库,web服务器等)-〉应用瓶颈(SQL语句、数据库设计、业务逻辑、算法等)
@7Ii!g1Lg(P0 注:以上过程并不是每个分析中都需要的,要根据测试目的和要求来确定分析的深度。对一些要求低的,我们分析到应用系统在将来大的负载压力(并发用户数、数据量)下,系统的硬件瓶颈在哪儿就够了。51Testing软件测试网m'u3@yTc Gw
•分段排除法很有效
}C*f,Xg_j0
-i6|7Ey&e0c6y;aV0分析的信息来源:
E0h-s#d6A:n[Ow0 •1根据场景运行过程中的错误提示信息51Testing软件测试网-Ej(Ur3tS
•2根据测试结果收集到的监控指标数据
&RO:q6oX0
[oEJlff0一.错误提示分析
?+@.[yv h5ar-Sc0分析实例:51Testing软件测试网VDAg1?9R
1 •Error: Failed to connect to server "10.10.10.30:8080": [10060] Connection51Testing软件测试网rv-_#tv5|#y%bi:[a
•Error: timed out Error: Server "10.10.10.30" has shut down the connection prematurely
$~y K~6uK{N0
&[:T4c$mPf0 分析:51Testing软件测试网6V [7wvGzTu
•A、应用服务死掉。51Testing软件测试网)EA/?;L5Twaa
(小用户时:程序上的问题。程序上处理数据库的问题)51Testing软件测试网8m%q?;tr
•B、应用服务没有死51Testing软件测试网$z d(h1L |-]"k!AT
(应用服务参数设置问题)51Testing软件测试网SF"g yxK
例:在许多客户端连接Weblogic应用服务器被拒绝,而在服务器端没有错误显示,则有可能是Weblogic中的server元素的AcceptBacklog属性值设得过低。如果连接时收到connection refused消息,说明应提高该值,每次增加25%51Testing软件测试网zu d2|!C Z"a;Q
•C、数据库的连接
/UP8x!xk s0 (1、在应用服务的性能参数可能太小了2、数据库启动的最大连接数(跟硬件的内存有关))
9jms&j5`"AxI-I051Testing软件测试网ZPA'm$SD
2 Error: Page download timeout (120 seconds) has expired51Testing软件测试网M8U bSK8B
uGi ?j.i|0分析:可能是以下原因造成51Testing软件测试网 |!VU:V0YKS_
•A、应用服务参数设置太大导致服务器的瓶颈
&_${ Tb4~0•B、页面中图片太多51Testing软件测试网$w/e;pr? T
•C、在程序处理表的时候检查字段太大多51Testing软件测试网x pXq4}BPF3`
)i,S.T_ }Vn5m1IeK&t0二.监控指标数据分析
n S-m.yp[01.最大并发用户数:
d;v3L'NQb.NDW`2Y1m*k0应用系统在当前环境(硬件环境、网络环境、软件环境(参数配置))下能承受的最大并发用户数。
1T SH2v AJ0在方案运行中,如果出现了大于3个用户的业务操作失败,或出现了服务器shutdown的情况,则说明在当前环境下,系统承受不了当前并发用户的负载压力,那么最大并发用户数就是前一个没有出现这种现象的并发用户数。51Testing软件测试网f{ h%UT)U9gR
如果测得的最大并发用户数到达了性能要求,且各服务器资源情况良好,业务操作响应时间也达到了用户要求,那么OK。否则,再根据各服务器的资源情况和业务操作响应时间进一步分析原因所在。
S pfRz&Z#oXa051Testing软件测试网,\ Y]` P i;Dl!sUO
2.业务操作响应时间:51Testing软件测试网7j d3c Fz
•分析方案运行情况应从平均事务响应时间图和事务性能摘要图开始。使用“事务性能摘要”图,可以确定在方案执行期间响应时间过长的事务。51Testing软件测试网|0u2dV6q
•细分事务并分析每个页面组件的性能。查看过长的事务响应时间是由哪些页面组件引起的?问题是否与网络或服务器有关?51Testing软件测试网$H:l+~4~0U;Eq(S&Q%~
•如果服务器耗时过长,请使用相应的服务器图确定有问题的服务器度量并查明服务器性能下降的原因。如果网络耗时过长,请使用“网络监视器”图确定导致性能瓶颈的网络问题
0i(v8~5R+s.M:fh ZUI03.服务器资源监控指标:51Testing软件测试网 @l ON_:h
内存:51Testing软件测试网I5ol(~oHz
1 UNIX资源监控中指标内存页交换速率(Paging rate),如果该值偶尔走高,表明当时有线程竞争内存。如果持续很高,则内存可能是瓶颈。也可能是内存访问命中率低。51Testing软件测试网#kd3l"tK3Br{:Kj
51Testing软件测试网 eY2y2a8V5mx!m
2 Windows资源监控中,如果Process\Private Bytes计数器和Process\Working Set计数器的值在长时间内持续升高,同时Memory\Available bytes计数器的值持续降低,则很可能存在内存泄漏。
2C;V"d.N_,s$FH051Testing软件测试网P%rN/ft
内存资源成为系统性能的瓶颈的征兆:51Testing软件测试网&HZ.zrq^*U
很高的换页率(high pageout rate);
FH+Jkjg(r0 进程进入不活动状态;
GjX1]2pp.{Sst.V0 交换区所有磁盘的活动次数可高;51Testing软件测试网oC|~a+iS1P2\#@
可高的全局系统CPU利用率;
7U$?hd+e0 内存不够出错(out of memory errors)51Testing软件测试网h8_$JiQX
M4Be\7WV hZ3j%QX0处理器:51Testing软件测试网th{:E'{LmC-k O
1 UNIX资源监控(Windows操作系统同理)中指标CPU占用率(CPU utilization),如果该值持续超过95%,表明瓶颈是CPU。可以考虑增加一个处理器或换一个更快的处理器。如果服务器专用于SQL Server,可接受的最大上限是80-85%
Wz%s@+n#i0 合理使用的范围在60%至70%。
&\T/o}$vx0 2 Windows资源监控中,如果System\Processor Queue Length大于2,而处理器利用率(Processor Time)一直很低,则存在着处理器阻塞。51Testing软件测试网I$H{1d1W*Csl$Cd1[
51Testing软件测试网+l:K,^9QI
CPU资源成为系统性能的瓶颈的征兆: 51Testing软件测试网 rCN#n:q_ @:^
很慢的响应时间(slow response time)
M Wn ^d)d)J,S0 CPU空闲时间为零(zero percent idle CPU)
't+Y!B W:}0 过高的用户占用CPU时间(high percent user CPU)
JLGIbW$L^0 过高的系统占用CPU时间(high percent system CPU)
#M~4[3r#CR9C0 长时间的有很长的运行进程队列(large run queue size sustained over time)
A%CjLrp051Testing软件测试网6Rt!X9_%wE3r
磁盘I/O:
7De+?n ^s0 1 UNIX资源监控(Windows操作系统同理)中指标磁盘交换率(Disk rate),如果该参数值一直很高,表明I/O有问题。可考虑更换更快的硬盘系统。51Testing软件测试网7fbX_1{k(L.A
2 Windows资源监控中,如果Disk Time和Avg.Disk Queue Length的值很高,而Page Reads/sec页面读取操作速率很低,则可能存在磁盘瓶径。51Testing软件测试网q@/zNp5R
51Testing软件测试网I^[2VP a
I/O资源成为系统性能的瓶颈的征兆:
sN*D4w2V m@#E0 过高的磁盘利用率(high disk utilization)
)`%XJ'Gh7H7U#gr6Q c3{0 太长的磁盘等待队列(large disk queue length)
\Q;Edz Z.NO0 等待磁盘I/O的时间所占的百分率太高(large percentage of time waiting for disk I/O)51Testing软件测试网&G cZaI!Fmz
太高的物理I/O速率:large physical I/O rate(not sufficient in itself)
H$?r-dD4{O2c~0 过低的缓存命中率(low buffer cache hit ratio(not sufficient in itself))51Testing软件测试网6S;G d?P7y#?
太长的运行进程队列,但CPU却空闲(large run queue with idle CPU)51Testing软件测试网;@ a*[g4PE7S3xG
51Testing软件测试网F-|;yV:Y$O%U
4.数据库服务器:
6x4I%n#L4a-e%b0SQL Server数据库:51Testing软件测试网5U3R0B|ltq
1 SQLServer资源监控中指标缓存点击率(Cache Hit Ratio),该值越高越好。如果持续低于80%,应考虑增加内存。51Testing软件测试网@ @K'E Be7Z/II
2如果Full Scans/sec(全表扫描/秒)计数器显示的值比1或2高,则应分析你的查询以确定是否确实需要全表扫描,以及SQL查询是否可以被优化。51Testing软件测试网1Ii+A? O0o
3 Number of Deadlocks/sec(死锁的数量/秒):死锁对应用程序的可伸缩性非常有害,并且会导致恶劣的用户体验。该计数器的值必须为0。51Testing软件测试网 hN)Q\\U
4 Lock Requests/sec(锁请求/秒),通过优化查询来减少读取次数,可以减少该计数器的值。
#zc8v.y3@%c|9}0
z?S.N-m&Y'O6Gx:h0Oracle数据库:
Be1o U%KY'J0 1如果自由内存接近于0而且库快存或数据字典快存的命中率小于0.90,那么需要增加SHARED_POOL_SIZE的大小。51Testing软件测试网4Wg6y%V5wV
快存(共享SQL区)和数据字典快存的命中率:
A5zzDu!B @4u`0 select(sum(pins-reloads))/sum(pins) from v$librarycache;51Testing软件测试网 A0`:f mft
select(sum(gets-getmisses))/sum(gets) from v$rowcache;51Testing软件测试网|6b(M&sX
自由内存: select * from v$sgastat where name=’free memory’;51Testing软件测试网 x-J x M1h~Y9~(XA$u
2如果数据的缓存命中率小于0.90,那么需要加大DB_BLOCK_BUFFERS参数的值(单位:块)。
XXF!YE0 缓冲区高速缓存命中率:
c0],R(^KU0 select name,value from v$sysstat where name in ('db block gets’,51Testing软件测试网(^+w}8kh9Bx z
'consistent gets','physical reads') ;
l;a!R3z:|UH:id ^0
.TJo hm\0 Hit Ratio = 1-(physical reads / ( db block gets + consistent gets))
i!a1S"{R03如果日志缓冲区申请的值较大,则应加大LOG_BUFFER参数的值。51Testing软件测试网O#i*D4u[a6vM1A
日志缓冲区的申请情况:
3H4V S,Bo'\5P0 select name,value from v$sysstat where name = 'redo log space requests' ;51Testing软件测试网yXe)Q"ZE0q+Jt
4如果内存排序命中率小于0.95,则应加大SORT_AREA_SIZE以避免磁盘排序。
p1uC[IM6Izn0 内存排序命中率: