Linux下的一些I/O统计工具-1

上一篇 / 下一篇  2012-08-29 09:43:20 / 个人分类:Linux

51Testing软件测试网#jP(u*^p]

  作为一个Linux系统管理员,统计各类IO是一项必不可少的工作。其统计工具中iostat显然又是最重要的一个统计手段。但是这里iostat不是本文的重点,因为这个工具的使用在网络上已经有大量的教程,可以供大家参考。这里主要是想介绍一些其他统计工具以来满足不同的需求。51Testing软件测试网IB|5sA1ALK#io

51Testing软件测试网u-T n%Sw`

  iostat

WQ1Qr"ct)W0z\051Testing软件测试网^Ow9~\O zppV

  iostat的功能异常强大,输出项也特别多,比如下面这个例子:51Testing软件测试网!td Z)R,LLI-G-d

  1. Device: rrqm/s  wrqm/s  r/s     w/s    rkB/s    wkB/s    avgrq-sz avgqu-sz   await r_await w_await  svctm  %util  

  2. `9U EN ng:c0
  3. sda     0.00     0.50  173.50   73.50  3076.00   604.00    29.80   149.93    676.58   74.36 2098.15  4.05 100.00
51Testing软件测试网5OqH3Q?$]P3P

  其各项的含义分别是:51Testing软件测试网f(x~ paO;h

51Testing软件测试网ke p)i4O,_

  ●rrqm/s:每秒进行merge的读操作数目。即delta(rmerge)/s

S/k:['\O]+{!T0

1Q ap/PJG}#f4jX0  ●wrqm/s:每秒进行merge的写操作数目。即delta(wmerge)/s

O Xw jl7uKJ1g051Testing软件测试网%K"d![1? K^2]-}~ t;[

  ●r/s:每秒完成的读I/O设备次数。即delta(rio)/s

`B)V"l6K051Testing软件测试网Z~uYb H)?

  ●w/s:每秒完成的写I/O设备次数。即delta(wio)/s

/n'^ [xfY%a051Testing软件测试网,MQg){.xm

  ●rsec/s:每秒读扇区数。即delta(rsect)/s

uI4T8{YhkNos051Testing软件测试网&W#}Y |:h3O`

  ●wsec/s:每秒写扇区数。即delta(wsect)/s

)Lc d)v@ nV4rgd0

Kf_,FIMh0  ●rkB/s:每秒读K字节数。是rsect/s的一半,因为每扇区大小为512字节。(需要计算)51Testing软件测试网p@2E"_L q OPO G

51Testing软件测试网7?"I+LM"F;PUA.M4w

  ●wkB/s:每秒写K字节数。是wsect/s的一半。(需要计算)

pldshl051Testing软件测试网$nJ_U9W5s#D'A

  ●avgrq-sz:平均每次设备I/O操作的数据大小(扇区)。delta(rsect+wsect)/delta(rio+wio)51Testing软件测试网9TM7HS,VQ#AZ3\*T

51Testing软件测试网4O%m{!D7i@

  ●avgqu-sz:平均I/O队列长度。即delta(aveq)/s/1000(因为aveq的单位为毫秒)。

k/jJt1B qyi051Testing软件测试网)QHtry)]z

  ●await:平均每次设备I/O操作的等待时间(毫秒)。即delta(ruse+wuse)/delta(rio+wio)51Testing软件测试网5P2l&xW Tl f

H0o:` CP;k0  ●svctm:平均每次设备I/O操作的服务时间(毫秒)。即delta(use)/delta(rio+wio)

8QIs:C#G&z4D:W0

S*E${.dju7lA| _0  ●%util:一秒中有百分之多少的时间用于I/O操作,或者说一秒中有多少时间I/O队列是非空的。即delta(use)/s/1000(因为use的单位为毫秒)

!H o|LW| S0

6kgdYB-~5B4c0  如果 %util 接近 100%,说明产生的I/O请求太多,I/O系统已经满负荷,该磁盘可能存在瓶颈。51Testing软件测试网"w!L jb|y"] vt

9OZ&FHsd8zG0  idle小于70% IO压力就较大了,一般读取速度有较多的wait。

dd-i&L5~"B eg0

s]f:J/K ]6D,v&^ F0  同时可以结合vmstat查看查看b参数(等待资源的进程数)和wa参数(IO等待所占用的CPU时间的百分比,高过30%时IO压力高)

O1LU\3S[#B0

pl%i:VKUi0  另外 await 的参数也要多和 svctm 来参考。差的过高就一定有 IO 的问题。51Testing软件测试网,?qd$~'id |z@

+FY U_;_1E[X|]0   avgqu-sz 也是个做 IO 调优时需要注意的地方,这个就是直接每次操作的数据的大小,如果次数多,但数据拿的小的话,其实 IO 也会很小。如果数据拿的大,才IO 的数据会高。也可以通过 avgqu-sz ×( r/s or w/s ) = rsec/s or wsec/s。也就是讲,读定速度是这个来决定的。

9p4^O.i[ a_``+h0

7F&TZuV r(A0  svctm 一般要小于 await (因为同时等待的请求的等待时间被重复计算了),svctm 的大小一般和磁盘性能有关,CPU/内存的负荷也会对其有影响,请求过多也会间接导致 svctm 的增加。await 的大小一般取决于服务时间(svctm) 以及 I/O 队列的长度和 I/O 请求的发出模式。如果 svctm 比较接近 await,说明 I/O 几乎没有等待时间;如果 await 远大于 svctm,说明 I/O 队列太长,应用得到的响应时间变慢,如果响应时间超过了用户可以容许的范围,这时可以考虑更换更快的磁盘,调整内核 elevator 算法,优化应用,或者升级 CPU。51Testing软件测试网J)|6I(|plT

8]$j(|!b^TO0  队列长度(avgqu-sz)也可作为衡量系统 I/O 负荷的指标,但由于 avgqu-sz 是按照单位时间的平均值,所以不能反映瞬间的 I/O 洪水。51Testing软件测试网 T%Z {M.iwt0K

51Testing软件测试网7`(Y6Y([t)\

  有时间的话,我会单独写几个帖子来说说iostat。51Testing软件测试网"Y+QOl2R#rB9AO

1j1L9y){n,a3d0  iodump51Testing软件测试网{puO-H0Xs%K

@$W2l"E w w k0  iodump 是一个统计每一个进程(线程)所消耗的磁盘I/O工具。这个一个perl脚本,其原理时打开有关I/O的内核记录消息开关,而后读取消息然后分析输出。简单使用步骤如下:51Testing软件测试网$n w'RuF;~I @

&A)?W9MM0  首先下载这个工具:

F t!iV$[&B051Testing软件测试网W1},@w `US

  wget http://aspersa.googlecode.com/svn/trunk/iodump

V7`-Vj9hiN:[0

l$j2H l8Z0kjbm0  然后打开有关I/O内核消息的开关:

B(LD#U#w/t8l#C)t!WO n0

+a1d ] G6w N#X0  echo 1 >/proc/sys/vm/block_dump51Testing软件测试网 u1GoC&f C E d$I

51Testing软件测试网MJe:m3U!ur

  上述开关打开后,内核会记录下每一个I/O操作的消息。我们只需要定时获取并分析就好了,比如下面这样:51Testing软件测试网Ri(J8q$o"^*[U

.FP+N6Q { G0  while true;do sleep 1;dmesg -c ; done |perl iodump51Testing软件测试网#k6H:BaT m

51Testing软件测试网0erpGn7{&dUd e2MJ

  等待一段时间,然后通过ctrl+c来结束上述脚本,你将获得下面类似的信息:

$jp w7VB0J e051Testing软件测试网UJ(@go+b A

51Testing软件测试网K&|rF$f

  1. TASK                   PID      TOTAL       READ      WRITE      DIRTY DEVICES  
  2. postgres              5799       1919       1919          0          0 sda7  
  3. jbd2/sda7-8           1572         35          0         35          0 sda7  
  4. jbd2/sda2-8            250         32          0         32          0 sda2  
  5. flush-8:0             2229         31          0         31          0 sda2, sda7  
  6. postgres              4308          2          0          2          0 sda7  
  7. bash                  5804          1          0          1          0 sda2
51Testing软件测试网*q[-Ty1?

  上述输出的单位为块(block),每块的大小取决于创建文件系统时指定的块大小。比如我这个里的sda7的block大小是1KB。51Testing软件测试网 V h._~/h

vp } x3]0  iotop

+r,V*r#ng051Testing软件测试网s.`'KH%r M.Y,i2b

  iotop是一个Python编写的工具,有类似top工具的UI,包括一些参数也和top类似。不过它对系统有一些要求,分别是:

*G2B9_9k4Z{e^051Testing软件测试网+u:IE;N&[ c"p

  1、Python ≥ 2.5 or Python ≥ 2.4 with the ctypes module51Testing软件测试网6}m!^ OSZ T

51Testing软件测试网B8Qup`Az X?"~

  2、Kernel ≥ 2.6.2051Testing软件测试网:f&U Q|7@7c"z

!^%q,x%J{)a/z0  3、Kernel uses options:

`2L"J4` c1A|+H051Testing软件测试网6E+^HL/eB7A

    1)TASK_DELAY_ACCT51Testing软件测试网4S T8f)S}?

#a%IJ$Qq}&]*~0    2)CONFIG_TASKSTATS

3B lzR:z0]{/x'i9JK051Testing软件测试网,f*{ZXP0l

    3)TASK_IO_ACCOUNTING51Testing软件测试网&x*T4xz$DY|

3eeQ"C OE3b$W.vg5O0    4)CONFIG_VM_EVENT_COUNTERS

o!Rw?.Z051Testing软件测试网(ih d#B/Y2o

  如果是基于RPM包的系统,可以直接下载编译好的二进制包(here)或者二进制源代码包(here)

USH~9r2Ezn051Testing软件测试网W)U#J7f`eM

  如果是Debian/Ubuntu系统,直接使用

Q,eh F3K0

T!F4?4zM0  sudo apt-get install iotop

*T7L*LqU7aJ2O0

?F^/G5q!Qj6Oi3R0  即可(不得不说,Debian系统提供的软件真的是相当丰富呀),其他系统则可以通过下面的指令下载源代码,然后编译51Testing软件测试网~)Ztj9tT3d

51Testing软件测试网@O,?*m.A*~

  git clone git://repo.or.cz/iotop.git

'| g*nRbINP0

$PrqCZ4Ffq0  具体的使用方法可以参考iotop(8)手册,下面是在我机器上的一个显示:51Testing软件测试网E(vH'l)RE

51Testing软件测试网h.B&G6|"n1c{$Jn

z'u{/`C g0
  1. iotop -o -u wgzhao  
  2. Total DISK READ:       2.15 M/s | Total DISK WRITE:    1601.15 K/s  
  3.   TID  PRIO  USER     DISK READ  DISK WRITE  SWAPIN      IO    COMMAND  
  4.  5984 be/4 wgzhao      2.15 M/s   70.55 K/s  0.00 % 83.67 % postgres: wgzhao pgbench [local] UPDATE  
  5.  4305 be/4 wgzhao      0.00 B/s  227.34 K/s  0.00 %  0.00 % postgres: writer process  
  6.  4308 be/4 wgzhao      0.00 B/s   90.15 K/s  0.00 %  0.00 % postgres: stats collector process

TAG:

 

评分:0

我来说两句

Open Toolbar