简单说说THP——记一次数据库服务器阻塞的问题解决

上一篇 / 下一篇  2016-04-26 15:58:51 / 个人分类:性能诊断调优

背景:
W6MCN4{JU0公司某个大型业务系统反馈最近数据库服务器总是宕机(此处描述不准确,后面解释),最后,客户、运维人员都觉得实在是忍无可忍了,项目经理打电话找到我问是否能帮忙诊断一下,刚好第二天要去现场沟通另外一个系统的测试需求,于是答应第二天顺便看一下。51Testing软件测试网p1O Z V]6P
------------------------------------
&aP xpd"r#xf051Testing软件测试网T'T7e1D"Kx\6N,B
排查解决过程:
?]`u3l.{0B}tq.d{0第二天来到现场,正在沟通需求的时候,运维人员突然说,操作又开始卡了,
e,K5e W R^$J6[&wH"a0于是连上服务器,先用top大概看了一下资源的使用情况,此时CPU已经基本上满载了,而且可以发现用户态的CPU占比并不高,大部分时间竟然都是内核态的CPU占用,51Testing软件测试网6Uj6l^;l(B3M^

T M@ N+r0当时我开始怀疑可能是数据库服务对底层的某个调用出了问题,有死循环?51Testing软件测试网5P(HMo%T*YhY3M6J.S]
于是立刻用perf top大概看了一下,51Testing软件测试网$U Ho#d2e?
51Testing软件测试网q_6VhJ1X4F {w
发现比重较大的是自旋锁还有一个compaction_alloc,内存碎片整理?
[ r%yarh6Jg:G0从该信息判断,可能是内存的什么操作导致了很多线程在临界区各种等待。51Testing软件测试网J,?6Ci7AE+F
为了进一步弄明白具体是什么操作导致,于是对内核参数的调用栈进行取样51Testing软件测试网zRy-n:uk
perf record -a -g -F 1000 sleep 60
kL{!Jq0“-g'的意思是按照调用关系存储数据;“-F 1000 sleep 60”表示按照每秒取1000个样本的频率取一分钟。51Testing软件测试网"e \W1KsTK/x{j
取完样后,使用perf report -g打开取样的数据,可以看到如下的调用栈:
$[2\']6H Y;M051Testing软件测试网 j.V,? nN-W
很明显这个自旋锁是由内存页的碎片整理导致,而进行碎片整理是由hugepage导致的,
N'o7W;IKm$y0看到这里的时候,我突然想起来linux的一个THP特性,貌似是kelnel 2.6.38版本后开始加进来的,
(]4gP8R K j+r0这个特性实际上就是会把这种巨页的使用对用户透明,用户不需要再进行巨页的配置,51Testing软件测试网D?QUEA.b,PQ
内存会自动将连续的512个普通页作为一个巨页处理,
.Q[:Q8Z"JO0正如我们在前面的调用栈看到的,这种特性就需要对内存碎片进行整理,51Testing软件测试网Et1h.K/q"M0L5Gp
所以我们看到的现象是内存碎片页移动导致的自旋锁,而根本原因是THP特性所导致的。51Testing软件测试网&p UT i `
知道了问题原因,解决也就容易了,只要把THP关闭就可以了。
0R n @N"AEM }`)}0关闭的方法如下:51Testing软件测试网2]y]shc7{&U
vi /etc/rc.local
1Ll4io{ol7V&?0在文件末尾添加如下指令:
1If|%Krb I0if test -f /sys/kernel/mm/redhat_transparent_hugepage/enabled; then51Testing软件测试网q4?1t&PM0P1@
   echo never > /sys/kernel/mm/redhat_transparent_hugepage/enabled
3Iv$Y3tm O!\(e0fi
(g)Sx }`\'M-E0if test -f /sys/kernel/mm/redhat_transparent_hugepage/defrag; then
%Gh9pYuk0   echo never > /sys/kernel/mm/redhat_transparent_hugepage/defrag51Testing软件测试网%M$s F$Pw]N
fi51Testing软件测试网h8} Xl'OD6zd$_

6I`0@K2Q!@(q0保存后,重启即可。51Testing软件测试网Jt5R7wX X\.mU
PS:此处不同版本的linux路径会有些区别,自己看好了51Testing软件测试网Iu0y!i`[

r"hIT9G0P"Y4p0vi /sys/kernel/mm/redhat_transparent_hugepage/enabled
J9}b J3rDn,x0如果显示如下:51Testing软件测试网4yqG4S"e(~UG
51Testing软件测试网Q.Ny*GHE
即为关闭THP生效。51Testing软件测试网p/qj'~k_I(f
51Testing软件测试网 q;Lq!M\[
其实这样做完还不算完全解决问题,就如我们前面说的,
R(_n-u6a6U1gG0THP的引入是为了减少维护人员配置巨页的工作,我们把THP特性关掉了,
6]{Zt4^w-NM0最好的实践是我们应该再根据我们数据库服务需要的共享内存大小进行hugepage的配置。
T G|,Kc4f/V{y0毕竟在现在动辄几十G,甚至上百G的内存,如果在按照4K普通页大小去维护TLB,也是一个很大的开销。
g+|!_1`P0这里hugepage的配置,因为数据库不同,甚至数据库版本不同,配置过程也不大相同,最重要的一点,我发现这篇日志写的有点太长了。51Testing软件测试网m&q%~%U0h!^sY(E
因此,这里就不展开赘述了,有时间可以开帖讲一讲。
S pD1Ejc0-----------------------------------------------51Testing软件测试网"x;soc&G@:{

U2zS2o} ]B0解决效果:51Testing软件测试网#u5B,MY-UfQ\#jp6Q
在进行如上两步处理后,连续观察了几天,果然再没有所谓的“宕机”事件了。51Testing软件测试网;e\$C OI8?:]
这里“宕机”用了引号,对应最前面反馈问题时项目经理所说的服务器宕机描述,其实这个描述本身就是错误的,明天我准备再针对这个详细解释一下:如何正确的提问。

TAG: 数据库 hugepage Top top 宕机 调优

 

评分:0

我来说两句

日历

« 2024-03-20  
     12
3456789
10111213141516
17181920212223
24252627282930
31      

数据统计

  • 访问量: 30921
  • 日志数: 27
  • 建立时间: 2016-04-25
  • 更新时间: 2016-05-10

RSS订阅

Open Toolbar