|
在实际生成环境中,有遇到多个平台Hbase数据库RegionServers频繁崩溃的问题(几分钟崩溃一次),综合观察后,发现一下共同特点:
1.集群端服务器数量少(2台);
2.集群端服务器配置低(4核8G);
3.hbase所分配的内存少(配置低的情况下默认值很小);
4.但是观察CPU和内存却没有占用满(90%左右)。
综上几个共同点,安排多个测试环境进行模拟测试,做出以下无成本优化:
1.给集群端两台服务器增加4G虚拟内存(swap);
2.调整hbase配置“HBase RegionServer Maximum Memory”为“4G”;
3.调整hbase配置“Number of Handlers per RegionServer”为“50”;
做出以上优化后,Hbase数据库RegionServers频繁崩溃的问题得到很大改善,在不增加上线车辆、不增加服务器配置的情况下,可以勉强正常使用;
经过上述测试观察,记录参考分析出:该问题主要是由于内存不足,服务器总资源虽然没有占用满,但Ambari会预留少部分空闲内存用于其它服务。实际解决方法就是增大内存,应急处理方式可以按照上述处理,生产环境强烈建议增加物理内存。
|
|