问题概述
"新冠期间"远程办公,需要重新搭建一套ClouderaManager(CM)开发环境,一位测试同事发现HBase的RegionServer无法启动,在CM界面上启动总是失败,观察一下日志,也没有什么明显的报错。我就专门看了一下。
排查思路
因为有opentsdb在读写Hbase Region Server,我一开始怀疑RegionServer启动过程中在恢复一些数据,这个时候就有组件对它读写操作,可能压力较大起不来。后来停掉了opentsdb,依然如此,日志也没有明显报错,打着打着就断了,再看进程就没了。
后来我在界面上又重启了一下,迅速
jps -mlv
命令查看一下启动参数,这一看就明白了居然给的堆内存50MB
,难怪起不来,启动过程中应该就OOM
了,很快,再执行一次jps -mlv
命令 这个HRegionServer
进程已经退出了。于是我在网上搜了一下,果然
ClouderaManager(CM)
给HBase默认堆内存50M,豁然开朗。
解决
根据实际情况修改一下HMaster、HRegionServer堆内存大小,在界面上重启,我这次用jps -mlv
命令观察一下,配置生效了,然后看日志,正常启动中,至此,问题解决。