HBase运维经验

HBase启动时启不了regionserver。Hmaster进程过几秒后也停止

解决方法

  1. 观察集群误差时间是否在hbase_site.xml的可接受范围。如果超出可接受的误差范围,则会导致整个集群的宕机
  2. 最粗暴的方法,1)删除/tmp, 2)删除各个节点hdfs的data文件夹和name文件夹的内容, 3)删除部署了zookeeper的version文件夹, 4)hadoop namenode -format, 5)重启(顺序:先hadoop,再zookeeper,最后hbase),zookeeper每个节点都要启动,hadoop和hbase都是在主节点启动

HBase启动时启不了regionserver。Hmaster进程一直存在

解决方法

  1. 使用hbase的修复命令: hbase hbck -fix 或者 hbase hbck -repair
  2. 加载协处理器时出现上述情况的解决方法:1)关闭hbase 2)观察hdfs中是否有已经生成的表,若有则删除该生产错误的表,没有则不动 3)使用hbase zkclit命令进去zookeeper ,使用rmr /hbase 删除之前错误的hbase meta信息 4)重启zookpeer 5)重启hbase
Share