今天早上和大领导沟通完接下来的解决方案之后,顺利解决了客户那边由于服务器断电造成的软件故障,所幸昨天我的失误没有造成生产事故。
今天其实还有一次删除的工作要实施,这次谨记昨天的教训,反复验证完待删除文件已备份之后,才开始进行删除任务。总今往后,删除文件一定要慎之又慎,尤其是生产环境。
在今天实施解决方案的过程中其实还出现了个小插曲,我完成所有步骤之后,重启数据库,发现数据库启动成功了,但客户那边原来有 200 亿条数据的表,现在一条数据都查不到了!
我赶紧去 hdfs 查看数据文件是否还在,确认完之后才安心,最后进一步检查得知,是 zookeeper 服务没启动完成导致的。
虚惊一场吧,为此,大领导还细心教导了一番,应该先检查那里,再检查哪里……(其实他脾气很大,但自己还是蛮开心的)。
谨慎。