周一晚 22:00 开始常州机房重装网易相册62台服务器,相册服务停;
周二凌晨 4:00 开始部署服务器基本系统,重建盘阵服务器的挂载表,晚 20:00 开始部署应用,dfs, php, upload, control, ... 趁机写了大量有创意的配置文件;
周三早晨开发人员调试应用,我们管理员调整配置文件,至晚间 20:00 左右已经把所有功能调通。由于控制服务器无法挂载所有NFS,突发奇想用 Apache 根据请求中的用户id分拆请求到17台页面服务器;主数据库经过 jabber 多天的努力也准备好了。
周四上午醒来以后开始做域名变更和切换测试数据库到主数据库,中午时分相册开通,然后开始调试大量重负载下的新问题,NFS带来的问题始终无法彻底解决。下午抽空去火车站买了周六出发的火车票。晚上首次回家睡觉,但是决定用 Samba 代替 NFS 试试,说服 CG 继续开放上传之后,开始实际操作,至周五凌晨 4:00 才睡。
周五下午醒来以后到公司,发现 Samba 令上传有所好转但仍然没能完全解决问题,再把 PHP 服务器的索引从 NFS 换成 Samba 以后不久,可能是一台索引服务器故障,导致 PHP 服务器全部挂起,相册瘫痪,联系常州机房人员重启了 30 多台相关服务器以后一度恢复正常,于是我回家收拾行李准备回老家过年。但 1 小时后服务器又全部挂掉,找不到明确原因。不得不深夜在回到公司和 kghost 会诊。
周六零点以后在和 CG 讨论相册形势时突发奇想用上传服务器兼做页面服务器,理由是对系统资源的使用互相不冲突,同时关闭控制服务器的图片删除和移动功能,重配 LVS 和 DNS 指向这些新页面服务器。目前状态良好但不一定过得去下一个白天。
本周共上班五天,回家两次,其中一次在家睡觉。问题是相册仍然生死未卜。
评论