在运维管理的过程中,我发现了很多有价值的秘诀,本文是这些秘诀的一个总结。虽然这些秘诀可能比较“唯心”,但是我还是把它们总结出来了,相信它们会对你有帮助的。
Dormando的运维秘诀分成以下三大篇:
1、技术篇
2、交流篇
3、实践篇
实践篇
现在就修复它,而不是以后再修复它
◆如果一个Web服务器处于脱机状态,不要担心,因为你应该有10个备用的!
◆在一周中,专门挑出一天来“清理门户”。更换掉所有存在故障的硬件。在欢度周末之前,确保一切都是完好无损的。
◆如果令人讨厌的小问题突然发生了,在早上要做的第一件事情就是永久性的修复它们。日志塞满磁盘的情况在上周发生了两次?明天再说吧!如果总是这样,这些问题会堆积起来……
◆如果你的构建过程是自动化的,充分利用这个优势来修复一些你可以马上修复的问题,或许也可以批量进行修复。
让每一件事情都自动化
◆人们无法(轻易地)搞乱脚本化的任务。
◆从第二次开始自动化。如果第一次你必须手工来做一件事情,那么把你做的事情写入一个脚本。
◆带注释的脚本是绝佳的文档。与其把如何安装一些东西的方法详细地写到长达20页文档中,还不如编写一个可以自解释的脚本。
◆脚本可以被放到自动化的构建过程中。如果要更接近这个目标,应该把一些经常做的事情都应该变成“零时间”的任务。
只进行必要的变更
◆只做小规模的,独立的变更。
◆如果不是必须改变,那么就保持原样。
◆这也意味着你必须搞清楚什么时候才应该进行变更。找出什么东西是必须要进行变更的,然后对它进行升级,把它拿出来,让它标准化。
Design for change
◆这里的Design for change(编辑注:技术篇的第一条也是Design for change)针对个人的成长。朝快速解决问题大师的方向努力吧。
◆如果快速解决问题比较困难,那么你可以学习一些基础知识,做出一张清晰的升级路线图。虽然你的新邮件系统也许并不是你梦想中的、带有强大反垃圾邮件功能的巨大系统;但是架设两台配置干净的postfix邮件服务器会比你想象中的效果还要好。
◆大家都倾向于把未完成的项目放在那里置之不理。这是你要避免的。
尽快地把更新的内容投入实践
◆一般来说,运维工作就是要让代码更好地运行。并行化,建立起回滚重启机制。
◆运行内容包括软件更新,安全补丁,配置变更。
◆使用puppet,cfengine以及你需要的任何工具对配置进行控制。让它干净,简洁,并且容易操作。
◆文件数量越少越好。如果只是为了推出一个新的数据库就要在20个文件中分别添加一行,那么你的方法一定是错误的。创建简单的模板,不要重复编辑需要手工编辑的数据。