北京时间6月12日消息,据国外媒体报道,Twitter对上周发生的多次大规模宕机事件做出解释称技术团队犯下了三大失误,并同时给出了补救措施。
2009年夏季时,Twitter曾宕机事件频发,而今年夏季事故再现,是因为Twitter增长速度非常之快。Twitter技术团队仅仅是处理数据吞吐量就遇上了不小的挑战。Twitter工程师让-保罗·柯扎提(Jean-Paul Cozzatti)表示,上周Twitter之所以出现严重故障,是因为其技术团队的三个重大失误:
-- 技术团队把两个非常重要、快速增长且高带宽需求的组件放在同一个Twitter内部网络中。
-- 没有人对网络加以监测以确保正常运行。
-- 内部网络设置失误。
柯扎提表示,为了避免类似的错误再现,他将列出Twitter改进方案以解决问题所在。他提到,Twitter已经将内部网络扩容一倍,加强对内部网络的监测,同时对流量负载均衡加以改进。
他在一篇博客里表示:“2009年的大部分时间里,我们都面临着史无前例的增长带来的挑战,但这周的事故表明,永远都有改进的余地。本周经历过这样的事情后,我们现在正与服务器托管方通力合作,改善上面提到的三大问题。像监控Twitter其它系统一样监测内部网络。我们能够扩容以赶上用户的增长速度。”
相关阅读: