携程:网络故障由员工错误操作导致

发表于:2015-5-29 11:25

字体: | 上一篇 | 下一篇 | 我要投稿

 作者:宏达    来源:网易科技

#
漏洞
#
携程
#
黑客
分享:
  5月29日讯 今日凌晨1:30分,携程官方称,经携程技术排查,确认此次事件是由于员工错误操作导致。从5月28日上午11:09,发现携程官网及APP出现故障,到28日23:29全面恢复,整个过程耗费12个多小时。
  另外携程还称,由于携程涉及的业务、应用及服务繁多,验证应用与服务之间的功能是否正常运行,花了较长时间。携程官方网站及APP已于28日23:29全面恢复正常。对用户造成的不便,携程再次深表歉意。
  对于本次事件的排查结果,简要原因说明:
  1、事件发生原因
  经携程技术排查,确认此次事件是由于员工错误操作,删除了生产服务器上的执行代码导致。
  2、为什么恢复时间那么长
  一般来说,类似携程这样的大型网站承载着繁多业务,其后台是一个由SOA(面向服务)架构组成的庞大服务器集群,看似简单的一个页面背后由上千个应用子系统以及上千个Web Service组成,而每个应用子系统和每个Web Service之间都存在着相互调用的依赖关系。
  发生事件后,携程的技术人员除了需要恢复生产服务器上的执行代码以外,还需要做的是恢复并确保每个应用子系统以及每个Web Service的功能正常,同时确保应用子系统与Web Service间的调用关系得以正常执行。
  这种验证性的操作需要携程的工程师及运维人员通力合作,尽快恢复生产代码并通过反复地、持续性地调试以确保应用子系统与Web Service功能的正常运行。
  携程再次保证,数据和数据库并未受到此次事件的影响,用户订单数据也完整无损,请用户放心并继续使用携程网站及App。
  3、如何杜绝此类事件的再次发生?
  携程在系统上做了改进,规范并杜绝技术人员错误删除生产服务器上代码的操作。
精选软件测试好文,快来阅读吧~

精彩评论

  • cathy0048
    2015-5-31 14:26:57

    难道没有svn等代码版本管理工具么?如果连这个都丢失了,那么当即补代码,7小时怎么可能够

关注51Testing

联系我们

快捷面板 站点地图 联系我们 广告服务 关于我们 站长统计 发展历程

法律顾问:上海兰迪律师事务所 项棋律师
版权所有 上海博为峰软件技术股份有限公司 Copyright©51testing.com 2003-2024
投诉及意见反馈:webmaster@51testing.com; 业务联系:service@51testing.com 021-64471599-8017

沪ICP备05003035号

沪公网安备 31010102002173号