提高系统性能的相关技术

上一篇 / 下一篇  2016-03-30 15:31:19 / 个人分类:性能测试

Web的前端性能:web应用的基础是超文本传输协议(HTTP)和超文本标记语言(HTML),HTTP协议本身是一种面向非连接的协议,HTML是一种用于制作超文本文档资料的简单标记语言。对于一个页面而言,“请求”和“返回数据”都可能是多次发生的,由于HTTP对浏览器下载资源并发请求数量,Cache等方面都进行定义和限制,以及浏览器对于HTML的处理过程,可以说,用户所感受的响应时间中的相当大的一部分取决于web的前端。

   HTTP 是一个属于应用层的面向对象的协议,用于传送WWW方式的数据,采用请求/响应,模型,客户端向服务器发送一个请求,请求头包含请求的方法,URL协议版 本,以及包含请求修饰符,客户信息和内容的类似于HTML的消息结构。服务器①一个状态行座位响应,相应的内容包括消息协议的版本,成功或错误编码加上包 含服务器信息,实体元信息以及可能的实体内容。

   HTML是一种用于制作超文本文档资料的简单标记语言,用HTML编写的超文本文档能够独立于各种操作系统平台。HTML一直被用于描述web页面格式设计,使用HTML语言描述的文件需要通过www浏览器显示效果。

用于查看前端性能工具太多的。

 嵌入浏览器的有 yslow 、page speedhttpwatch

 独立界面的有 fiddler2、charles 、


提高系统性能的相关技术                                                             

网页HTML 静态化

  其实大家都知道网页静态化,效率最高,消耗最小的就是纯静态化的 html 页面,所以我们尽可能使我们的网站上的页面采用静态页面来实现,这个最简单的方法其实也是最有效的方法。

  但是对于大量内容并且频繁更新的网站,我们无法全部手动去挨个实现,于是出现了我们常见的信息发布系统 CMS,像我们 常访问的各个门户站点的新闻频 道,甚至他们的其他频道,都是通过信息发布系统来管理和实现的,信息发布系统可以实现最简单的信息录入自动生成静态页面,还 能具备频道管理,权限管理, 自动抓取等功能,

  对于一个大型网站来说,拥有一套高效,可管理的CMS 是必不可少的,除了门户和信息发布类型的网站,对于交互性要求很 高的社区类型网站来说,尽可能 的静态化也是提高性能的必要手段,将社区内的帖子,文章进行实时的静态化,有更新的时候再重新静态化也是大量使用的策略,像 Mop 的大杂烩就是使用了 这样的策略,网易社区等也是如此同时,html 静态化也是某些缓存策略使用的手段,

  对于系统中频繁使用数据库查 询但是内容更新很小的应用,可以考虑使用 html 静态化来实现,比如论坛中论坛的公用设 置信息,这些信息目前的主流论坛都 可以进行后台管理并且存 储再数据库中,这些信息其实大量被前台程序调用,但是更新频率很小,可以 考虑将这部分内容进 行后台更新的时候进行静态化,这样避免了大量的数据库访问 请求;

图片服务器分离

  对Web 服务器来说,不管是 Apache,IIS 还是其他容器,图片是最消耗资源的,于是我们 有必要将图片与页 面进行分离,这是基本上大型网 站都会采用的策略,他们都有独立的图片服务器,甚至很多台图片服务器,这样的架构可以降低提供页面访问请求的服务器系统压 力,并且可以保证系统不 会因 为图片问题而崩溃,在应用服务器和图片服务器上,可以进行不同的配置优化,比如 apache 在配 置 ContentType 的时候可以尽量少支 持,尽可能少的 LoadModule,保证更高的系统消耗和执行效率;

数据库集群和库表散列 

  大型网站都有复杂的应用,这些应用必须使用数据库,那么在面对大量访问的时候,数据库的瓶颈很快就能显现出来,这时一台数据库将很快无法满足应用,于是我们需要使用数据库集群或者库表散列。

  在数据库集群方面, 很多数据库都有自己的解决方案, Oracle, Sybase 等都有很好的方案,常用的 MySQL 提供的 Master/Slave 也是类似的方案,您使用了什么样的 DB,就参考相应的解决方案来实施即可。

  上面提到的数据库集群由于在架构,成本,扩张性方面都会受到所采用 DB 类型的限制,于是我们需要从应用程序的角度来 考虑改善系统架构,库表散列是 常用并且最有效的解决方案,我们在应用程序中安装 业务和应用或者功能模块将数据库进行分离,不同的模块对应不同的数据库或 者表,再按照一定的策略 对 某个页面或者功能进行更小的数据库散列,比如用户表,按照用户 ID 进行表散列,这样就能够低成本 的提升系统的性能并且有 很好的扩展 性,sohu 的论坛就是采用了这样的架构,将论坛的用户,设置,帖 子等信息进行数据库分离,然后对帖子,用户按照板块和 ID 进行散列数 据库和 表,最终可以在配置文件 中进行简单的配置便能让系统随时增加一台低成本的数据库进来补充系统性能;

缓存

  缓存一词搞技术的 都接触过,很多地方用到缓存,网站架构和网站开发中的缓存也是非常重要,这里先 讲述最基本的两种缓 存,高级和分布式的缓存在后面讲述, 架构方面的缓 存,对 Apache 比较熟悉的人都能知道 Apache 提供了自己的缓存模块,也可以使用外加 的 Squid 模块进行缓存,这两种方式均可以有 效的提高 Apache 的访问响应能力, 网站程序开发方面的缓存,Linux 上提供 的 Memory Cache 是常用的缓存接口,可以 在 web 开发中使用, 比如用 Java 开发的时候就可以调用 MemoryCache 对 一些数据进行缓存和通讯共享, 一些大型社区使用 了 这样的架构, 另外, 在使用 web 语言开发的时候, 各种语言基本都有自己的缓存模块和方 法, PHP 有 Pear 的 Cache 模 块,Java 就更多了,net 不是很熟悉,相信也肯定有;

镜像

   镜像是大型网站常采用的提高性能和数据安全性的方式,镜像的技术可以解决不同网络接入商和地域带来的用户访问速度差 异, 比 如 ChinaNet 和 EduNet 之间的差异就促使了很多网站在教育网内搭建镜像站点,数据进行定时更新或者实时更新,在镜像的细节技 术方面,这 里不阐述太深,有很多专业的现成的解决 架构和产品可选,也有廉价的通过软件实现的思路,比如 Linux 上的 rsync 等工具;

负载均衡

   负载均衡将是大型网站解决高负荷访问和大量并发请求采用的终极解决办法,负载均衡技术发展了多年,有很多专业的服务提供商和产品可以选择,下面介绍几种常见的负载均衡。

1. 基于DNS的负载均衡--一个域名绑定多个IP

  DNS负载均衡技术是最早的负载均衡解决方案,它是通过DNS服务中的随机名字解析来实现的,在DNS服务器中,可以为多个不同的地址配置同一个名字,而最终查询这个名字的客户机将在解析这个名字时得到其中的一个地址。因此,对于同一个名字,不同的客户机会得到不同的地址,它们也就访问不同地址上的Web 服务器,从而达到负载均衡的目的。

  这种技术的优点是,实现简单、实施容易、成本低、适用于大多数TCP/IP应用;但是,其缺点也非常明显,首先这种方案不是真正意义上的负载均衡,DNS 服务器将Http请求平均地分配到后台的Web服务器上,而不考虑每个Web服务器当前的负载情况;如果后台的Web服务器的配置和处理能力不同,最慢的 Web服务器将成为系统的瓶颈,处理能力强的服务器不能充分发挥作用;其次未考虑容错,如果后台的某台Web服务器出现故障,DNS服务器仍然会把DNS 请求分配到这台故障服务器上,导致不能响应客户端。最后一点是致命的,有可能造成相当一部分客户不能享受Web服务,并且由于DNS缓存的原因,所造成的后果要持续相当长一段时间(一般DNS的刷新周期约为24小时)。所以在国外最新的建设中心Web站点方案中,已经很少采用这种方案了。

2. 通过硬件四层交换实现负载均衡

  在硬件四层交换产品领域,有一些知名的产品可以选择,比如Alteon、F5等,这些产品很昂贵,但是物有所值,能够提供非常优秀的性能和很灵活的管理能力。Yahoo中国当初接近2000台服务器使用了三四台Alteon就搞定了

3. 通过软件四层交换实现负载均衡

  软件四层交换我们可以使用Linux上常用的LVS来解决,LVS就是Linux Virtual Server,他 提供了基于心跳线heartbeat的实时灾难应对解决方案,提高系统的鲁棒性,同时可供了灵活的虚拟VIP配置和管理功能,可以同时满足多种应用需求, 这对于分布式的系统来说必不可少。

   一个典型的使用负载均衡的策略就是,在软件或者硬件四层交换的基础上搭建squid集群,这种思路在很多大型网站包括搜索引擎上被采用,这样的架构低成本、高性能还有很强的扩张性。

4. 通过反向代理服务器实现负载均衡

   反向代理服务器又称为 WEB 加速服务器,它位于 WEB 服务器的前端,充当WEB服务器的内容缓存器,反向代理 服务器是针对 WEB 服务器设置的,后台 WEB 服务器对互联网用 户是透明的,用户只能看到反向代理服务器的地址,不清楚后台 WEB 服务器是如何 组织架构的。当互联网用户请求 WEB 服务时,DNS 将请求的域 名解析为反向代理服务的IP地址,这样 URL 请求将被发送到反向代理服务 器,由反向代理服务器负责处理用户的请求与应答、与后台 WEB 服 务器交互。利用反向代理服务器减轻了后台 WEB 服务器的负载,提高了访问速度,同时避免了因用户直接与 WEB 服务器通信带来的安全隐患。

文章摘自虫师博文----性能知多少~系统架构分析】

TAG:

 

评分:0

我来说两句

我的栏目

日历

« 2024-04-24  
 123456
78910111213
14151617181920
21222324252627
282930    

数据统计

  • 访问量: 10228
  • 日志数: 5
  • 建立时间: 2014-04-28
  • 更新时间: 2016-03-30

RSS订阅

Open Toolbar