性能测试的几个指标,你完全了解吗?

发表于:2022-11-25 09:52

字体: | 上一篇 | 下一篇 | 我要投稿

 作者:他还在坚持嘛    来源:博客园

  记录性能测试常用的几个指标,性能测试其实就是检查各项指标是否符合要求。
  性能测试核心指标:
  吞吐量
  响应时间(Rsponse Time)
  并发处理能力
  资源占用能力
  测试中的时间占比:
  40%——性能测试分析
  30%——测试执行
  30%——测试结果分析
  而全链路监控就是只要和系统相关的全部需要监控到。
  吞吐量
  单位时间内,系统能够处理多少请求,吞吐量代表网络的流量,TPS越高,吞吐量越大,还包含了数据的吞吐量。一般单位为秒,每秒处理的请求量。
  注意:我们看到的JMeter聚合报告一般如下图,下表中的吞吐量实际是我们文中说的TPS或者QPS。如果要计算吞吐量的话应该是接收+发送网络流量总和。
  性能测试的时候关注吞吐量和测试环境网络带宽之间的关系,如果吞吐量接近或者等于测试环境带宽极限,那么很可能存在网络瓶颈。
  TPS
  TPS的全称是Transaction Per Second,即每秒处理的事务数,那什么是事务呢?
  如:用户操作伴随着数据的变更,【下单---->支付——一个请求会有多个操作】;如:11.11用淘宝下单,产生订单数据【40W订单/每秒】。
  衡量一个系统性能的好坏,主要看的是单位时间内,系统可以处理多少业务量。
  举个电商的例子:
  1)假设要测试“下单,那么“下单业务就可看做是一个事务;
  2)假设需要测试“添加购物车+下单整体业务,那么“添加购物车和“下单这2个业务就组成了一个事务,此时TPS就是每秒处理“添加购物车+下单这个一整个事务的数量。
  响应时间单位为秒的情况下,TPS = 1/响应时间*并发数。
  一般情况下采用二八原则去计算,80%的交易发生在20%的时间去处理。如:一天10000笔,TPS = (10000* 80%=8000笔)/(24*60*60*20%)。
  10000笔交易,上午2小时,下午2个小时,TPS = 10000*/4*60*60。
  在系统达到瓶颈之前,TPS和并发数成正比关系。
  QPS
  QPS = 并发数/响应时间,QPS的全称叫Request Per Second。字面意思比较好理解,就是每秒处理的请求数(如:用户查询数据【打开某个页面】,打开淘宝某个商品页面的时候),并没有去做数据的修改,只是把数据加载到页面中。
  如果是测试单接口的情况下,TPS=QPS,例如上面电商例子中的第1)个场景。
  TOP响应时间
  响应时间,Rsponse Time,从用户的角度来讲,就是用起来快不快。
  一个请求从用户发起,到收到服务器响应,所需的时间:
  页面打开响应的时间;
  具体单个资源的响应时间。
  一个请求的响应时间由以下几部分时间构成,响应时间=网络传输的总时间+各组件业务处理时间。
  TOP响应时间是将所有请求的响应时间先从大到小进行排序,计算指定比例的请求都是小于某个时间。
  该指标统计的是大多数请求的耗时,用JMeter进行测试通常看到下面几个数据:
  Top90(90%响应时间):90%的请求耗时都低于某个响应时间
  Top95(95%响应时间):95%的请求耗时都低于某个响应时间
  Top99(99%响应时间):99%的请求耗时都低于某个响应时间
  平均响应时间
  平均响应时间=所有请求的平均耗时=ART(Average Response Time)。
  并发数/虚拟用户数
  即并发处理能力,压测工具中设置的并发线程/进程数量,海量用户使用系统,在系统不崩溃情况下,能够支撑多少人同时使用。可以理解为每秒/毫秒可以处理多少并发。
  同时在线
  session会话信息(是否可支撑多人同时在线)、服务器储存(多人同时在线的信息需要服务器储存,服务器内存是否可支撑)。
  同时操作
  业界主流的定义,以秒为单位(极致情况:毫秒ms为单位),如:双11 支付宝排队付款,暂时不能付款。
  与吞吐量的区别
  吞吐量:1w个请求,10:00发送,10:03处理完毕,就是可以的。
  并发量:一直在高并发,系统是不是扛得住。如:每秒发起1w请求,持续10秒,系统是不是没有问题。
  资源占用率
  概念理解
  2个App,功能都一样,都是用来做“美颜,我们来判断下,哪个App的性能好。
  第一个App能够运行在5年前的手机上,2GB运行内存,需要内存资源少。
  第二个App只能够运行在3年前的手机上,4GB运行内存,需要内存资源更多。
  我们可以看出,第一个App所需要的运行内存更小,占用的内存资源更少,而第二个App需要的运行内存是更大的,以及内存资源更多,只能在三年的手机运行,5年前的是运行不了,所以是第一个App相对于与第二个App来说,第一个App性能是更加好的。
  性能好一些,对我们实际有什么帮助呢?
  假设我们在开发一款应用,有1000使用用户:
  500w用户——3年内的新手机(运行内存4G)
  500w用户——5年前的老手机(运行内存2G)
  如我们开发时没有考虑到老手机运行内存的问题,只可以运行在新手机上,那就意味着50%,500w的老手机的用户是正常使用不了的,如我们所设计时考虑到了,性能足够的好,新、老手机都可使用,那就是100%的用户是都可以正常使用的。
  成本的角度
  最小成本【最少资源】支撑最多的吞吐量、支撑最小的响应时间。
  CPU:作为计算机系统的运算和控制核心,是信息处理、程序运行的最终执行单元。
  内存:是计算机的重要部件,也称内存储器和主存储器,它用于暂时存放CPU中的运算数据,以及与硬盘等外部存储器交换的数据。它是外存与CPU进行沟通的桥梁,计算机中所有程序的运行都在内存中进行,内存性能的强弱影响计算机整体发挥的水平。只要计算机开始运行,操作系统就会把需要运算的数据从内存调到CPU中进行运算,当运算完成,CPU将结果传送出来。
  网络
  磁盘:利用磁记录技术存储数据的存储器。
  举例
  同时处理100个请求、需要占用多少CPU、内存、网络、磁盘,请求一个接口文档说明。
  1、加载一系列的、html、js、css等等内容——加载125KB的内容——内容压缩;
  2、服务器将数据传输到浏览器客户端,服务器网络带宽资源1M,就是每秒能够传输125KB的数据,加大服务器的带宽;
  3. 当前这个系统部署在服务器占用网络带宽太多了,导致每一秒只能返回一个请求所需要的数据。
  如若我们的官网中需加载的内容过多,而我们的服务器带宽只有1M,每秒只可以传输125KB,这时就会出现卡顿,那么我们想要解决,就需要加大带宽,会是压缩网页内缩了。
  为什么1M的带宽,只可以传输125kb呢?
  如我们家里的宽带100M宽带,理论上的下载速度是12.5M,究竟是为什么呢?因为运行商的所说的单位是bit,而我们经常说的是G、M是Byte。
  8位=1字节,“位是数据存储的最小单位。字节也叫Byte,1Byte=8bit(位),1024Byte(字节)=1KB,1024KB=1MB,1024MB=1GB,1024GB=1TB。
  服务器带宽是1M,访问官网1人需要的时间1S,100人需要的时间100S,这就是资源占用率,处理一个请求,需要占用多少资源。
  想要优化的话,网页中东西太多了,可以减少。可压缩一下,清晰度降低一点,有些可不马上加载处理的,可稍后下载出来。
  成功率
  请求的成功率,一般执行压测后我们会关注请求或者事务的成功率是多少,一般公司可能要求成功率在99.99%以上。
  PV/UV
  PV(Page View)页面/接口的访问量;
  UV(Unique Visitor)页面/接口的每日唯一访客。
  PV/UV的概念好像也是常在电商中出现,一般可能是在性能需求分析的时候提到,比如某页面每日的PV是多少,UV是多少。
  集合点
  集合点不是指标,是性能测试中的一个概念。
  集合点是为了增加瞬间并发压力的一种机制,在脚本中增加一个标记,所有虚拟用户执行到标记处会进行等待,等左右用户都到达后,再同时继续执行下一步操作。
  根据业务来选择是否需要集合点,如果业务场景是瞬间高并发的,如抢购、秒杀等,需要加集合点。
  增加了集合点之后,对服务器来说,会产生一种瞬间高并发,模拟秒杀等场景;同时也会降低服务器平均压力。
  本文内容不用于商业目的,如涉及知识产权问题,请权利人联系51Testing小编(021-64471599-8017),我们将立即处理
《2023软件测试行业现状调查报告》独家发布~

精彩评论

  • candywang2023
    2023-4-03 14:46:19

    非常感谢作者的满满干货分享。很实用,对初步接触性能测试的职场小白有很好的启蒙作用。
    之前总是把吞吐量和tps混淆,通过这次的学习,有了深刻的认识。

关注51Testing

联系我们

快捷面板 站点地图 联系我们 广告服务 关于我们 站长统计 发展历程

法律顾问:上海兰迪律师事务所 项棋律师
版权所有 上海博为峰软件技术股份有限公司 Copyright©51testing.com 2003-2024
投诉及意见反馈:webmaster@51testing.com; 业务联系:service@51testing.com 021-64471599-8017

沪ICP备05003035号

沪公网安备 31010102002173号