note.wcoder.com
wcoder GitHub

Table of Contents

[TOC]

数据分析中常见指标及含义

用户数据指标

1、日新增用户

产品每天新增用户是多少。作用:衡量判断渠道推广效果。

2、活跃用户:

活跃用户按时间分为日活跃用户数(DAU,一天之内活跃的用户数)、周活跃用户数(WAU,一周之内至少活跃一次的用户总数)、月活跃用户数(MAU,一个月之内至少活跃一次的用户总数,月活跃用户数需去重)。

3、活跃率

活跃率=活跃用户数/总用户数(日活跃率、周活跃率、月活跃率)

4、留存率

留存:通过渠道推广过来的新用户,经过一段时间可能会有一部分用户逐渐流失掉了,那么留存下来的用户就称为留存。作用:评估产品功能对用户的粘性。

留存率:第1天新增用户中在第N天使用过产品的用户数/第1天新增用户数(次日留存率N=2,第7日留存率N=7,第30日留存率N=30) 。

行为数据指标

1、PV(Page View)页面浏览量

指某段时间内访问网站或某一页面的用户的总数量,通常用来衡量一篇文章或一次活动带来的流量效果,也是评价网站日常流量数据的重要指标。PV可重复累计,以用户访问网站作为统计依据,用户每刷新一次即重新计算一次。

2、UV(Unique Visitor)独立访客

指来到网站或页面的用户总数,这个用户是独立的,同一用户不同时段访问网站只算作一个独立访客,不会重复累计,通常以PC端的Cookie数量作为统计依据。

3、Visit访问

指用户通过外部链接来到网站,从用户来到网站到用户在浏览器中关闭页面,这一过程算作一次访问。Visit可重复累计,比如我打开一个网站又关闭,再重新打开,这就算作两次访问。

4、Home Page主页

指一个网站起主目录功能的页面,也是网站起点。通常是网站首页。

5、Landing Page着陆页

指用户从外部链接来到网站,直接跳转到的第一个页面。比如朋友给我发了一个介绍爆款T恤的淘宝链接,我点开会直接跳转到介绍T恤的那个页面,而不是淘宝网众多其他页面之一,这个介绍T恤的页面可以算作是着陆页。

6、Bounce Rate跳出率

指用户通过链接来到网站,在当前页面没有任何交互就离开网站的行为,这就算作此页面增加了一个“跳出”,跳出率一般针对网站的某个页面而言。跳出率=在这个页面跳出的用户数/PV。

7、退出率

一般针对某个页面而言。指用户访问某网站的某个页面之后,从浏览器中将与此网站相关的所有页面全部关闭,就算此页面增加了一个“退出“。退出率=在这个页面退出的用户数/PV。

8、Click 点击

一般针对付费广告而言,指用户点击某个链接、页面、banner的次数,可重复累计。比如我在PC端看到一则新闻链接点进去看了一会就关了,过了一会又点进去看了一遍,这就算我为这篇新闻贡献两次点击。

9、avr.time 平均停留时长

指某个页面被用户访问,在页面停留时长的平均值,通常用来衡量一个页面内容的质量。avr.time=访客数量/用户总停留时长。

10、CTR 点击率

指某个广告、Banner、URL被点击的次数和被浏览的总次数的比值。一般用来考核广告投放的引流效果。CTR=点击数(click)/被用户看到的次数。

11、Conversion rate 转化率

指用户完成设定的转化环节的次数和总会话人数的百分比,通常用来评价一个转化环节的好坏,如果转化率较低则急需优化该转化环节。转化率=转化会话数/总会话数。

商品数据指标

1、投资回报率(ROI:Return On Investment )

反映投入和产出的关系,衡量我这个投资值不值得,能给到我多少价值的东西(非单单的利润),这个是站在投资的角度或长远生意上看的。其计算公式为:投资回报率(ROI)=年利润或年均利润/投资总额×100%,通常用于评估企业对于某项活动的价值,ROI高表示该项目价值高。

2、总量

包括:成交总额(GMV)、成交数量。

成交总额:即流水,包括销售额、取消订单金额、拒收订单金额、退货订单金额

成交数量:即下单商品数量

3、商品

包括:热销商品、好评商品、差评商品,商品指从商品的角度去衡量哪些商品好,哪些商品不好,重点推销或优化。

QPS、TPS、并发用户数、吞吐量关系

QPS

QPS Queries Per Second 是每秒查询率 ,是一台服务器每秒能够相应的查询次数,是对一个特定的查询服务器在规定时间内所处理流量多少的衡量标准, 即每秒的响应请求数,也即是最大吞吐能力

TPS

TPS Transactions Per Second 也就是事务数/秒。一个事务是指一个客户机向服务器发送请求然后服务器做出反应的过程。客户机在发送请求时开始计时,收到服务器响应后结束计时,以此来计算使用的时间和完成的事务个数

QPS和TPS区别

个人理解如下:
1、Tps即每秒处理事务数,包括了
1)用户请求服务器 
2)服务器自己的内部处理 
3)服务器返回给用户

这三个过程,每秒能够完成N个这三个过程,Tps也就是N;

2、Qps基本类似于Tps,但是不同的是,对于一个页面的一次访问,形成一个Tps;但一次页面请求,可能产生多次对服务器的请求,服务器对这些请求,就可计入“Qps”之中。

例子

例如:访问一个页面会请求服务器3次,一次放,产生一个“T”,产生3个“Q”

例如:一个大胃王一秒能吃10个包子,一个女孩子0.1秒能吃1个包子,那么他们是不是一样的呢?答案是否定的,因为这个女孩子不可能在一秒钟吃下10个包子,她可能要吃很久。这个时候这个大胃王就相当于TPS,而这个女孩子则是QPS。虽然很相似,但其实是不同的。

并发数

并发数(并发度):指系统同时能处理的请求数量,同样反应了系统的负载能力。这个数值可以分析机器1s内的访问日志数量来得到

吐吞量

吞吐量是指系统在单位时间内处理请求的数量,TPS、QPS都是吞吐量的常用量化指标

系统吞吐量要素

一个系统的吞吐量(承压能力)与request(请求)对cpu的消耗,外部接口,IO等等紧密关联。

单个request 对cpu消耗越高,外部系统接口,IO影响速度越慢,系统吞吐能力越低,反之越高。

重要参数

QPS(TPS),并发数,响应时间

  1. QPS(TPS):每秒钟request/事务 数量
  2. 并发数:系统同时处理的request/事务数
  3. 响应时间:一般取平均响应时间

关系

QPS(TPS)=并发数/平均响应时间

一个系统吞吐量通常有QPS(TPS),并发数两个因素决定,每套系统这个两个值都有一个相对极限值,在应用场景访问压力下,只要某一项达到系统最高值,系统吞吐量就上不去了,如果压力继续增大,系统的吞吐量反而会下降,原因是系统超负荷工作,上下文切换,内存等等其他消耗导致系统性能下降。

PV

PV(Page View):页面访问量,即页面浏览量或点击量,用户每次刷新即被计算一次。可以统计服务一天的访问日志得到。

UV

UV(Unique Visitor):独立访客,统计1天内访问某站点的用户数。可以统计服务一天的访问日志并根据用户的唯一标识去重得到。

响应时间(RT):响应时间是指系统对请求作出响应的时间,一般取平均响应时间。可以通过Nginx、Apache之类的Web Server得到。

DAU

DAU(Daily Active User),日活跃用户数量。常用于反映网站、互联网应用或网络游戏的运营情况。DAU通常统计一日(统计日)之内,登录或使用了某个产品的用户数(去除重复登录的用户),与UV概念相似

MAU

MAU(Month Active User):月活跃用户数量,指网站、app等去重后的月活跃用户数量

系统吞吐量评估

我们在做系统设计的时候就需要考虑CPU运算,IO,外部系统响应因素造成的影响以及对系统性能的初步预估。

而通常情况下,我们面对需求,我们评估出来的出来QPS,并发数之外,还有另外一个维度:日pv。

通过观察系统的访问日志发现,在用户量很大的情况下,各个时间周期内的同一时间段的访问流量几乎一样。比如工作日的每天早上。只要能拿到日流量图和QPS我们就可以推算日流量。

通常的技术方法:

  1. 找出系统的最高TPS和日PV,这两个要素有相对比较稳定的关系(除了放假、季节性因素影响之外)
  2. 通过压力测试或者经验预估,得出最高TPS,然后跟进1的关系,计算出系统最高的日吞吐量。B2B中文和淘宝面对的客户群不一样,这两个客户群的网络行为不应用,他们之间的TPS和PV关系比例也不一样。

软件性能测试的基本概念和计算公式

软件性能的关注点

软件做性能测试时需要关注哪些性能呢

首先,开发软件的目的是为了让用户使用,我们先站在用户的角度分析一下,用户需要关注哪些性能。

对于用户来说,当点击一个按钮、链接或发出一条指令开始,到系统把结果已用户感知的形式展现出来为止,这个过程所消耗的时间是用户对这个软件性能的直观印 象。也就是我们所说的响应时间,当相应时间较小时,用户体验是很好的,当然用户体验的响应时间包括个人主观因素和客观响应时间,在设计软件时,我们就需要 考虑到如何更好地结合这两部分达到用户最佳的体验。如:用户在大数据量查询时,我们可以将先提取出来的数据展示给用户,在用户看的过程中继续进行数据检 索,这时用户并不知道我们后台在做什么。

用户关注的是用户操作的相应时间。

其次,我们站在管理员的角度考虑需要关注的性能点。

  1. 响应时间
  2. 服务器资源使用情况是否合理
  3. 应用服务器和数据库资源使用是否合理
  4. 系统能否实现扩展
  5. 系统最多支持多少用户访问、系统最大业务处理量是多少
  6. 系统性能可能存在的瓶颈在哪里
  7. 更换那些设备可以提高性能
  8. 系统能否支持7×24小时的业务访问

再次,站在开发(设计)人员角度去考虑。

  1. 架构设计是否合理
  2. 数据库设计是否合理
  3. 代码是否存在性能方面的问题
  4. 系统中是否有不合理的内存使用方式
  5. 系统中是否存在不合理的线程同步方式
  6. 系统中是否存在不合理的资源竞争
← Previous Next →
Less
More