广告统计学中两个数值型变量的关系-创视优品

广告统计学中两个数值型变量的关系

  •   这里要涉及回归分析和相关分析,这两种统计方法可以回答一些明确定义的数值型变量间的关系。回归分析描述的是一个或多个自变量的变化是如何影响因变量的一种方法。相关分析描述的是两个数值变量间关系的强度。
    2.8.1 相关分析
      对于两个数值型变量,我们一般总用一个图来分析这些数据。如图2-12所示,称为散点图。水平的x轴为自变量,垂直的y轴为因变量,图上每一个点代表一个观测值。以某App在小米应用商店广告优化为例,来看一下精品广告下载量与总激活量是否有相关关系。
    [插图]
    图2-12 精品广告下载量与总激活量关系图
      这个散点图直观表明,精品广告下载量越高,总激活量也越高。图2-12中点的趋势说明两个变量间确实存在一定的关系。
      当这些数据沿一条直线排列时,我们可以计算一个系数来衡量两个变量间的关系。对于两个数值型变量,计算出来的系数记作r,我们一般称之为相关系数,或是线性相关系数。非线性相关不是本书讨论的重点。
      r的取值为-1到+1,-1代表两个变量是完全的负线性相关关系,+1代表两个变量是完全的正线性相关关系,0代表两个变量不存在线性相关关系,越接近1说明两个变量的关系强度越高。
      两个数值型变量的r值介于0.7~1.0,代表了一个很强的正相关性;r值介于0.3~0.7,代表了一个较强的正相关性;r值介于0~0.3,代表了一个较弱的正相关性。r为负值时,同理类推。
      下面我们通过几个散点图来看看为什么散点图的不同趋势会导致不同的r值。
      这四个不同的散点图,每个有100组观察值。这些数据都是我用Excel生成的,并没有实际意义,但为模拟广告数据分析的真实场景,依然加上了横轴坐标轴。


      在图2-13中,这些点的排列有明显的规律,我们可以看到一种从左下角到右上角的明显的直线趋势。这些点沿对角线呈一种规则的分布,两个变量间的关系应该很强,相关系数也证实了,r=0.97。

    图2-13 r=0.97的散点图
      在图2-14中,这些点不像图2-13中那样明显的排成一束,但从散点图中我们仍然可以看到一种确定的正相关,相关系数r=0.70。


    图2-14 r=0.70的散点图
      在图2-15中,相关系数r=0.52,这意味着一个较弱关系,从散点图上几乎很难看出两个变量之间是否相关。
    图2-15 r=0.52的散点图


      对于图2-16,这些点是随机散布的,两个变量之间几乎没有什么关系。
  • 本文章摘自书籍或来源于网络,如果您喜欢本文,请通过正规渠道购买正版书籍或者访问原网站,如有侵权,请联系我们及时删除。
  • 相关资讯

    您可能对下面的文章也感兴趣!

    我们的服务项目

    企业宣传片、三维动画、企业会议片、MG动画、短视频、产品广告

    Top