闲谈流量统计(I)— 入门

壹、流量统计的构成

流量统计一般包含 测量、收集,传输,处理、分析、报告 的环节。

1. 测量

在进行统计之前,需要先规划统计的目的,比如只是流量分析,还是用户分析……

在产品、模块上线的时候都需要有一个预期,比如说希望广告的点击率提高,留存提高,活动的参与人数提高等等。这时,需要有一个指标去衡量产品达到了预期,比如说PV/UV,这些就是埋点的依据。

一份良好的埋点规划,不仅可以提高开发的埋点效率,也可以提高数据收集的准确性和分析的可用性。

2. 收集

网站一般会使用 js 收集数据,而 APP 一般会选用 SDK 进行收集,当然一些服务也会进行后台埋点。

收集主要就是依据前期的埋点规划,收集后期分析所需要的数据。现在发展出了很多的方式。比如,js采集、APP SDK,前台埋点、服务端埋点,手动埋点、可视化埋点、全埋点……以上环节在聊到技术的时候,我们在展开。

3. 传输

采集的数据到分析数据库的过程。

4. 处理

在数据收集之后会有很多数据清洗过程,以保证数据的准确性和一致性。比如在在移动端会对数据进行标准化,在发送前会对数据进行压缩,在接受前对数据进行校验,提出异常流量,在存储是对数据进行结构话……

5. 分析

大部分的从业人员最关心的是数据的可分析性。用户希望在这里完成数据分析,发现商业突破点。后期在慢慢聊。

6. 报告

报告是分析结果的在抽象,一般会产生报表,或者大屏。

贰、流量统计的起源

广泛意义上流量统计起源于与 Web 分析。

Web analytics is the measurement, collection, analysis and reporting of web data for purposes of understanding and optimizing web usage. —Web analytics definitions.” Washington DC: Web Analytics Association (2008)
通常 Web分析是对Web数据的测量,收集,分析和报告,目的是了解和优化Web。

Web分析不仅可以衡量Web流量,而且可以用作业务和市场研究以及评估和提高网站有效性的工具。 Web分析应用程序还可以帮助公司衡量广告活动的结果。 它有助于估算在启动新的广告系列后网站的流量如何变化。 Web分析提供有关网站访问者数量和页面浏览量的信息。 它有助于评估流量和流行趋势,这对市场研究很有用。

现在已经有越来越多的流量统计载体:web、app、hybrid、小程序、物联网……

在分析的维度也越来越多,如:

1.流量分析
2.行为分析
3.社交分析
4.转化分析
5.广告分析
6.归因分析
7.……

1. Google GA

现在说到流量统计,就不得不提 Google Analytic,简称 GA。Google 分析现在是互联网上使用最广泛的流量分析服务。

1996年,一家叫 Urchin 的软件公司主要是在 San Diego(圣迭戈)提供网站开发和服务器托管。2005年公司被 Google 收购,产品被更名为「Urchin from Google」,这便是 Google Analytics 的前身。

1997年,Urchin 将WEB数据分析作为他们提供的服务的一个卖点,因为他们发现客户在处理自身网站数据时通常需要长达一天的时间。因此,他们希望能够有一个分析功能能够在15分钟内处理完一天的数据,这也是Urchin出现的原因。

目前使用比较广泛的自定义报告、高级细分和事件跟踪等功能在2008年~2009年就已经推出,而GTM则是在2012年才发布,增强型电子商务则是2014年才发布。近几年,GA上的更新有所减少,而作为独立产品发布的却越来越多,如Data Sutdio和Optimize,形成了GA Solution。

2. Mixpanel

Mixpanel 的名气在国内可能并不是特别大,如果不是做流量采集的同学基本就没有听过这家公司。但是,现代流量统计的就不得不提 Mixpanel。在 Mixpanel 之前,比如 Google Analytic,基本围绕着页面统计做文章,即统计都还都是 PV, UV。08年的 Suhail 还在一家流量统计的公司工作,但是他发现这个行业已经有太多公司做相同的东西,而且没有壁垒保护,毕竟这是一个发展了 10 年的行业。

同时,随着 AJAX 和 Web 2.0 的兴起,「页面」在网站当中的地位越来越弱:比如在 Facebook 上看看照片,在 Twitter 上发发评论,在 Pandora 上听听歌,这些都没有什么新页面的 Loading,只是图片的过渡和浮层的交互。那么,如果用户行为不再着重体现为页面浏览,而需要事件行为来衡量用户的使用情况。

「正确的度量单位可能是 Action、Event、或者在页面上发生的什么事情。」—— Suhail

在当时,完全基于 Event 模型来做数据采集与分析,当时,应该有 Mixpanel 这么一家了。而这个模型,现在已经成了流量分析的同时模型。

叁、流量统计的意义

  1. 了解产品的生命周期。获取产品的用户增长、留存情况等
  2. 支持产品决策。A/B test 的决策依据,产品成功的度量等
  3. 掌握用户行为。收集用户习惯,使用路径等
  4. 辅助产品精细化运营,广告、电商转化等
  5. 行业市场洞察。分析行业发展趋势,产品的增长点等

NEXT

闲谈流量统计(II)— 采集| Why·Liam·Blog

The Why·Liam·Blog by WhyLiam is licensed under a Creative Commons BY-NC-ND 4.0 International License.

WhyLiam创作并维护的Why·Liam·Blog采用创作共用保留署名-非商业-禁止演绎4.0国际许可证

本文首发于Why·Liam·Blog (https://blog.naaln.com),版权所有,侵权必究。

本文永久链接:https://blog.naaln.com/2020/03/data-analytic-1/