手把手教你用EXCEL分析流量波动原因(实例讲解)
前言 随着运营精细化发展,如何通过品牌沉淀的数据挖掘出更多优化可能,是每个运营、产品甚至技术的必修课。这篇文章将主要阐述我是如何通过发现问题、提出猜测、验证猜想和事件归类这四个方面,分析官网流量数据并找出问题的。 (文中出现的工具有CNZZ后台和Excel2013) 这次以某个朋友的网站作为演示数据,选取了2016年7月25日到2016年8月7日,分别是2016年第31周和32周两周的数据,选择这两周数据是因为第32周该网站刚刚关闭了付费广告的投放,所以网站流量出现了巨大差异,比较典型,CNZZ后台流量如图示: 在图右下选择“更多指标”,选取当前核心指标,举例取PV、UV、平均访问时长、跳出率;图中部“时”改为“天”。 然后我们通过观察图上部分的对比数据,提出疑问: 1、为什么两周流量数据大面积变差?怎么找出是哪一天或者哪个栏目哪个小时的原因? 2、为什么独立访客(UV)和新独立访客(NUV)差值都是4.5倍左右,而浏览次数(PV)差值却只有1.5倍? 3、为什么两周的UV走势(橙线)类似,但PV走势(蓝线)却在7-26和7-29两天出现谷值和峰值? 目前我们已知最大的变化就是第31周开了付费广告,第32周关闭,关闭时间是8-1号当天几点呢?一到凌晨就关了还是下班才关?网站负责人说“好像是8-1号早上”,分析师不相信“好像”,只能通过数据去验证。 这时候我们能提出的合理猜测是(猜测问题1=d1,下同): d1:两周流量数据大面积变差,是因为关闭了广告投放,但具体是哪个小时和栏目通过CNZZ展示出的数据无法直观得出结论,需要分析具体数据。 d2:UV和NUV差值相近,可能这周的数据增长多数来自新独立访客,而着陆页对新访客的吸引力不强,所以大多新访客没有产生更多点击行为,这也说明,为什么第32周的跳出率升高。 d3:7-26对应8-2,7-29对应8-5,分别出现的谷值峰值原因在SEO日记录表中无记录,暂时无法给出猜测,只能查看具体数据。 网站日志中只记录了8-1关闭付费推广 提出猜测之前先问问网站负责人,网站近期有没有改版或变动,有没有忘记记录的事项,其他部门有没有做过什么线下活动推广等等,合理的猜测来自于网站日志记录的已知条件和分析师的经验。 在Excel中打开CNZZ记录的两周访问明细(因私密原因将主域名修改为我的微信ffeels),按如下猜测具体分析: 1、具体什么时候停的付费广告? 在日期中筛选第32周数据(8-1~8-7),在“页面来源”中筛选被标记的付费来源链接(该站标记的是“ipinyou”),确定,结果如图。 最后一条带有付费标记来源时间是2016-8-1 9:56:43,得出负责人是在周一上午上班后10点左右关闭的付费广告投放。 2、在这次流量变动中,关闭付费广告带来了多大的影响? 全选7-25~8-7访问明细数据,新建透视表。 行放“页面来源”和“受访页面”,列放“周数”,值计数放“IP”,观察两周整体数据对比,发现自然流量+付费流量差值为7141-2745=4396,再筛选付费链接流量差值,即可得付费广告影响。 分别在“页面来源”和“受访页面”两个字段处使用标签“不包含”筛选掉付费标记“ipinyou”,如图: 现在我们得出结果第31周和第32周的付费流量差值分别为7141-3834=3307,2745-2593=152,这就是开关付费广告为网站流量带来的具体影响数。那么网站流量变化全因是付费流量开关引起的吗?通过上图的计算结果,我们知道并不是,排除掉付费流量,我们仍然存在3834-2593=1241的自然流量差值,是什么原因引起的呢? 3、自然流量中有多少是自己公司的用户? 询问网管了解公司的网线有没有被分成多条,公司所有主机目前对应的IP地址或IP段是多少。因为选择的时间久远,已经无法得知当时该公司的内部IP段是多少,故忽略该步骤。 4、自然流量的差值是由哪些页面在哪几个时段引起的? 添加字段“日期”和“小时”到行中,选择降序排列,值显示方式调整为对比32周的差异,选中值选在区域,更改条件格式→项目选区规则→前10项,填充粉色,重复该步骤选择最后10项,填充黄色,最后效果如图。 (其中粉色代表该页面31周比32周多出来的数据,如“直接访问书签”31周来源流量比32周多127;黄色代表该页面32周比31周增加的数据,如“http://study.ffeels.com/dujia/gushisudi”32周来源流量比31周多321) 得出正值相差超过200的页面有“http://fof.ffeels.com/”、“http://fof.ffeels.com/help”、“http://fof.ffeels.com/capacitymis”,负值超过200的页面有“http://study.ffeels.com/dujia/gushisudi”。 分析的步骤相同,我们以“http://fof.ffeels.com/help”页面为例,为什么这个页面31周比32周多267次?一次将“IP”、“访客新老属性”、“受访页面”、“地区”等字段放进行中,日期处降序排列如图: 从“http://fof.ffeels.com/”、“http://fof.ffeels.com/help”、“http://fof.ffeels.com/capacitymis”三个页面可以发现,三个页面的流量都来自7-29号早上6点。 同时,我们发现了一个可疑的IP字段,两天都有“222.16.42.***”,看看这个IP段是什么鬼,于是在“IP”字段筛选出“222.16.42.***” 有意思的是,这个IP段仅在第31周的每天的早晨6,7点间活跃,如图: (编辑:ASP站长网) |