近期(旧文,2017年2月)由于工作需要,在整理某一电商网站数据的时候,发现了一些比较有意思的概念——流量作弊内容仅供产考,挺有意思的,用数据能验证很多东西。

1

比较简单的作弊,容易分析出结果。

下图为某一电商网站的社区网站在2月份的访问趋势图

如何去分析一个网站的流量数据是否存在作弊?-互联网增长官

整月内日均访问量在10万左右,其中有一天(2月23日)陡增至130多万,明显存在异常情况。

“嗯,肯定有人在刷流量。”

“万一不是呢?万一人家办活动呢?”

“办活动肯定得预热,你看前后俩天数据就正常。”

“得用数据证明。”

......

将23号与22号的数据对比,发现流量在10-16时有着明显的变化。

如何去分析一个网站的流量数据是否存在作弊?-互联网增长官

嗯,这页看不出什么吧?

“中午人们不睡觉啊,流量那么高,肯定刷的。”

“得用数据证明。”

......

对照昨天正常数据,逐一排查,先看看引荐域名(就是访客是从哪个网站到点击链接然后跳转到你的网站)。

23号数据如下,如何去分析一个网站的流量数据是否存在作弊?-互联网增长官

22号数据如下,如何去分析一个网站的流量数据是否存在作弊?-互联网增长官

那就确定了有100多万的访客是从 http://www.fu-jing.com/ 这个网站过来的,打开该网站后提示如下,如何去分析一个网站的流量数据是否存在作弊?-互联网增长官

嗯,通过数据从而得出这天100多万的数据是的。

“再看看刷的是哪个栏目哪个页面。”

“那有什么用?。”

“论坛里买猪肉的会给买电视的刷?。”

......

通过上述引荐域名用户都访问了哪些栏目及页面。

由分析可知,用户访问了xxx这个栏目,

如何去分析一个网站的流量数据是否存在作弊?-互联网增长官

下的这些页面,

如何去分析一个网站的流量数据是否存在作弊?-互联网增长官

嗯,这样就知道是哪个渠道的的运营团队在刷流量了。

2

有一种是你明明知道对方在刷流量,但很难用数据验证。

这种比较有意思,下图分别代表2月28日和3月1日的某电商网站商城的访问量,

如何去分析一个网站的流量数据是否存在作弊?-互联网增长官

—2月28日 —3月1日

对比往日的数据,按照正常情况下,下午5点以后访问量一般是呈下降趋势的,而3月1日的数据明显有问题。

但经过之前步骤的分析,先通过查看引荐域名

2月28号数据如下,

如何去分析一个网站的流量数据是否存在作弊?-互联网增长官

3月1号数据如下,

如何去分析一个网站的流量数据是否存在作弊?-互联网增长官

这里未知代表的是直接访问的该网站主页,所以初步分析造成网站访问量升高的原因就是用户直接访问该网站,继续往下分析,下面的分析均再此步骤下。

看一下直接访问该电商网站的,主要都浏览了哪些页面。也就是说哪些页面的浏览量较平时增高。

2月28号数据如下,

如何去分析一个网站的流量数据是否存在作弊?-互联网增长官

3月1号数据如下,

如何去分析一个网站的流量数据是否存在作弊?-互联网增长官

对比后发现,新增的访客就进入了网站的主页,没有再做其他操作就退出了,线索又断了,继续往下分析。

访问该主页的用户分布区域前十如下,每个地方都有,也没发现重要信息,

如何去分析一个网站的流量数据是否存在作弊?-互联网增长官

2

分析访问cookie,Cookies是当你浏览某网站时,由Web服务器置于你硬盘上的一个非常小的文本文件,它可以记录你的用户ID、密码、浏览过的网页、停留的时间等信息。当你再次来到该网站时,网站通过读取得知你的相关信息,就可以做出相应的动作,相当于你的身份证。 

28号数据如下,

如何去分析一个网站的流量数据是否存在作弊?-互联网增长官

1号数据如下,

如何去分析一个网站的流量数据是否存在作弊?-互联网增长官

明显可以发现1号的cookie访问量有问题,但有2天相差10万的浏览量,明显这不是导致变化的主要原因。

单个ip访问主页后的操作情况,

2月28号,某个ip

如何去分析一个网站的流量数据是否存在作弊?-互联网增长官

3月1号,某个ip,

如何去分析一个网站的流量数据是否存在作弊?-互联网增长官

该页面对应的的访客数、浏览量和访客数是一样的,经多次抽样分析其他ip(大量ip)的浏览情况,对比正常的数据,发现不可能是巧合,有可能存在刷流量情况。

遇到这种情况,只能多种角度选择大量的数据去多种分析。

3

查看网站流量是否作弊,可以从以下几个角度去考虑。

① 每天早晨定时记录前天的数据去对比,设定一个允许的波动范围,超出该波动的范围,则去分析。如何去分析一个网站的流量数据是否存在作弊?-互联网增长官

② 分析波动趋势:对比2天内各个时间点的访问趋势,看哪个时间段流量变化异常,若凌晨流量较高,则存在恶意刷流量情况;若正常时间段内流量异常,则分析如何导致该异常。

③ 分析相同页面在2天内的访问量,访问量差别较大的可以去分析“来源去向”,可以了解到访客是从什么地方来到的该网站,如广告网站,外链,刷流量的平台等。

④ 分析导致页面浏览量上升的异常数据,有可能是一个ip访问了上千次,有可能是访问量较高的页面的访客用的是一个运营商,有可能是访客的电脑屏幕用的一种分辨率(遇到过这情况),也有可能是访客来源是一个地方.....

⑤ 凡数据库中有的指标都可以用来去分析,单一指标也可换算成复合指标,如 新指标=xxx/xxx、平均xxx等。

4

流量作弊,更多的是一种行业的潜规则。

在网上查了一下关于流量作弊,常见的有机器作弊、人工作弊和劣质广告作弊这三类。

机器作弊:通过大量测试机或者模拟器直接发送移动流量,或者是爬虫技术、脚本刷量、DNS劫持、病毒控制肉鸡访问PC流量,制造虚假曝光量、点击量等,作弊成本较低比较常用。

人工作弊:激励及诱导用户来点击、注册等,这类作弊成本较高比较难防备。

劣质广告作弊:发一些假的内容页,就一个广告位,比较常见。

目前很多网站的运营人员为了完成kpi,这样去刷流量,但没有转化率,带不来利润,公司为了漂亮的数据,也睁一只眼闭一只眼,但又有什么用?还不如好好在产品上下功夫。