`
郑云飞
  • 浏览: 795805 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

网站分析的最基本度量

 
阅读更多

网站分析的最基本度量(1)——Visit

Visit,汉语翻译过来是“访问”。一个网站(Web Site)就好像一个大厦,里面有很多个不同内容的房间(Page)。你若是进了这个大厦,就是一个来访者(Visitor)。你进来了,东瞅瞅,西瞧瞧,打开一个房间的门,又退出去到另外的房间,或者从一个房间的另外一个门到另一个房间,总之你转悠了好一会儿,然后终于走出大厦。对于大厦而言,你刚才的一系列行为,就是一次来访(Visit)。同样,你在一个网站里东点西看,然后最终关掉所有与这个网站有关的页面,你也是对这个网站的一次来访(Visit)。

 

  Visit对于我们而言,很容易理解。但是对于我们进行网络分析时候必须依靠的重要武器——网络分析工具(Webanalytics Tool)而言,那就不那么容易了。为什么呢?我举个例子:

  你打开了我的博客http://zhengyunfei.iteye.com/,饶有兴致的看了10分钟,然后忽然你的女朋友给你电话了。于是你站起来接电话,兴致勃勃的聊了足足20分钟,再也没有动鼠标。终于,你心满意足的挂了电话,重新回到电脑旁边,继续在我的博客页面上点动起来。

  OK!软件工具会怎么看待你的这一段时间的行动呢?记录1次Visit,还是记录2次Visit?

  如果记录1次,那么似乎中间间隔了20分钟,而且你离开了电脑,没有看任何内容了;但是如果记录2次,又毕竟中间只间隔了20分钟。

  这种情况的出现,就要看网络分析工具如何定义Visit了,不同的定义,会得到不同的结果。

  如果这个工具定义1个Visit是一系列在你网站上的点动鼠标的动作,且两个点击你网站页面超链接的时间不能超过30分钟。那么没问题,你的这20分钟中断没有被这个工具计为下一次访问。因此它仍然记录1次Visit,即在这段时间内Visit = 1。

  如果这个工具定义1个Visit是两次点击不能超过10分钟算一个Visit,那么,你的这次中断,就让我的网站多出了1个Visit,即Visit = 2。

  是不是觉得太随意了?科学怎么能这样啊……

  网络分析毫无疑问是门科学,虽然不同的分析工具定义可能不同,但是至少有着很严格清晰的定义。还有一点非常重要的是,Visit也有另外一个说法,叫做Session,意思是一系列的动作。两个词的意思是完全一样的,完全可以混用。不过我还从来没有见过有人用Session,真是孤陋寡闻啊!

 

  怎么样?是不是有些清楚了?虽然这不是关于Visit所有的内容,但是已经能帮你理解它了。还有什么想知道的,别犹豫,告诉我吧!

  哦,对了,现在你可能会问我,如果我打开页面点了一下,然后就关了页面,过了2分钟又重新打开它,再点我想看的内容,那么这又算几次Visit呢?1次,还是2次?

 

 

 

  这次就不告诉你了,留个悬念,后面的帖子会慢慢说的。Don't Worry!:-)

网站分析的最基本度量(2)——UV

17 一月 2008 29 COMMENTS
  UV,在网络分析里面是非常重要的一个Metric(Metric的意思是度量衡,例如一米两米的米就是一个Metric),也是一个重要的KPI。(什么是KPI?KPI是Key Performance Indicator的缩写,意思就是最重要的参数)。UV是Unique Visitor的简称,意思是唯一的访问者。想要搞清楚这个KPI的意义。首先可以了解一下什么是Visitor。Visitor的汉语意思是访问者,就是访问网站的人。为什么不用“用户”(User)这个名词呢?User对应的是某个Application(应用),或者是某种Service(服务),但是访问网页的人,还是用Visitor更准确,而且也是约定熟成的咯。【点击标题阅读全文】

  访问网站的人很容易理解,但是前面加了一个Unique就有点儿费解了。——难道每个访问的人不是独一无二的吗?难道还有其他跟我一模一样的冒名顶替者?

  不,不!不是这个意思,我们(人类)分辨一个一个的个体当然很容易,每个人都是独一无二的,没有两个Sidney Song,也没有两个你。可是,我们在进行网络分析的时候,都是要通过某种软件工具完成的,这些工具怎么能知道一段时间内访问网站的人,到底有多少呢?

  举个例子:网络软件工具记录了访问http://zhengyunfei.iteye.com/的来访纪录一天有10次,那么,它可以简单的告诉你,有10个人访问了你的网站。

  显然,这是不符合真实情况的,因为,很可能,你,我亲爱的读者,登上了我的网页,然后看了半个小时,又关闭了浏览器,干别的去了,过了1个小时再回来,又重新打开收藏夹,点出我的页面,又看了一会儿。

 

  对于记录访问我博客的软件工具而言,你相隔1个小时的两次访问被毫无疑义的记录为两次访问,但是如果同时也记录下了有两个访问者分别访问就不正确了。因为你虽然访问了两次,但两次都是你,而不是换了一个人访问了我的网站。换句话说,你是这些不同访问记录的唯一的访问者。

  也就是说,软件工具应该记录:Visit = 2; Visitor =1,而不是Visit = 2; Visitor = 2。由于你是这些访问记录的唯一访问者,因此我们可以让软件工具这样记录:Visit = 2; Unique Visitor = 1,或者更简单:Visit = 2; UV = 1。

  因此,我们前面假设的10次访问,很有可能不是来自于10个不同的访问者,而是来自于少于10个访问者,因为很有可能,某些访问者同您一样,一段时间内多次访问了我的网站。如果这10次访问是来自于9个访问者,那么我们可以确定一定有一个人访问了2次,而对这2次访问而言,这个人就是它们(2个Visits)的独一无二的访问者(UV)。当然,完全有可能出现1个人在一段时间内包办这所有10次访问的情况,那么这个人就是这10个Visits的UV。

  绕口的说了这么多,我想你一定明白了,Unique Visitor,或称UV,是相对于访问(Visit)而言的,一个访问者可以产生多个Visits,这些Visits对应的只是这个独一无二的人,而没有其他人,因此就有了UV的概念。

  同Visit有另外一个说法叫“Session”一样,Unique Visitor也有另外一个说法,叫“Reach”,不过后者因为意思不是很清晰,所以也用的很少。

  现在的问题是,软件工具怎么知道哪些Visits是来自于某一个Visitor的呢?

  呵呵,看我后面的帖子吧!

网站分析的最基本度量(3)——网站分析工具如何辨别UV

19 一月 2008 15 COMMENTS

   在关于UV的上一个文章中(网站分析的最基本概念(2)——UV的概念),我们留了一个尾巴。那就是网站分析工具是如何能够知道哪些Visits是来自于同一个Unique Visitor的。现在就让我揭开这个谜底吧!

  其实,非常简单。亲爱的读者朋友,可能你已经猜到了。

  有两种方法。但在讲这两种方法之前,必须要清楚一个概念,那就是服务器和浏览器(B/S)的概念,如果你已经清楚的了解这个概念。没关系,直接跳过下面的斜体字内容吧!【点击标题阅读全文】

  我们都知道我们在浏览网页的时候,网页是要通过浏览器(Browser,简写为B)来显示的。但是网页真正的存放地址肯定不是在你自己的电脑上(废话,如果这样还要网线干什么,每月也不用给电信局交钱了),而是在某一个遥远的地方(就如同电视节目不在你自己家的电视机里,而是在遥远的电视台一样)。这个遥远的地方有一个很高级的电脑,里面存放了很多的网页内容,这个电脑叫做服务器(Server,简写为S),或者更确切说叫网站服务器(Web Server),而你自己的电脑叫做客户端。当打开一个网页的时候,需要首先打开客户端的浏览器,然后在浏览器的地址栏输入你想上的网站的地址,此后你的浏览器就会通过我们伟大的互联网(Internet)立即给相应地址的网站服务器的发一个请求(Quest),然后那个网站服务器接到这个请求后就会把它保存的相应的网页(Page)的代码(Code,主要是HTML Code)发到你的浏览器上。而浏览器有一个神奇的功能,那就是把这些Code变成可以供你阅读的文字(Text),链接(Link),图片(Graphic),音乐(Music)或者是视频(Video)。这就是为什么你能访问互联网,也能够看到我的这个博客的原因。当然,其中的过程比我这一段文字要复杂的多,而且我的解释并不是100%的实际过程的再现。不过你能理解这样一个过程就足够了。

[转载请事先声明并得到许可,版权归作者所有。]

  那么,网络分析软件有哪两种方法分辨出Unique Vistor呢?

  方法一:让网站服务器分辨

  道理很简单,网站服务器每时每刻都会接到很多的页面请求,每一个请求信息内都包含了你的(实际上是你的电脑的)一些信息。这些信息包括很多内容,比如你的IP地址(呵呵,IP地址就不用我解释了吧,不知道就当它是你的计算机在互联网上的一个门牌号码吧!)、你发出请求的时间、你的浏览器的版本、你的操作系统的版本,以及其他一些古古怪怪的信息(实际上都是有作用的哦,只是我们现在没必要弄清楚它们)。

  网站服务器可以分析这些Request,如果这些Request满足一些共同的特征,比如来自同一个IP地址,且浏览器版本相同,或者再加上发出请求的时间接近等,它就认为这一串的Request对应的一系列Visits是来自于同一个Visitor的,这个Visitor就成为这些Visits的UV了。

  当然,如何定义这些共同的特征是由网站服务器的设置决定的。一般而言,用IP地址+其他特征共同限定来定义的情况比较多,但是IP地址实际上并不准确,尤其在局域网内有共用IP地址的多台计算机的情况发生的时候。不过,聊胜于无了!

 

  方法二:用Cookie分辨

  另外一个方法使用Cookie的方法分辨。什么?什么是Cookie?不了解Cookie就查一下Google或者Baidu吧!我就不解释了,说起来话挺长的。

  怎么分辨呢?当客户端第一次访问某个网站服务器的时候,网站服务器会给这个客户端的电脑发一个Cookie,放到这个电脑的某个区域,一般是C盘里。这个Cookie会分配给你一个独一无二的编号,还会记录一些你访问服务器的信息,例如访问时间,访问了什么网页,以及与你这次访问有关的其他一些信息。当你下一次再访问这个服务器的时候,服务器就可以直接从你的电脑上找到上一次它放进去的这个Cookie,并且会对它进行一定的更新,但那个独一无二的编号不会改变。如果一段时间内,服务器发现两个Visits的对应的Cookie实际上是一个编号,那么,服务器就知道,尽管在这段时间内有不少次Visits,但都来自于一个客户端,那么一定就是一个Visitor了!

  这个方法比上一个要更精确些。但是存在的问题是,有些客户端为了保证更高级别的安全,关闭了Cookie的功能,或者你经常删除Cookie,这个方法就不能奏效了。

  因此,这样看来,两个方法都只能得到UV的近似值,但是不能得到精确值。什么?想要百分之百精确?那……除非进行一次100%准确的普查(这实际上也是不可能的),或者只有上帝知道了。

网站分析的最基本度量(4)——PV (Page View)

20 一月 2008 35 COMMENTS

PV: Page view,表示客户端对一个页面的完整下载  PV,嗯,看起来和UV有点儿像,而且只差一个字母。后面一个V一定都是指Visitor吧!

  No!PV的意思是Page View,V是View的首字母,而不是指Visitor或Visit。【点击标题阅读全文】

  PV的汉语翻译过来是页面浏览,是可以被量化的(前面我们知道Visit和UV都是可以量化的,PV也一样)。1个PV是指从浏览器发出一个对网络服务器的Request(什么,不知道Request是什么?请看前面的文章吧!),网络服务器接到Request之后,会开始把该Request对应的一个Page(Page就是一个网页啦)发送到客户端的浏览器上,恭喜,这就是一个Page View了。是不是非常简单?

  用严格的语言怎么描述呢?是这样的:A page view (PV) or page impression is a request to load a single page of an Internet site. 意思是,一个PV指的是一次从网站下载一个页面的请求。因此只要是发出了一个请求,无论你是否完全打开(下载)了这个页面,都计入一次PV。

 

  还有一点差点忘了提,可能从上面的那句英语句子中你已经看到了,Page View还有一个说法Page Impression,呵呵,都一样哦!Page Impression还有一个简化说法,就是Impression,用的也是非常非常的多,看到它了不要装作不认识哦!

  PV实际上很容易理解,不过,与PV有关的还有一些概念。他们同样非常非常非常重要,是网站分析的重要KPI。分别是:Bounce Rate(蹦失率),Exit Rate(离开率),以及Loss(丢失),尤其是Bounce Rate,我们几乎每天都要跟它打交道。

  后面的内容会慢慢讲到的!

网站分析的最基本度量(5)——Bounce Rate

21 一月 2008 55 COMMENTS

  引言:“Bounce Rate = 只浏览了一个页面的Visits / 全部的Visits;

  换成英语是:Bounce Rate = Single Page Visits / Total Visits。”

  前面我们知道了一些最最基本的概念,现在要进入更重要的一些网站分析KPI了。怎么样?准备好了吗?【点击标题阅读全文】

  Bounce Rate,这个词很像NBA的某个跟篮板有关的名词哦,不过在网站分析里,它是什么意思呢?了解它之前,请回忆我们之前讲过的PV吧!

[转载请事先声明并得到许可,版权归作者所有。]

  在你点击某一个网站(假定它叫网站A)网页(假定它叫A.htm)上的链接(Link,可以是一段文字的Link,叫Text Link,或是一个图片Link,叫Banner或Pic,或是一个Flash等等)后,客户端会向网络服务器发送一个Request,以请求发送这个链接对应的页面,我们暂且将这个页面叫做“B.htm”,且B.htm是属于另外一个网站的,我们给这个网站起名叫B。那么,对于网站B而言,B.htm是该访问者访问B网站的“进入页面”(英语叫Entry Page,也就是你访问某个网站时的第一个页面)。这个时候,如果一切顺利,B.htm会逐渐打开了。

  为什么是逐渐呢?因为,传送数据需要时间,而且越是复杂的页面,需要传送的信息量越多,也就约需要花费时间,因此大多数的Web页面都是逐渐打开的。这个你一定会同意,不然我们也不用抱怨网络这么慢了。

  如果这个页面B.htm在逐渐打开的过程中,隐约露出了一些信息,你一看,这网站讲的是什么东西嘛,一点儿都没意思,看来我点错了。于是你啪的一下关了它,甚至它还没有来得及完全传送到你的浏览器上呢。这种情况,对于网站B而言,它就多了一次Loss。对于任何一个网站而言,Loss如果很多的话,那就说明它对Visitor的吸引力实在是很差很差哦!当然,Loss多也有另外一种情况,那就是很多误点击进入该站——现在很多广告banner做的像Windows的窗口,就是吸引你误点击的,我觉得这种banner其实根本一点儿用也没有。

Loss意味着有效访问的不断流失

  换一种情况,如果你并没有在B.htm还没有完全下载完之前关闭它,(真拗口,意思就是你让B.htm全部下载了,显示在你的浏览器中),这个时候B网站应该庆幸了,因为它没有从你这里获得一次Loss,不用伤心了。不过B网站悬着的心还不能放下来,什么呢?就是我们在一开始提到的Bounce

  Bounce是指,你在下载完B.htm进入B网站后,却没有用鼠标点击B.htm上面的任何链接(Link),就关闭了它。这对B网站而言就是一个Bounce。简单说,如果你成功进入一个网站,却没有点击它其上的任何链接,那么就为这个网站创造了一个Bounce。

 

  那么Bounce Rate是指对某个网站的访问中,“Bounce掉”的访问占总访问数量的百分比。计算的方法一般使用Visit来计算。即:

  Bounce Rate = 只浏览了一个页面的Visits / 全部的Visits;

  换成英语是:Bounce Rate = Single Page Visits / Total Visits。这也是Omniture等工具计算Bounce Rate的方法。

  这里要澄清另外一个Bounce Rate的计算方法:即 Bounce Rate = Single PV Visits / Total Visits,这是Google Analytics等工具的计算方法。

  与前者的差异在于,这个是单一PV的访问,而前者则是单一页面的访问。有什么区别呢?可以想一想,如果用户访问一个页面,没有点击这个页面上的任何一个链接,但是却用鼠标点击了浏览器的“Refresh”按钮,即刷新(Reload,或者Refresh)了当前页面,这个时候,这个visit对这个页面的PV就不再是1,而是2。这时对于Bounce Rate = Single PV Visits / Total Visits的计算方法而言,这个visit就不再是Single PV Visit了,也就不再算作一个Bounce。Google Analytics就是这样计算的。但是对于Bounce = Single Page Visits / Total Visits的计算方法而言,用户仍然没有链接到其他页面,因此仍然还是一个Single Page Visits,此时仍然会算作一个Bounce,Omniture则是这样计算的。

  因此,这说明Bounce Rate有两种理解(Single Page的理解和Single PV的理解)。我倾向于前者,也就是Omniture的计算方法,因为刷新页面对于网站所有者或者广告主而言,意义并不大。

  Bounce Rate是非常重要的,它显示了某个网站对于Visitor而言,到底有没有兴趣,或者有没有起到预计的效果。如果Visitor只是看到了你的网站,但是你所希望他们点击的链接都落空了,这就说明你的网站出了问题!真可怕,不是吗?

  Bounce Rate对于网络营销而言,是一个重要的指标(指针),它告诉你,即使你把Audience(网络营销的受众)都招来到了你宣传产品或品牌的网站上,也未必能获得你预期的效果,如果Visitor都Bounce掉了的话。

  后面马上就会有一个文章专门探讨Bounce Rate,题目是“为什么Bounce Rate是网络营销里的最重要指标”(中文版 English Version),如果有兴趣,你可以看看这篇文章,当然,内容是比较advanced(高级)的哦!

  哦,对了,还没有给Bounce Rate起一个中国名字,说实话,它还没有标准的中国名字呢!这倒是给了我机会,让我们叫它“蹦失率”吧!好像音和义都很恰切哦。:-)

 

 

 
 
分享到:
评论

相关推荐

    网站分析的基本度量

    通过实例详细解释针对网站的数据分析,对于网站的度量数据进行分析讲解,没一个数据的产生过程和计算结果 Time on page, Time on site, Engagement, Impression,Click,CTR, Bounce Rate, Exit Rate, Page View...

    点击流分析前整理的相关材料

    web日志格式 网站分析的基本度量 网站用户的识别 session与cookie的辨认

    matlab提取文件要素代码-Graph-centrality-measures-matlab:图中心度量矩阵

    您的分析将基于CoAuthorshipNetwork文件夹(可从本课程的电子学习门户网站下载)中包含的数据文件进行,主要侧重于开发MatLab代码以计算与网络组件相关的基本集中度度量,例如: 问题 I.亲密性 二。 中间性 三, ...

    数据分析报告.doc

    网站分析基本度量练习题 1一次visit什么情况下会变成两次? 两次点击鼠标的时间不能超过10分钟 2UV中的V代表什么英文单词? visitor 3如果网络分析软件记录你的网站一小时被访问10次visit=10,那么网站的UV=? visit...

    Tableau 数据可视化与实战 118课.txt

    112.项目二_网站用户行为分析_制作【用户访问行为分析】仪表盘 113.项目三_零售行业进销存分析_项目背景与需求分析 114.项目三_零售行业进销存分析_原始数据与素材准备 115.项目三_零售行业进销存分析_制作【货架图...

    Codereview 代码审查工具(国人开发)

    Measure(度量):度量代码基本要素; Naming(命名):审查变量命名情况; Comment(注释):审查文件、类、函数等的注释情况; Diagram(类图):显示类图; Halstead(复杂度):计算Halstead复杂度. 三、官方网站 ...

    一种数据驱动的方法来衡量网站的可导航性-研究论文

    在信息搜寻和信息处理理论的指导下,我们确定了在度量标准开发中应强调的基本可导航性维度。 因此,我们提出了三个以数据为驱动力的指标,即功率,效率和直接性,这些指标考虑了Web结构,使用情况和内容数据以衡量...

    企业数字化转型多版本合集(2001-2022)

    整理了基本上最常见的数字化转型的度量方式,全部都是目前为止最为常用的顶刊数据用法 ,具体数据说明如下(全部为2021最新版本) 一、吴非版本(2007-2021) 1、数据处理说明将文章整理的相关词汇分别分类为人工...

    Data-Mining培训资料.docx

    聚类分析时对类的划分主要采用的度量方式是距离, 通过距离来衡量数据间的相似度和相异度,同时数据间的相似系数也是数据分组的重要标准。 典型的聚类算法包括k-means 算法、PAM 算法、因素分析 、机器学习方法及...

    数据结构与算法(1).pdf

    10章 总计48学时(周四8-9节 5A402+1节网络自学) 考核: 期末闭卷考试(70%)+ 平时(期中考试、考勤、 作业)(30%) 1.1 什么是数据结构 1.2 基本概念和术语 1.3 抽象数据类型的表示与实现 1.4 算法和算法分析 ...

    matlab的素描代码-elefantempo:一个便宜的气象站,发布到Thingspeak以及一个相关的网站

    气象站是您可以在线上找到的最受欢迎的Arduino项目之一,因为它们使您可以从事基本的电路设计,传感器和一些C ++的工作。 ,同时为您的房屋添加一些有用的东西。 它们的范围从基本温度计和LCD到足球大小的全自动系统...

    Webblogparser:基于Red Hat的Kafka和Cassandra的Web博客解析器

    本课程向您介绍实时分析和基本流处理。 一些分析应用程序要求按需提供报告或可视化文件,通常在不到一秒的响应时间内,即与浏览大多数现代动态呈现的网站相当的体验。 用于此类分析的典型应用程序域是系统日志或...

    大数据驱动的人类移动模式和模型研究 (2014年)

    大数据时代的到来使得基于个体粒度的海量时空轨迹...总结了基于大数据的人类移动模式研究流程,归纳了人类移动模式的基本度量方法,探讨了解释所观测移动模式的模型构建方法,指出了地理环境对于移动模型建立的影响。

    曾鸣智能商业20讲笔记.docx

    我们可以视为第四次组织革命:创造力革命 五、新运营:"用户第一"是起点 未来所有的企业都要把用户第一作为自己运营模式的起点和基础 C2B是未来商业最基本的模式,客户驱动 为何只有互联网公司才能做到真正的用户第...

    Excel 2007数据透视表完全剖析 1/7

     本书由Mr.Excel等经验丰富的Excel专家执笔,图文并茂,内容详实,并在相关网站上提供了书中示例使用的Excel文件,可供读者练习操作时使用,非常适合中、高级Excel用户,以及公司中需要大量统计报表的工作人员。...

    Excel 2007数据透视表完全剖析 5/7

     本书由Mr.Excel等经验丰富的Excel专家执笔,图文并茂,内容详实,并在相关网站上提供了书中示例使用的Excel文件,可供读者练习操作时使用,非常适合中、高级Excel用户,以及公司中需要大量统计报表的工作人员。...

    Excel 2007数据透视表完全剖析 3/7

     本书由Mr.Excel等经验丰富的Excel专家执笔,图文并茂,内容详实,并在相关网站上提供了书中示例使用的Excel文件,可供读者练习操作时使用,非常适合中、高级Excel用户,以及公司中需要大量统计报表的工作人员。...

    Excel 2007数据透视表完全剖析 4/7

     本书由Mr.Excel等经验丰富的Excel专家执笔,图文并茂,内容详实,并在相关网站上提供了书中示例使用的Excel文件,可供读者练习操作时使用,非常适合中、高级Excel用户,以及公司中需要大量统计报表的工作人员。...

    JAVA上百实例源码以及开源项目

     Tcp服务端与客户端的JAVA实例源代码,一个简单的Java TCP服务器端程序,别外还有一个客户端的程序,两者互相配合可以开发出超多的网络程序,这是最基础的部分。 递归遍历矩阵 1个目标文件,简单! 多人聊天室 3...

    c语言编写单片机技巧

    Transform)、频谱分析、图像处理的分析等领域,DSP正在大量进入嵌入式市场。 18. MCU在射频控制时,MCU的时钟(晶振)、数据线会辐射基频或基频的倍频,被低噪放LNA放大后进入混频,出现带内的Spur,无法滤除...

Global site tag (gtag.js) - Google Analytics