|
|
|
|
移动端

1.14.4 用AWStats 监控网站流量(1)

《UNIX/Linux网络日志分析与流量监控》第1章网络日志获取与分析,本章将介绍如何获取并分析各类系统的日志。学习好本章内容,将为后续章节的案例分析打下良好的基础。本节为大家介绍用AWStats 监控网站流量。

作者:李晨光来源:机械工业出版社|2014-11-26 19:33

开发者盛宴来袭!7月28日51CTO首届开发者大赛决赛带来技术创新分享

1.14.4 用AWStats 监控网站流量(1)

目前开源的日志分析软件有很多,比如AWStats、Webalizer 和Analog 等。下面重点介绍一下网站日志分析工具AWStats。它是用Perl 编写的,可以分析的日志格式包括APache的两种日志格式(NCSA combined/XLF/ELF 或common/CLF)、WebStar、IIS(W3C)、邮件服务和一些FTP 服务的日志,并产生HTML 页面和图表。与其他开源日志分析软件相比,AWStats 具有以下鲜明的特点:

1)界面友好、美观。

2)输出项目非常丰富,比如对搜索引擎和搜索引擎机器人的统计是其他软件少有的。

3)入门非常简单,首次使用仅需要修改配置文件4 处即可。

4)良好的扩展性,有不少针对AWStats 的插件。

5)与基于C 语言的日志分析软件相比,AWStats 分析日志的速度稍慢。

通过AWStats 分析日志,用户可以看到以下数据:访问人次和访问网站的IP 总数,访问者和访问网站的独立IP 数,网页数(即访问所有网页的次数)、文件数和字节,每个IP的访问次数,访问的文件类型,访问所花费的时间;访问者从什么URL 连接过来,操作系统和浏览器类型,搜索引擎机器人的访问次数,从哪个搜索网站跳转过来的次数等信息。

1.安装AWStats

AWStats 的安装很简单,把AWStats 的Perl 脚本复制到Apache 的CGI 目录即可。安装环境必须是支持Perl 的操作系统,带有Perl 的Linux 一般没有问题。

首先从AWStats 官方网站http://www.awstats.org/下载最新版本(7.4)。下载并解压,包括以下几个文件和文件夹:

docs 文件夹包括HTML 格式的文档,叙述AWStats 的安装和用法。

README.TXT 是该软件的介绍和版权信息等。

tools 文件夹里面是一些脚本和配置文件,比如批量Update 的脚本、转换静态HTML 文件的脚本、httpd.conf 的配置文件等。

wwwroot 文件夹最为重要,里面是AWStats 的主要程序。

wwwroot 文件夹里面又有5 个子文件夹,分别为AWStats、css、js、icon 和classes。真正需要使用的只有AWStats 和icon 文件夹。AWStats 文件夹中是AWStats 的主程序,而icon是AWStats 需要用到的一些图片和图标。如果可以控制服务器,并且能更改Apache 服务的配置文件,那么可以使用tools 目录下面的AWStats_configure.pl 脚本进行安装。AWStats_configure.pl 脚本是一个交互式的脚本,运行脚本后会自动检查安装目录和权限等,一般情况下只需要指定Apache 的配置文件hffpd.conf 的位置,即可完成安装。

如果使用的是虚拟主机,并没有完全控制Apache 的权限,那么只需将wwwroot/AWStats 文件夹放置在具有CGI 权限的目录下,比如http://www.website.com/AWStats 站点,将wwwroot/icon 目录复制到网站的根目录下即可完成安装。

2.配置AWStats

首先需要为站点建立配置文件。在wwwroot/AWStats/目录下有—个AWStats.model.conf配置文件,将其改名为AWStats.www.website.com.conf。然后编辑该配置文件,有几个选项是必须修改的,下面逐一列出。

(1)LogFile

该选项指定了日志文件的路径和名称,比如:

  1. Logfile="/home/apache_loga/access.log.2012-07-06" 

也可以使用动态的变量指定:

  1. LogFile="/home/apache_loga/access.log.%YYYY-24-%MM-24-%DD-24" 

如果Apache 做过轮询,就可以自动取得上一天的日志。另外,如果日志文件是压缩的,也可以在这里直接使用命令进行读取,而无需解压,比如:

  1. LogFile="gzip-d</var/log/apache/access.log.gz" 

(2)LogType

该选项指定需要分析的日志类型。

W 表示Web 服务日志。

S 表示流媒体服务日志。

M 表示邮件服务日志。

F 表示FTP 服务的日志。

(3)LogFormat

LogFormat 参数指定使用的日志格式。

1 为NCSA combined/XLF/ELF 格式,也就是Apache 中的combined 格式日志。

2 为IIS 或ISA 格式。

3 为WebStat 格式。

4 为NCSA common/CLF 格式,也就是Apache 中的common 格式的日志。

除了这4 种默认的日志格式,还可以自定义要分析的日志格式。比如,IIS 和Apache 就可以自行对日志进行定义,要分析这样的日志必须使用与其相对应的格式,如下面这样的格式:

  1. LogFormat="%host%other%logname%them1%methodurl%code%bytesd%referquot%uaquot" 

(4)SiteDomain

SiteDomain 参数指定站点名称,此处指定为“www.website.com”。

(5)HostAliases

HostAliases 参数表示,如果站点有其他的域名,并且希望得到它们的统计数据,就可以用此参数指定,一并计算入内,例如指定

  1. HostAliases="localhost127.O.0.1REGEX[website\.com$]" 

喜欢的朋友可以添加我们的微信账号:

51CTO读书频道二维码


51CTO读书频道活动讨论群:342347198

【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

读 书 +更多

Microsoft SQL Server 2005技术内幕:存储引擎

本书是Inside Microsoft SQL Server 2000的作者Kalen Delaney的又一经典著作,是Inside Microsoft SQL Server 2005系列四本著作中的一本。...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊