|
|
|
|
移动端

8.4.12 日志分析

《Linux服务器配置全程实录》第8章配置Web服务器,在本章中将介绍通过Apache配置HTTP、HTTPS、WebDAV、反向代理、安全配置、多种用户认证方式、虚拟主机,JSP环境搭建,LAMP环境搭建以及使用Lighttpd实现HTTP、HTTPS、虚拟主机等的相关内容。本节为日志分析。

作者:张勤/杨章明来源:人民邮电出版社|2011-08-11 09:08

年前最后一场技术盛宴 | 1.27与京东、日志易、美团技术大咖畅聊智能化运维发展趋势!


8.4.12  日志分析

在网站搭建完成后,作为一个网站的管理人员经常需要查看一个网站的访问记录,比如每一个网页的浏览次数、浏览的停留时间等,通过这些信息可以更好地对网站的内容作出调整。在Apahce的日志中对这些信息都有非常详细的记录,但在Apache的日志中只有一笔一笔用户浏览网页的记录,这时需要使用一些工具来分析记录文件,让这些记录文件能更易于阅读。

Webalizer(Webalizer官方网站:http://www.webalizer.org/)可以读取Apache 的日志文件,并将分析结果从网页的形式显示,让网站的管理人员可以轻松的了解每一个页面的访问情况。由于 Webalizer所进行的分析是读取日志文件,因此日志文件的数据越多,分析出来的结果也就越详细。Webalizer配置过程如下。

(1)安装Webalizer所需软件包。

  1. yum -y install gd-devel.i* 

(2)下载Webalizer(下载地址:ftp://ftp.mrunix.net/pub/webalizer/webalizer-2.21-02- src.tar.bz2)源码包后,使用如下命令编译安装。

  1. tar -xvjf webalizer-2.21-02-src.tar.bz2  
  2. cd webalizer-2.21-02  
  3. ./configure --with-language=simplified_chinese 
  4. make  
  5. make install  

(3)复制Webalizer配置文件模板并建立Webalizer统计结果输入目录。

  1. cp /usr/local/etc/webalizer.conf.sample 
    /usr/local/etc/webalizer.conf  
  2. mkdir /var/site/webalier  

(4)在/usr/local/etc/webalizer.conf文件中修改如下参数。

  1. LogFile        /var/log/httpd-access.log    ①  
  2. OutputDir      /var/site/webalier               ②  

其中各行含义如下。

①:指定Apache访问日志目录。

②:指定Webalizer统计信息输出目录,实际上Webalizer是一个C语言编写的程序,可以读取其他服务的日志后,将统计结果以网页的形式输出到指定目录。

(5)在/usr/local/etc/webalizer.conf中如下可选参数。

LogType <clf|ftp| squid>:指定Webalizer读取的日志格式,clf表示Web数据,ftp表示 FTP服务日志,squid表示代理服务日志,该参数默认为clf。

Incremental <yes|no>:由于Apache日志可能被删除,而当Incremental被设置为yes时,Webalizer只更新增加部分的日志,而分析过的日志就不再分析,这样可以避免覆盖统计过的数据,该参数默认为no。

IncrementalName <webalizer.current>:当Incremental被设置为yes时指定新增统计数据的存放目录。

ReportTitle <标题>:指定生成分析结果网页的标题

HostName <FQDN>:指定主机名。

HTMLExtension <扩展名>:指定生成分析结果网页的扩展名。

PageType <扩展名>:在一个网站中会有很多文件,而这些文件并不是所有都需要进行统计,通过该参数可以指定Webalizer需要分析的文件扩展名,在指定时可以使用通配符。

UseHTTPS <yes|no>:当指定为yes时,只有使用HTTPS时才可以访问到Webalizer生成的分析结果网页。

DNSCache <dns_cache.db>:Webalizer在分析日志时有可能需要查询DNS,通过指定一个DNS缓存文件可以提高DNS查询的效率。

DNSChildren <进程数>:指定Webalizer使用多少个进程进行DNS查询,可以设置为最大100个进程,该参数默认为0。

HTMLPre <HTML代码>:指定每个生成分析结果网页开头第一行要插入的字符,最长80个字符。

HTMLHead <HTML代码>:指定每个生成分析结果网页<HEAD></HEAD>中间要插入的字符,最长80个字符。

HTMLBody <HTML代码>:取代生成分析结果网页中的<BODY>这个标签,最长80个字符。

HTMLPost <HTML代码>:将指定字符插入分析结果网页中的第一个<HR>标签之后,最长80个字符。

HTMLTail <HTML代码>:指定每个生成分析结果网页结尾处要插入的字符,最长80个字符。

HTMLEnd <HTML代码>:指定每个生成分析结果网页最后结尾处要插入的字符,在指定该参数时至少需要包含"</BODY></HTML>",最长80个字符。

Quiet <yes|no>:指定在执行webalizer命令时,是否显示输出信息。在使用Webalizer时可以结合crontab定时生成统计分析网页,而在使用crontab时一般不会要求显示命令执行输出信息。

ReallyQuiet <yes|no>:指定在配置文件有错误产生时,是否输出信息。

TimeMe <yes|no>:指定在分析之后是否要输出时间。

GMTTime <yes|no>:指定是否要使用"GMT (UTC)"时间而非本地时间。

Debug <yes|no>:指定是否输出调试信息。

FoldSeqErr <yes|no>:指定Webalizer在读取指定服务日志时,是否忽略日志的错误。

VisitTimeout <时间>:指定Session 的过期时间,单位为秒,该参数默认为30分钟。

CountryGraph <yes|no>:指定显示分析数据中关于国家的统计数据是否要显示。

将Webalizer的输入目录配置为一个网站后,访问该网站可以查看Webalizer的统计结果,如图8-48所示。

 
图8-48  Webalizer统计结果
【责任编辑:云霞 TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

读 书 +更多

超级网管员——网络设备

本书深入细致地介绍了用于构建网络的最重要的硬件设备——交换机、路由器、安全设备和无线设备,涵盖了原理、参数、分类、适用、规划、接口...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊