频 道 直 达 - 新闻 - 培训 - 软件 - 教程 - 前沿 - 组网 - 系统应用 - 安全 - 编程 - 存储 - 操作系统 - 数据库 - 服务器 - 专题 - 产品 - 案例库 - 读书 - 博客 - BBS
51CTO.COM_中国最大的网络技术网站
找资料:

24.2.2 使用SAX解析XML

作者: 杜江 出处:电子工业出版社博文视点  2007-10-31 14:06    砖    好    评论   进入论坛
阅读提示:《PHP5与MySQL5 Web开发技术详解》第24章主要内容是XML与RSS,本小节讲的是如何使用SAX解析XML。

24.2.2  使用SAX解析XML

SAX用于解析XML文档的接口,它是基于回调函数形式的调用。下面我们开始解析这个样例XHTML文档。

第一步,我们创建解析的对象。

$xml = xml_parser_create('UTF-8');

选择的参数是'UTF-8',告诉PHP SAX扩展使用什么字符集编码进行解析,如UTF-8、GBK/GB2312。

如果这个方法执行成功,将返回XML分析器句柄,可以再使用其他方法继续分析这个XML文档。

因为SAX工作于事件方式,在本例中需要设置该句柄,我们把焦点放在两个指定的句柄上:开始(start_handler)和结果(end_handler)标志,以及一个字符集句柄

    

(character_handler)。
xml_set_element_handler($xml, 'start_handler', 'end_handler');
xml_set_character_data_handler($xml, 'character_handler');

这些声明设置这个句柄,但必须在实行任何行为之前发生。让我们看这个句柄方法如何实现,在上次的声明中,开始句柄通过三个参数:XML解析器对象、命名标记和一个包含这个标记的属性的关联数组属性。

   

function end_handler ($xml, $tag){
global $level;
$level--;
echo str_repeat(' ', $level, ' '). "<<<$tag;
}

要使我们的测试脚本工作,我们需要使这个字符串句柄显示所有内容,如下。

    

function character_handler ($xml, $data){
global $level;
$data = split("\n", wordwrap($data, 76 – ($level * 2)));
foreach ($data as $line) {
echo str_repeat(($level + 1), ' '). $line. "\n";
}
}

之后,我们开始实现所有的句柄操作,可以开始解析XML文件。

    xml_parse($xml, file_get_contents('test1.xhtml'));

上面的回调函数输出的结果是这个样子的。

   >>>HTML XMLNS='http://www.w3.org/1999/xhtml' XML:LANG='en' LANG='en'
||
||
| |
>>>HEAD
||
||
| |
>>>TITLE
|XML Example|
<<<TITLE

可以看到,输出结果看来不是很美观,里面还有很多空白数据和无用的字符。我们可以把所有的结果数据放在一个缓冲区中,只输出有开始和结果标签的数据项,如下面的脚本。

    

<?php
/* 初始化变量 */
$level = 0;
$char_data = '';
/* 创建分析的对象实例*/
$xml = xml_parser_create('UTF-8');
/* 设置句柄 */
xml_set_element_handler($xml, 'start_handler', 'end_handler');
xml_set_character_data_handler($xml, 'character_handler');
/* 开始解析XML文件 */
xml_parse($xml, file_get_contents('test1.xhtml'));
/**
* 从字符串句柄中缓存收集数据
*/
function flush_data () {
global $level, $char_data;
/* 去掉数据中的多余空格 */
$char_data = trim($char_data);
if (strlen($char_data) > 0) {
echo "\n";
// 重新包装数据,使之适合屏幕显示
$data = split("\n", wordwrap($char_data, 76-($level *2)));
foreach ($data as $line) {
echo str_repeat(' ', ($level +1))."[".$line."]\n";
}
}
/* 清除缓存中的数据*/
$char_data = '';
}
/*
* 处理开始的标志
*/
function start_handler ($xml, $tag, $attributes) {
global $level;
/* 从字符处理句柄中刷新收集到的数据 */
flush_data();
/* 例出XML属性为一个字符串 */
echo "\n". str_repeat(' ', $level). "$tag";
foreach ($attributes as $key => $value) {
echo " $key='$value'";
}
/* level变量递增1 */
$level++;
}
function end_handler ($xml, $tag){
global $level;
/* 从字符处理句柄中刷新收集到的数据 */
flush_data();
/* level递减1,并打印结束标志 */
$level--;
echo "\n". str_repeat(' ', $level). "/$tag";
}
function character_handler ($xml, $data){
global $level, $char_data;
/* 增加字符数据到缓冲区 */
$char_data .= ' '. $data;
}
?>

下面是输出的结果。

    

HTML XMLNS='http://www.w3.org/1999/xhtml' XML:LANG='en' LANG='en'
HEAD
TITLE
[XML Example]
/TITLE
/HEAD
BODY BACKGROUND='bg.png'
P
[Moved to]
A HREF='http://example.org/'
[example.org]
/A
[.]
BR
/BR
[foo & bar]
/P
/BODY
/HTML

【责任编辑:杜书 TEL:(010)68476606】

回书目   上一节   下一节
专题
解析35岁技术人的价值与出路
AMD Phenom三核处理器解析
解析Ajax开发框架 走进Ajax开发应用
IBM System i5全内置服务器解析
XML可扩展标识语言详解
我也说两句

匿名发表

(如果看不清请点击图片进行更换)


中 国 最 大 的 网 络 技 术 网 站 ·
技 术 成 就 梦 想
订阅技术快讯
电子杂志下载
名称:SQL Server数据库管理精品黄皮书
简介:书中文章经过精挑细选,便于用户能根据自己的实际工作和学习,快速在本书寻找到相关资料。内容涵盖了SQL Server的安装与升级、语句查询、数据备份和恢复、自动化任务、数据同步、数据字典、安全和预防、性能和优化、集群等各方面应用信息,以及DBA管理人员在数据库管理工作中
名称:2007路由技术大全
简介:《2007路由技术大全》由51CTO.com网站特别策划制作,该书包括路由器技术、路由器产品、路由器配置、安全设置、路由器故障处理、路由器密码恢复,以及广大网友在实践使用中的心得经验和技巧文章,内容注重实用性,适用于初学者入门,也适合多年从业者提高,是一本实践和理论完
名称:网络安全精品应用黄皮书
简介:《2007精品网络安全黄皮书》包括了9个大类24个小类, 800余篇文章,内容包含了熊猫烧香病毒、DDOS攻击、ARP病等热点问题的介绍及解决方案。从病毒查杀、防范、系统、数据等各方面的安全设置到黑客技术的了解、防范,涉及到了安全应用的全部领域, 由浅至深内容全面。
浏览器的战国时代
浏览器的战国时代
ARP攻击防范与解决方案
ARP攻击防范与解决方案
NAC安全访问控制
NAC安全访问控制
· NAC安全访问控制
· 网络布线测试仪器
· Windows Server 2008专..
· Windows远程桌面应用
· 网络故障排除宝典
· 运营商封堵ADSL共享 中..
· 解析35岁技术人的价值..
· 世纪枭雄比尔盖茨的王..
· 主流品牌防火墙配置
· ASP.NET开发教程
· 超级计算机TOP500专题
· Vista SP1对决XP SP3
· SQL Server 2008/2005..
· 程序员如何成长?
· C#技术开发指南
· 虚拟化技术还有点“虚”
ARP攻击防范与解决方案
ARP攻击防范与解决方案
SQL Server 2008/2005全解
SQL Server 2008/2005全解
SOA 面向服务架构
SOA 面向服务架构
· SOA 面向服务架构
· SQL Server 2008/2005..
· Apache技术专题
· 三层交换技术专题
· SQL Server入门到精通
· Windows远程桌面应用
· C#技术开发指南
· Apache技术专题
· Windows集群服务应用
· C#技术开发指南
· 国际文档格式标准开战
· 路由器设置与口令恢复
· Linux 集群技术专题
· PHP开发应用手册
· SOA 面向服务架构
· 企业数据恢复指南
ARP攻击防范与解决方案
ARP攻击防范与解决方案
SQL Server 2008/2005全解
SQL Server 2008/2005全解
SQL Server入门到精通
SQL Server入门到精通
· SQL Server入门到精通
· SQL Server 2008/2005..
· SOA 面向服务架构
· Apache技术专题
· C#技术开发指南
· 三层交换技术专题
· Apache技术专题
· C#技术开发指南
· Windows远程桌面应用
· 企业数据恢复指南
· Windows集群服务应用
· 路由器设置与口令恢复
· Linux 集群技术专题
· SOA 面向服务架构
· 了解统一威胁管理(UTM)..
· 反垃圾邮件技术应用