6.1 DOM解析器
1.DOM标准
DOM(Document Object Model,文档对象模型)是W3C制定的一套规范标准,即规定了解析文件的接口。各种语言可以按照DOM规范去实现这些接口,给出解析文件的解析器。DOM规范中所指的文件相当广泛,其中包括XML文件以及HTML文件。我们已经知道,接口只关心功能,但不规定功能的具体实现,因此,在特定语言中使用DOM规范就需要定义DOM规范指定的接口,并给出实现这些接口的类的集合,这一过程称做语言绑定。本章主要讲述DOM规范的Java语言绑定。Java语言通过把DOM规范中的接口用Java的接口(interface)写下来,并给出实现这些接口的类集合来实现DOM规范的Java语言绑定(Java language binding)。
DOM规范指定了语言绑定需要实现的接口,简单地说,各种基于DOM规范解析器必须按照DOM规范在内存中建立数据,DOM规范的核心是树模型。对于解析XML文件的解析器,解析器通过读入XML文件在内存中建立一个树,也就是说XML文件的标记、标记的文本内容、实体等都会和内存中树的某个节点相对应。一个应用程序可以方便地操作内存中树的节点来处理XML文档,获取自己所需要的数据。
2.DOM解析器
我们主要介绍Sun公司的DOM解析器,Sun公司的解析器是支持DOM level 3的解析器。按照W3C制定的DOM规范,Sun公司发布的SDK1.5中提供了解析XML文件的API(Java API for XML Parsing,JAXP),JAXP实现了DOM规范的Java语言绑定,给出了DOM规范指定的接口,并给出实现这些接口的类集合。
可以登录到Sun公司的网站:http://java.sun.com,免费下载SDK1.5(例如:j2sdk-1_5_1-windows-i586.exe)。
首先让我们简单地了解一下JAXP,有关细节将分别讲述。
在JAXP中,DOM解析器是一个DocumentBuilder类的实例,该实例由Document BuilderFactory负责创建,步骤如下。
使用javax.xml.parsers包中的DocumentBuilderFactory类调用其类方法newInstance()实例化一个DocumentBuilderFactory对象:
DocumentBuilderFactory factory= DocumentBuilderFactory. newInstance();
factory对象调用newDocumentBuilder()方法返回一个DocumentBuilder对象(称做DOM解析器),例如:
DocumentBuilder builder=factory. newDocumentBuilder();
DocumentBuilder 类在javax.xml.parsers包中。
builder对象调用public Document parse(File f)方法解析参数f指定的文件,并将解析内容以对象的形式返回,该对象是实现了Document接口的一个实例,例如:
Document document= builder. parse(new File("price.xml")) ;
Document 接口在org.w3c.dom包中。
注意:如果想要DocumentBuilderFactory产生的DOM 解析器支持名称空间,可以让factory对象调用setNamespaceAware(boolean b)方法:
factory.setNamespaceAware (true);
对象Document是由实现了Node接口的类的实例构成的,这些实例称做Document对象中的节点。Document对象中的节点形成树状结构,也就是说XML文件的标记、标记的文本内容、实体等都会和对象Document中的某个节点相对应。现在,应用程序只要分析内存中的树状结构数据Document,就可以获得XML文件中的各种数据了。比如Document调用
NodeList getElementsByTagName(String str)
方法,返回一个实现了NodeList接口的对象,该对象也是由一些Node对象组成的,例如:
NodeList nodelist=document. getElementsByTagName("车次");
NodeList 接口在org.w3c.dom包中。假如XML文件中有两个名称为“车次”标记,那么
nodelist.getLength();
返回的值是2,即nodelist刚好含有2个Node对象。
DOM解析器经常使用下述3个方法解析XML文件:
public Document parse(File f) throws SAXException, IOException
public Document parse(InputStream in) throws SAXException, IOException
public Document parse(String uri) throws SAXException, IOException
方法parse(File f)可以解析参数f指定的XML文件,例如:
File f= new File("price.xml");
Document document= builder. parse(f) ;
方法parse(InputStream in)可以解析输入流参数in指向的XML文件,例如:
FileInputStream in=new FileInputStream("price.xml");
Document document= builder. parse(in) ;
方法parse(String uri)可以解析参数uri指定的一个有效的资源,如果uri是一个链接地址,该链接地址必须是可以访问的,例如:
String uri="http://192.168.2.1/price.xml";
Document document= builder. parse(uri) ;
| 回书目 上一节 下一节 |
|
· SQL Server入门到精通.. · 交换技术配置手册技术.. · 超级网管员——网络应.. · 网络服务器配置与应用.. · Linux集群技术自测试题.. · JavaSript核心技术自测.. |
· ARP攻击与防范技术自测.. · 国庆挑战自己参加自测 .. · 《网管员必读—网络应.. · 历次技术自测 获奖网友.. · 51CTO国庆七天技术自测.. · 9.2.2 无线AP |
|
|||
| · 网管系统介绍 · 网络管理系统如何支撑I.. · CISSP认证成长之路 · 51CTO国庆充电专题之好.. · 网络技术经典基础教程 · 51CTO主编推荐经典专题 · RAID——磁盘阵列基础 · 充电计划之热门IT认证.. |
· 51CTO技术自测 挑战自.. · AMD Phenom三核处理器.. · 国际文档格式标准开战 · 2007年互联网大会 · 我是黑客我怕谁——讲.. · ARP攻击防范与解决方案 · Solaris 10 配置管理 · Solaris基础知识入门 |
||
|
|||
| · Java基础教程 · VPN技术 · ARP攻击防范与解决方案 · SQL Server 2005全解 · SOA 面向服务架构 · SQL Server 2005全解 · Java编程开发手册 · RAID——磁盘阵列基础 |
· 三层交换技术专题 · SQL Server入门到精通 · Windows Server 2003企.. · Windows远程桌面应用 · C#技术开发指南 · VPN技术 · C#技术开发指南 · Solaris 10 配置管理 |
||
|
|||
| · ARP攻击防范与解决方案 · VPN技术 · SQL Server 2005全解 · Java基础教程 · SQL Server入门到精通 · SQL Server 2005全解 · SOA 面向服务架构 · Java编程开发手册 |
· C#技术开发指南 · 三层交换技术专题 · C#技术开发指南 · Windows远程桌面应用 · RAID——磁盘阵列基础 · Windows Server 2003企.. · 邮件服务器专题 · wimax技术与趋势 |
||
| ·DB2 Viper快速入门 ·DB2 9数据库的镜像分割与.. |
·将XML应用程序从DB2 8.x.. ·DB2 9中的pureXML:如何.. |
| ·服务器中的“傻瓜机”在.. ·盖茨也喜欢登录Youtube看.. |
· · |
| ·体验Windows Server 2008.. ·将超星图书转成PDF文档 |
·使用 Office Communicati.. ·VMware Workstation 6.01.. |
| ·强烈质疑“步行1公里就能.. ·国庆期间新闻回顾:微软.. |
·9月第3周回顾:微软和英.. ·9月第2周回顾:四核之战.. |
| · 华为、贝恩资本22亿美元.. · NGN:下一代网络 · 网络访问中断大排查 |
· 教你使用Anti ARP Sniff.. · 网络嗅探教程:使用Snif.. · 常见病毒手工清除方法大.. |
| · C++是垃圾语言?! · 2007年IT界七大抄袭事件 · Java实用开发全集 |
· 解析Ajax开发框架 走进A.. · 基于Google Maps与Ajax.. · 基于Google Maps与Ajax.. |
| · 热门 IT 培训认证官方资.. · Ubuntu 中文开源频道 · Solaris基础知识入门 |
· Google推出唯一硬件——.. · 硬盘之父获得诺贝尔物理.. · 理性面对四核服务器选购 |
| · 甲骨文Oracle 11g正式发.. · Oracle数据库开发之PL/S.. · Oracle数据库开发基础教.. |
· 硬盘之父获得诺贝尔物理.. · 存储2006,一个并购的大.. · IDC宣布浪潮蝉联存储市.. |