一、前言
Office2003以上,Word可以以XML文本格式存储,这样就可以使用外部程序创建Word文件,而不需要使用Word的对象。也能够自由的打开分析Word文件,或者发布到自己的Web页面,或者其他更多应用。
1、一个典型的WordXML结构
1)可以是如下的样子:
xmlns:w="http://schemas.microsoft.com/office/word/2003/wordml"> World.  
可以用记事本创建一个文件,将上面的XML内容粘贴,并保存为helloworld.xml,在Office
Word中打开它,就能看到如上图所示的内容。
2)这是最简单的WordXML内容,它包括这几部分:
XML的声明和名称空间的指明:
version="1.0"?> xmlns:w="http://schemas.microsoft.com/office/word/2003/wordml"> 3)文档内容 2、基本节点类型 从body内可以看出,构成实际文本内容的有3中类型节点: 如果我们需要指明一个文本为粗体,需要怎么办呢?   2.0C 这样,我们就知道 w:val="40"/> w:ascii="Arial" w:eastAsia="Arial" w:hAnsi="Arial" /> 字体为粗体,尺寸为是40除2等于20相当于几号字体?,字体名称“Arial” 中的xml:space="preserve"从字面上理解是保持空格。 如果没有这内容的话文本的前后空格将会被Word忽略。 如果我们需要指定一个段的对齐方式,行距要怎么办呢? 这就要设置 w:val="right"/> w:lineRule="auto"/> … 对齐方向: 行距: 600是用行距的倍数乘240得出,如果是两倍行距,则是480。这儿应该是2.5倍行距。 由此可见,组装一个WordXML格式的文件是一件比较简单的事情。 将段属性包含在 将文本格式包含在 这儿的Pr是property的意思,表示这个块中是r(run)或p(paragraph)的格式设置。 一个WordXML的文件结束了吗?可以这样讲,但如果你双击刚才创建的XML文件,有很大机会不会由Word来打开它。 这是为什么呢? 我们还需要在合适的地方放置一条语句: 
 progid="Word.Document"?> HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Office\11.0\Common\Filter\text/xml 但是,加入这一条语句后,双击打开时,Word将会提示XML的格式不正确,虽然能打开。那是因为还有许多的内容没有声明。我们就先不加这条语句。 3、页面设置 下面内容设置了页的宽,高,和页的各边距。各项的值均是英寸乘1440得出: w:top="1440" w:right="1800" w:bottom="1440" w:left="1800" w:header="720" w:footer="720" w:gutter="0"/> 4、页眉页脚 下面内容设置了页的页眉页脚: w:sectPr wsp:rsidR="002C452C">  w:type="odd" > w:val="Header"/> Header   w:val="Footer"/> Footer   这两段都很直白,就不需要解释了。 5、文档设置 w:val="print"/> docPr,就是document property的意思了。 表示文档的视图是“print”,视图比例100% 二、完整的XML文件实例 三、其他关注 1、 "Office XML Handler" is the display name of the process MSOXMLED.EXE, which is locaded in C:\Program Files\Common Files\microsoft shared\OFFICE16 on my computer. It is used to open XML files (perhaps also other extentions?) and detect which MS Office program the file should be associated with (if any), and then open the file with that program. This is explained in https://stackoverflow.com/a/1569619/1858923 2、 DOM4J是 dom4j.org 出品的一个开源 XML 解析包。DOM4J应用于 Java 平台,采用了 Java 集合框架并完全支持 DOM,SAX 和 JAXP。 3、 XSLT、XPath和DOM的应用研究 1、 "Office XML Handler" is the display name of the process MSOXMLED.EXE, which is locaded in C:\Program Files\Common Files\microsoft shared\OFFICE16 on my computer. It is used to open XML files (perhaps also other extentions?) and detect which MS Office program the file should be associated with (if any), and then open the file with that program. This is explained in https://stackoverflow.com/a/1569619/1858923 1、 DOM4J是 dom4j.org 出品的一个开源 XML 解析包。DOM4J应用于 Java 平台,采用了 Java 集合框架并完全支持 DOM,SAX 和 JAXP。 2、 XSLT、XPath和DOM的应用研究
