到底什么是OOXML。。。


Posted on April 22, 2008


这段时间OOXML因为是否接受为标准的问题,大家讨论的沸沸扬扬,在cnBeta上,不时看到倪光南老先生 出来balabala...,最近因为要做Excel相关的东西,也开始对这个新的文档格式感兴趣,可是好长一段时间我都不知道OOXML是个什么东东? (我很土,我想在Excel 2007的另存格式列表中找到OOXML格式,表笑我啊)

Google之,ft,Wikipedia无法访问。百度之,在百度百科找到这样的解释:

OOXML全称是Office Open XML,OOXML是由微软公司为Office 2007产品开发的技术规范,现已成为国际文档格式标准,兼容前国际标准ODF(Open Document Format)和中国文档标准UOF(Unified Office document Format)。

O M G!这也太官方了,看得我云里雾里。于是继续换到Google,Search,皇天不负有心人啊,终于找到这篇文章,The New Excel 2007 File Format,终于是拨开云雾见月明。

现在按照我土人的理解,用土话来解释OOXML就是:所 有的Office 2007的默认文档格式(docx, xlsm等)的文件,都是一个zip压缩文件(不再是之前的二进制文件),其中包含的是多个xml文件和媒体资源文件等(比如Word中插入的图片)。而 所谓的OOXML标准,我的理解,就是定义如何用这些xml文件来表示Office文件。

下面,我们就来一步步地揭开Office新文件格式OOXML的真面目:

新建一个Word文档,添加一些内容,稍后我们将通过修改XML文件修改这些内容:

 

将新建的文档保存为docx格式:

 

修改docx文件的后缀为zip(这一步揭示了docx文件的本质,实际上它是一个zip压缩文件)

 

将zip文件解压缩,我们就可以看到一个docx文档的庐山真面目了,

 

找到Word目录下的document.xml文件,其中就有我们刚才在文档中输入的内容:

 

现在,我们尝试从XML文件修改docx的内容,用文本编辑器修改document.xml的内容:

 

然后在修改后的xml文件放回压缩包中,修改压缩包的后缀为docx,用Word打开这个文件,就可以看到我们修改后的内容了(这里要提示一下,我最开始使用WinRar和Windows浏览器未能成功,后来使用TotalCommander可以成功。)

大家看到了,Word文档的内容已经发生了变化,也就是说,我们可以不使用Word而创建docx文档了。


标签:N/A

 

在线学习答案查询入口
微信扫码联系
微信扫码联系