||
Docx和Doc格式的区别
doc是微软公司开发的Office2003中Word2003组件的格式,而docx是Office2007之后版本中Word使用的文档格式(包括目前使用的Office2007、Office2010和Office2013),用新的基于XML的压缩文件格式取代了其目前专有的默认文件格式,在传统的文件名扩展名后面添加了字母x(即docx取代doc、xlsx取代xls等)。
那什么是XML呢?
Extensible markup language;XML,中文翻译作:可扩展标记语言,用于标记电子文件使其具有结构性的标记语言,可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。大家常见到XML格式最多的就是网站地图Sitemap,大多就是用XML语言编写的,比如Cokery的博客的网站地图:www.cokery.com/sitemap.xml。大家可以打开看下是什么结构,其实XML语言可以看作是简单的结构语言,是HTML语言的进一步发展,没有HTML语言固有的标签形式,可以自定义标签内容。
为什么Office软件用到XML语言呢?
docx 格式的文件本质上是一个ZIP文件。将一个docx文件的后缀改为ZIP后是可以用解压工具打开或是解压的。事实上,Word2007的基本文件就是ZIP格式的,他可以算作是docx文件的容器。也就是说Docx格式的文档其实就是一个压缩包,把所有的文档内容进行分类压缩了,然后利用XML进行结构化标记,就形成了Docx格式的文档。
你可以用winrar打开该docx文件,打开后见到如下内容:
在Word文件夹下面有个document.xml文件,打开这个文件文本内容就在这个文件里,在media文件夹下面还有图片等其它文件。
这样你就可以明白为什么Docx为什么比Doc多个X了吧。
成都宠物论坛|手机版|成都宠物网搜索|百度|谷歌|宠我网 ( 蜀ICP备07500266号 )
GMT+8, 2024-3-29 15:38 , Processed in 0.117934 second(s), 17 queries .
© 2007 By www.Petovo.com Some rights reserved