內容一模一樣的兩份文檔,為什么會有格式的區(qū)別?同樣是Word,發(fā)給了對方,但對方打不開。原來,即使同樣是Word,有的結尾是doc,有的卻是docx,前者是二進制,后者是XML格式,在內部結構、功能支持及兼容性等方面都存在著顯著差異。
doc是Microsoft Word 97-2003版本所使用的默認文件格式,以二進制形式存儲,包括文本、圖像、格式設置等信息。雖然具有較強的穩(wěn)定性和兼容性,但是在編輯和保存時容易出現(xiàn)亂碼、格式丟失等問題,也不利于文件內容的檢索和修改。而docx作為2007版以后的默認文件格式,采用了基于XML的開放文件格式,實際上是一個壓縮文件,其中包含了多個文件和文件夾,以XML和ZIP格式存儲文本、圖像、樣式等信息。相比doc的體積更小,訪問速度更快。
同理,Excel表格的xls和xlsx也是二進制形式和XML的開放文件區(qū)別,xls最大支持65,536行、256列,而xlsx格式的文件最大支持1048576行、16384列,支持更多的函數(shù)和公式,更多的條件格式、數(shù)據(jù)驗證、圖標類型等,且采用了新加密算法,相比xls更加安全,格式的體積也較xls更小。
再分享一個Word文檔如何一鍵提取圖片的方法,當把docx格式改成rar后,它會自動變成一個“壓縮文件”,點擊提取壓縮包后,找到“media”文件夾,即可獲得Word文檔內所有的圖片和音頻素材,還不會影響圖片的質感,更能加快提取速度。如果不追求圖片質量,那么,可以直接將Word文檔另存為網(wǎng)頁格式,也能“一鍵”獲得所有圖片素材。