PDF 檔案格式簡介
PDF格式研究簡介檔案結構Stream 編碼轉為XML相關工具OpenPDF訊息相關網站參考文獻最新修改簡體版English |
PDF 是 Adobe 公司所制定的一種格式,其前身是該公司的 PostScript (PS) 格式,PS 格式乃是由 Adobe 公司的創辦人 John Warnock 所設計的,並於 1985 年正式發行,接著被 Apple 採用於 Cannon 印表機做為傳輸格式,此後 PS 就成了雷射印表機的內建格式,並因此而成為線上出版業的標準格式。 在 PS 被發明之前,點矩陣印表機是主要的電腦列印設備,雖然有些印表機可以列印圖形,但是其編碼格式並不統一,自從 PS 發明以來,迅速佔據了雷射印表機的市場並成為標準列印格式,該格式使得各種文字與圖形可以快速的傳給印表機並且被列印出來。 1990 年 Adobe 將 PS 簡化後發展出 PDF 格式,當時 Adobe 公司的 Acrobat PDF Reader 是要付費購買的軟體,後來為了與其他同類產品競爭,因而開放 PDF Reader 免費下載使用,從此 PDF 的使用群迅速擴大,而成為網路上最常用的文件格式。 然而、PDF 畢竟是 Adobe 公司的私有格式,而且採用二進位與純文字混合的編碼模式,因此並不像 XML 或 HTML 那樣容易處理,更複雜的是、PDF 並沒有採用 Unicode 等標準字元編碼方式,而是將字元透過 Adobe 公司內建的編碼表進行編碼,使得全文檢索程式無法直接對 PDF 文件進行檢索,因此、許多搜尋引擎都不支援 PDF 的搜尋功能,少數具有PDF搜尋功能的搜尋引擎(像是 Google),也都必須要自行開發程式以便將 PDF 文件轉換成文字檔以便搜尋,但是對大多數的程式設計人員來說,對 PDF 進行加值處理仍然困難重重。 |
page revision: 0, last edited: 19 Oct 2010 09:28
Post preview:
Close preview