PDF 檔案格式簡介

PDF格式研究

簡介

檔案結構

Stream 編碼

轉為XML

相關工具

OpenPDF

訊息

相關網站

參考文獻

最新修改

簡體版

English

PDF 是 Adobe 公司所制定的一種格式,其前身是該公司的 PostScript (PS) 格式,PS 格式乃是由 Adobe 公司的創辦人 John Warnock 所設計的,並於 1985 年正式發行,接著被 Apple 採用於 Cannon 印表機做為傳輸格式,此後 PS 就成了雷射印表機的內建格式,並因此而成為線上出版業的標準格式。

在 PS 被發明之前,點矩陣印表機是主要的電腦列印設備,雖然有些印表機可以列印圖形,但是其編碼格式並不統一,自從 PS 發明以來,迅速佔據了雷射印表機的市場並成為標準列印格式,該格式使得各種文字與圖形可以快速的傳給印表機並且被列印出來。

1990 年 Adobe 將 PS 簡化後發展出 PDF 格式,當時 Adobe 公司的 Acrobat PDF Reader 是要付費購買的軟體,後來為了與其他同類產品競爭,因而開放 PDF Reader 免費下載使用,從此 PDF 的使用群迅速擴大,而成為網路上最常用的文件格式。

然而、PDF 畢竟是 Adobe 公司的私有格式,而且採用二進位與純文字混合的編碼模式,因此並不像 XML 或 HTML 那樣容易處理,更複雜的是、PDF 並沒有採用 Unicode 等標準字元編碼方式,而是將字元透過 Adobe 公司內建的編碼表進行編碼,使得全文檢索程式無法直接對 PDF 文件進行檢索,因此、許多搜尋引擎都不支援 PDF 的搜尋功能,少數具有PDF搜尋功能的搜尋引擎(像是 Google),也都必須要自行開發程式以便將 PDF 文件轉換成文字檔以便搜尋,但是對大多數的程式設計人員來說,對 PDF 進行加值處理仍然困難重重。

Facebook

Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-NonCommercial-ShareAlike 3.0 License