archive.org 的網路時光機

作品

書籍

課程

程式集

小說集

論文集

散文集

影片集

編輯雜誌

程式人

電子書

JavaScript

計算語言學

微積分

Blender 動畫

C# 語言

系統程式

高等 C 語言

Java

Android

Verilog

Wikidot

R 統計軟體

機率統計

計算機數學

組合語言

人工智慧

開放原始碼

網路資源運用

計算機結構

相關訊息

常用工具

友站連結

在家教育

RSS

最新修改

網頁列表

簡體版

English

1996年四月,數百萬的機器人程式(用來「網羅」、或說自動搜索並儲存網路網頁內容而設計的電腦程式)開始在網路上運行。頁複一頁,這些「機器人程式」將網路的資訊複製到位於舊金山Presidio的電腦上。每當他們完成一次對全部網路頁的複製,這些「機器人程式」就重新開始。周而復始,每兩個月這些程式複製並儲存網路一次。

到2001年10月為止,「機器人程式」已經收集了過去5年的網頁副本。在加州柏克萊有一次小小的公告:這些副本所構成的資料庫,網路檔案庫(Internet Archive),正式向世界開放。利用一種被稱之為「返程機器(the Way Back Machine)」的技術,你可以進入一個網頁,瀏覽從1996年以來這個網頁的所有副本,以及網頁被修改的時間。

「1984」的作者Orwell應該會對網路的這個發明讚許有加。據他在「1984」一書中對反理想國的描述,舊報紙被持續不斷的更新以保障當下的觀點是被政府首肯的觀點,而且不與以前的新聞報導相悖。數以千計的工人們持續不斷的重新修訂著過去,意味著我們無從考據今天看到的故事是否是當年報導的真相。

網路存在著同樣的問題。今天打開一個網頁,你無從知曉現在讀到的內容和你以前看到的是否相同。網頁看起來沒變,但是內容卻可以輕易的被改變。網路恰如Orwell書中提到的圖書館:持續不斷的更新,缺乏可靠的回憶。

直到「返程機器」(至少是借助於「返程機器」)和它的資料庫網路檔案庫的發明,你才能夠看到過去的網路是個什麼樣子。你才有權利瀏覽你所記憶的資訊。更重要的是,你還有權利發現那些你並不知道而恰恰有些人渴望你遺忘的資訊。

我們把回顧自己曾經閱讀的東西視為理所當然。以報紙為例,如果你想研究家鄉報紙對1965年發生於Watts的種族暴動,或者1963年Bull Conner的高壓水龍頭的反應,你可以到當地的公共圖書館直接查看當時的報紙。那些報紙可能以微縮膠片的形式保存。如果你夠幸運,或許還能找到那些報紙。不管透過哪種方式,你可以自由的使用圖書館回到過去並回憶;不只是方便記憶的那些資料,而是更為貼近真實的內容。

據說忘記歷史的人註定要重蹈覆轍。這話不完全準確。我們所有人都在忘記歷史。關鍵是我們是否擁有找出所遺忘真相的方法。更直接的說,關鍵在於是否有客觀存在的事實來讓我們可以保持誠實。圖書館透過為學生,為研究專家,為老奶奶搜集保存資料來達成這一目標。一個自由社會應該具備這樣的知識庫。

網路是這個假設的例外。在網路檔案庫出現以前,我們無法回頭查詢。網路本質上是種暫時性的媒體。不過,當它在社會的建立和重建過程中的左右越來越重要時,保存網路的歷史本來面目也變得日漸重要。難道這不奇怪嗎?我們在世界的各個角落有數不勝數的報紙存檔,卻僅僅由網路檔案庫保存了唯一的一份網路的副本。(朱註:我去拜訪過這個單位,未來應該還會跟他們有合作,但他們目前的資料以英文為主)

Brewster Kahle是網路檔案庫的發起人。他在成為一位成功的電腦研究者後,進而成為一位成功的網路創業者。在1990年左右,Kahle認為自己已經賺了夠多錢,因此希望在其他領域尋找成功。因此,他發起了一系列對人類的知識進行存檔的計劃。而網路檔案庫不過是他龐大的網路圖書館中第一個專案。到2002年12月為止,這些副本頁面數量已達100億,同時以每個月10億頁的速度遞增。

「返程機器」可算歷史上對人類所掌握的知識一次最大的存檔。截至2002年底,它已經達到「230000GB」的大小,大概「超出國會圖書館館藏10倍」。而這不過是Kahle計畫的檔案庫中的第一個部分。除了網路檔案庫,Kahle也在建造電視檔案庫。事實證明,電視比網路還要稍縱即逝。儘管大部分二十世紀文化的建立借助於電視媒體,但只有極小部分向大眾開放。感謝著作權保護法中一個極其具體的例外,Vanderbilt大學得以每天晚上錄製3小時的新聞節目。錄製的內容被編制索引,研究學者可以付少量費用來查看。「但是除了那些,電視幾乎無人可以接觸到,」Kahle向我表示,「如果你是Barbara Walters(美國資深新聞工作者),你可以接觸到那些電視檔案,但如果你不過是個研究生怎麼辦?」

你還記得Dan Quayle跟Murphy Brown一起出現在螢幕上的景象嗎?這個是政治家跟虛構的電視角色互動的驚人景象。如果你是個打算研究這一幕的研究生,你想看到這兩人的互動畫面,或是緊隨其後的『60分鐘』節目,基本上這是不可能的,這些內容幾乎是找不到。

為什麼這種情況會發生?為什麼被記錄於報紙上的文化可以隨時的被查詢,而記錄在錄影帶上的就不行?我們怎麼會建立起這樣一個世界:進行媒體對於19世紀美國影響的研究比20世紀的研究的要輕易的多?

部分是因為法律的規範。在美國著作權保護法的初期,著作權人被要求將副本存放於圖書館中。這項條例用意不僅在於保證知識的傳播,更保證了在著作權過期以後,仍有副本存在,以便其他人閱讀或複製。

這些條例原本同樣適用於電影。但是在1915年,國會圖書館對電影作出了一項特殊規定。唯有圖書館存有副本,電影才能登記著作權。但是電影製作者同時被允許從圖書館將副本免費並且無期限的借回。僅1915年一年,就有超過5475部電影被送交副本然後「借回」。因此,當這些電影的著作權到期以後,任何圖書館中都不再有副本。即使真的還有副本,那些副本也僅存在於電影公司的館藏之中。

電視基本上也是如此。電視播放之初是沒有著作權的,根本沒有截取電視播放的手段,也就不必擔心電視播放被「盜版」。但當相關科技成熟到可以錄影以後,電視公司開始逐漸依賴於法律的約束。法律要求他們對享有著作權的作品作副本。可是這些副本還是把持在電視發行公司手中。圖書館對這些副本沒有保存的權利,政府沒要求這個。這一段美國文化的內容對任何想瞭解的人而言都是隱形的。
Kahle致力於糾正這一錯誤。在2001年9月11日以前,他和他的盟友們已經開始截取電視節目。他們在全球選取了20家電視台,開始錄影。在911以後,Kahle同眾多合作者一起在全球選取20家電視台,從2001年10月11日起,將他們在911那一周內的新聞報導免費在網上發佈。任何人都可以看到世界某處是如何報導那一天的事件的。

Kahle想對電影採取同樣的措施。在與Rick Prelinger合作下,Kahle建立了「電影檔案庫」。Prelinger的電影收藏包括大概45000部「短片」(指那些非好萊塢製作,沒有限制著作權的電影)。他讓Kahle將自己收藏中的1300部電影數位化,然後上傳到網路上供人免費下載。Prelinger的公司是營利性,主要是將那些電影收藏的拷貝作為「畫面資料庫」(stock footage)出售。Prelinger發現,在他製作一大批免費拷貝以後,他的「畫面資料庫」生意變得出呼意料的好。人們可以方便的發現他們希望使用的材料。有些人下載那些短片,同時進行自己的創作。另外一些人購買拷貝,製作其他的電影。不管採取哪種方式,這些檔案庫讓大眾有機會接觸到我們文化中這個重要的組成部分。想觀看一份教孩子們如何在核戰中保護自己的電影Duck and Cover的拷貝嗎?直接去archive.org,你可以在幾分鐘之內下載這部電影,免費。

Kahle在此又再一次的提供了我們平常根本很難接觸到的文化層面。這又是另一部分定義了二十世紀的文化,現在卻失落入歷史的角落。法律並不要求任何人保留這些副本,或是由任何人儲藏到資料庫中。因此,根本沒有簡單找到這些資料的方式。

因此,在這裡的問題根本不是價格,而是取得的管道。Kahle希望能夠讓大家可以自由取用,但他也同時希望人們可以販賣這些資料庫的使用權。他的目標是確保在取用這個文化時是有競爭的。關鍵不是在於創作資產的商業週期,而是在於所有創作資產都該有的第二輩子:非商業化的授權。

這裡的概念我們應該更清楚的探究。每個創作資產都有不同的生命週期。如果作者運氣好,在它的第一世就是商業週期。在這些案例中商業市場對原作者來說是成功的。大部分的創作資產並不曾享受過這種成功,但顯然有部分作品很成功。對於這些作品來說,商業週期視極為重要的。有許多人認為,沒有商業市場只會讓創作力衰微。

在創作資產的商業生命週期結束之後,我們的傳統通常都支持它有第二個生命週期。報紙會每天將新聞送到每一個家庭的門前。第二天這些報紙救被拿來包魚或是易碎的禮物或者是拿來建立我們的歷史資料庫。在這第二個生命週期中,資訊依舊可以被使用,即使這資訊已經不再被販賣。

書的情況也是一樣。一本書很快就絕版(目前的平均大約是一年)。在它絕版之後,這本書還是可以在二手書店販賣,原作者一毛錢都拿不到,或者這本書也可以被儲藏在圖書館中,讀這本書的人也同樣不需要付錢。二手書店和圖書館也就是一本書的第二個生命週期。這個第二生命週期對於文化的穩定和散佈相當重要。

但是,二十世紀和二十一世紀流行文化最重要的部分卻越來越難確保它擁有穩定的第二生命週期:電視、電影、音樂、廣播、網路;根本無人能夠保證它有第二週期。對這些文化來說,我們似乎是用書店取代了圖書館。對這些文化來說,還能夠取用的僅剩下那些市場有需求的創作,其他的創作則都消失了。

在二十世紀的大半時間中,造成這現象的是經濟需求。收集和開放所有電視、電影及音樂的副本價格將會無比的高昂;類比儲存系統的成本貴到難以想像。即使就理論上來說,法律限制了Brewster Kahle複製一般的文化,但真正的限制其實是經濟和成本上的限制。
市場供需大家對這種文化束手無策,法律實際上並沒有產生多少效用。

或許數位革命所帶來的最重要關鍵是自從亞歷山大圖書館之後,我們首次可以想像建造一個儲存人類所有製造和傳播文化的公開資料庫。科技讓我們可以想像出一個儲存所有出版品的資料庫,更讓我們越來越可能儲存所有的影像和聲音。

這個可能的資料庫尺度可能是我們以前從未曾想過的。我們歷史上大概只有Brewster Kahle曾經思考過這個規模,但我們是第一次站在一個可以實現這夢想的時間點上。Kahle是這麼描述的:

我們歷史上似乎只有兩百萬到三百萬張的唱片。大概有十萬部在戲院上映的電影。在二十世紀大概有一百到兩百萬個電影發行。書籍則是有兩千六百萬個不同的作品。這些都可以被裝到跟這個房間一樣大的電腦裡面,而且是一個小公司就可以負擔起的成本。我們正在一個歷史上的轉捩點。全民共享是我們的目標。我們希望能夠以這個為基礎,開放出一個不同的生活模式來,這真是太驚人了。這可能是人類未來會最感到驕傲的一件事物。這將會和亞歷山大圖書館、登錄月球和發明印刷術並駕齊驅。

Kahle不是唯一的資料收集者。網路資料庫(Internet Archive)也不是唯一的資料庫。但Kahle和網路資料庫代表的是未來圖書館和資料庫的可能性。當創作資產的商業生命週期結束時,我不知道這會是何時,但它的確應該要結束。只要這週期結束,Kahle和他的資料庫代表的是這些知識、這些文化,將永遠可以供人自由取用。有些人將可以藉此理解或解此評論這段文明。有些人將可以像是迪士尼一樣利用這段文化,重塑過去,創造新的未來。這個科技許諾的是過去多年以來無法想像的事情:讓我們的歷史文明擁有未來的可能性。數位創作的科技將可以讓亞歷山大圖書館的夢想再度成真。

科技已經搬開了阻擋建造這龐大資料庫的高牆。但聘請律師的成本卻不動如山。因為雖然這「資料庫」的概念和「圖書館」一樣歷史久遠,但它在數位空間中所收集的創作卻依舊是別人的財產。我們的著作權法限制Kahle和其他人自由運用這些創作。

Facebook

Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-NonCommercial-ShareAlike 3.0 License