WikiTaxi 維基百科下載後離線閱讀,自製免費隨身電子書
之前我曾經寫過一篇:「Pocket Wikipedia 口袋版維基百科,全世界精華知識的大小是175MB」,介紹了一個口袋版Wikipedia,讓你可以跨平台、隨身、離線查詢維基百科裡面的條目。而最近從「Lifehacker」、「DiggLife」上面看到了另外一種可以幫助你「離線」檢索搜尋、閱讀瀏覽維基百科數據庫的工具:WikiTaxi,研究了一下覺得也頗有特色:最重要的是它完全免安裝,也不需要其它任何系統程式庫的輔助,透過單一軟體就能啟動;對一般人來說是比較容易應用在實務上的。所以這篇文章就是想詳細的用圖文教學示範一遍它的使用方法,讓更多有這方面需求的朋友可以更容易的上手。
就讓我們先來說明這篇教學的基本流程:首先網路上有個「Wikimedia Downloads」的網站提供了各種維基數據庫的下載,並且會定期更新(幾週)。而WikiTaxi有一個「轉換器」可以幫我們簡單快速的將這些「數據庫(Dump)」轉換成可以用「WikiTaxi閱讀器」閱讀的格式。所以只需要花幾個簡單的前製動作,我們就可以把WikiTaxi閱讀器和轉換後的數據庫放進隨身碟中,並且可以離線閱讀裡面的維基百科資料了。
P.S.其實Wikimedia Downloads網站也有提供自己的wiki工具,雖然功能比較豐富,但相對的就沒有WikiTaxi單純而容易使用。
- WikiTaxi(Windows作業系統適用):http://wikitaxi.org/delphi/doku.php/products/wikitaxi/index
- 簡化版英文維基數據庫(28.3MB):http://dumps.wikimedia.org/simplewiki/latest/
- 大容量版英文維基數據庫(3.9GB):http://dumps.wikimedia.org/enwiki/latest/
- 中文版維基百科數據庫(238.7MB):http://dumps.wikimedia.org/zhwiki/latest/
首先來到WikiTaxi網頁,到左上角下載主程式後進行解壓縮。解壓縮後的資料夾裡有兩個主要的程式,一個是後續負責格式轉換的「WikiTaxi_Importer.exe」,一個是要當作檢索閱讀工具的「WikiTaxi.exe」。兩個工具不需安裝都可以直接使用,並可以移動攜帶。
接著我們還必須要有「維基百科的數據庫」,這樣WikiTaxi才有東西可以讀取。在WikiTaxi網頁中間的「Download the Wiki backup」欄位裡有提供了各種語系和大小的維基數據庫下載點。而在本文前面我也提供了「簡易版英文維基數據庫」、「大容量版英文維基數據庫」和「中文維基百科數據庫」的下載連結(這些數據庫會定期更新,所以隔一陣子你可以回到上述連結查看是否有最新版本)。
點進連結以後,你會看到一大堆檔案,不過別被嚇到了,因為這裡面適合「WikiTaxi」使用的檔案只有一種:仔細找找看,找到檔名格式是「XXXXX-pages-articles.xml.bz2」的檔案,並將其下載回來。記得,只要下載該檔案就好,不要做任何解壓縮的動作喔!
這時候你擁有WikiTaxi工具和數據庫了,打開「WikiTaxi_Importer.exe」這個轉換器,首先在第一橫列的〔Browse〕欄位選擇剛剛下載的「*.bz2」檔案。
接著在第二條橫列的〔Browse〕欄位,選擇你想要儲存轉換後的「XXX.taxi」檔案的位置,並且自行給它一個命名;例如我這邊就將轉換後的檔案命名為「wiki.taxi」,並且儲存在和「WikiTaxi」同一個資料夾。
然後中央的橫槓是轉換時要使用的記憶體量,一般來說WikiTaxi會幫你自動調整適合的用量,你也可以自行往右調高,讓轉檔流程更順暢。都確認好後按下〔Import Now!〕就可以開始把bz2檔案轉換成專用的「Taxi格式」了。
轉檔完成後,關閉「WikiTaxi_Importer.exe」,接著打開「WikiTaxi.exe」閱讀器,打開後你會在畫面開頭看到一個「Click here to open an existing database」,點選這個連結,就會進入一個開啟檔案視窗,選擇你剛剛轉換完成的「XXX.taxi」檔案,就能夠把維基百科數據庫載入WikiTaxi囉!
WikiTaxi本身只有閱讀器的功能,並無法編輯或做更進階的動作。下面的圖片是載入簡易版英文維基百科的畫面,你可以在上方的搜尋欄位進行關鍵字的檢索,或是透過右上角的〔Random Page〕來隨機切換頁面瀏覽。
如果你在閱讀器中按下鍵盤的〔Ctrl〕+〔F〕,則可以在下方打開內頁文字搜尋器,方便你查找目前頁面裡的某個關鍵字。
如果你覺得每次打開WikiTaxi閱讀器後,還要重複進行載入數據庫的動作,實在有點麻煩的話,你也可以透過「捷徑」設定來解決這個問題。首先幫「Wikitaxi.exe」建立一個「捷徑」,接著在「捷徑」上點選滑鼠右鍵,選擇【內容】,切換到〔捷徑〕標籤頁面。
在其中的「目標」欄位中,你會先看到啟動Wikitaxi.exe的路徑,接著〔空一格〕後,輸入你想要啟動時載入的「數據庫路徑」即可。以後透過這個捷徑來啟動,就會直接載入你設定好的數據庫了。
耶?為什麼我前面都提供了「中文維基百科」數據庫的下載連結,我的介紹中卻不特別強調呢?因為雖然確實是可以在WikiTaxi裡匯入「zhwiki中文維基百科」的資料,也可以瀏覽,不過卻無法使用「中文關鍵字」進行「條目搜索功能」。
也就是說在WikiTaxi載入中文數據庫後,你只能用「英文關鍵字」來查找百科條目,或者可以透過〔Random Page〕來隨意的切換瀏覽,還有透過頁面中的互相連結進行切換。
小結:
雖然在中文關鍵字的搜尋上有問題,不過WikiTaxi還是一個很值得推薦的維基百科離線閱讀工具,它可以讓你載入各種語言和內容的百科數據庫,而且使用上非常的簡單,流程裡不需要你去安裝任何額外的東西,又可以離線隨身、攜帶移動(只要攜帶Wikitaxi閱讀器主程式,和Taxi格式的數據庫即可),你也可以試試看把整套閱讀器和數據庫燒錄到光碟中,不也是很好的電子百科全書嗎?
虽然不用翻墙了,但是blogspot还是很慢,专门上来留个言,也不知道简体字上来会不会成乱码.
回覆刪除其实WikiTaxi是可以用中文搜索的,你只要在要搜索的文字前面加上一个半角的引号,形如“'李白”(不要双引号),就可以在里面搜索李白了,基本都行得通
使用firefox 閱讀離線 wikipedia, 很像也不錯, 不知道這樣能不能帶來帶去?
回覆刪除(可以用portable firefox試看看)
http://www.ghacks.net/2008/08/06/download-and-use-wikipedia-offline-with-firefox/
您是說用 '李白 這樣的方式嗎?
回覆刪除我試過了並不行耶,用簡體或繁體的關鍵字會顯示出亂碼的搜尋結果列表。
To 人生小丑:
我也有注意到這個擴充套件,初步試用下決定先介紹這款WikiTaxi^^
@異塵行者 不会吧,我有试过啊,结果是这样的
回覆刪除Search results for:'李白
Partial Matches
李白
李白(消岐?
李白(共產黨員)
------------以上
不会告诉我是简繁体系统不通用吧
而且在我的简体中文系统上,不论用简体还是繁体,都可以搜索到结果
回覆刪除搜索的例子和截图可以参看我写的文章http://steelsnarl.blogspot.com/2008/08/wikitaxi.html
回覆刪除感謝您的實驗與回覆,
回覆刪除我想您提供的方法還是可以讓大家試試看,
或許真的有可能是因為我是繁體系統的關係,所以無法成功。
其實我覺得中文Wikipedia實在是雞肋得很……英文的數據庫又太大
回覆刪除各取所需囉,
回覆刪除如果以後WikiTaxi能夠正常支援中文搜索的話,
它對中文用戶的應用性就可以更強大了。
为什么不试试MDICT的PC版捏
回覆刪除也有wiki的词库的
看起來也有特色,
回覆刪除改天也可以來試用看看
我是大陆的,以前就有留意过这篇文章,最近想试试。结果打开Importer,第一个xml dump file就无法加载,无论中英文路径都一样。后来索性输入路径,可以。但却偏偏不能通过"browse"来加载文件,你们有这样的情况吗?
回覆刪除我使用時這個按鈕都是正常的
回覆刪除在"控制臺/地區及語言選項/進階"的"非unicode程式的語言"改為"日本"
回覆刪除(簡體應該也可以沒試過)
中文跟日文搜尋就會正常了
原來如此,感謝你提供的方法
回覆刪除只是不知道這樣做會不會影響其他地方?
剛剛試了一下用applocale轉語系
回覆刪除手邊的3台PC有一台不知道為什麼失敗
轉簡體時有時還是無法正確查詢
轉日語倒是沒什麼問題
您好~~~我用了您介绍的这款软件,受益良多。有个问题想请教下,为什么不能拷贝呢?
回覆刪除盼回复~~
拷贝? 是指複製貼上嗎? 我也不清楚為何這樣設計,可能也有版權問題吧
回覆刪除