The valuable information below was provided by Jack, a long-time Haodoo community contributor. Haodoo is grateful to Jack for sharing his expertise.
本流程透過結合雲端工具與 AI 技術,提供一套標準化步驟,讓製作高品質電子書變得前所未有的簡單與快速。
💡 優點
- 高效自動化:節省大量繁瑣工序。例如:使用 Google Doc 進行批次 OCR,300頁的書籍(jpg檔或pdf檔)平行處理,僅需約 4~5 分鐘 即可完成OCR。
- AI 深度校正: 利用 AI 執行自動校正編輯,可完成 99% 以上 的校正工作,有效減少人工字字校對的壓力,且錯誤率極低。相當於20~30頁的文字可在 3~4 分鐘 內完成校正。
- 精準品質控管: 提供「並排比對 (Diff)」步驟,能快速檢查 AI 校正是否有誤,確保文稿正確性。
- 享受閱讀: 人工檢查階段僅需專注於段落調整與極少數錯別字,讓人工檢查過程如同輕鬆閱讀。
🛠 核心流程
為了達到最佳效率,建議依照以下四個階段進行:
| 階段 | 步驟名稱 | 說明 |
|---|---|---|
| 1 | 雲端批次 OCR | 將圖像或 PDF 轉為初步文字檔 |
| 2 | AI 自動校正 | 使用 Gemini 進行錯字修正、簡轉繁及去雜訊 |
| 3 | 檔案比對 (可選) | 使用 WinMerge 比對原始檔與校正檔 |
| 4 | 人工檢查 | 最後的章節分割與段落調整,修正尚存的極少數錯誤 |
一、 雲端批次 OCR 指南
Google Docs 擁有一項強大的隱藏功能:當初次開啟 PDF 檔案時,系統會自動執行 OCR(光學字元辨識)。本流程利用此特性。
📌 重要限制
- 檔案大小:必須小於 40MB。
- 頁數限制:建議少於 80 頁(超過則僅插入圖像而不執行 OCR)。
- 適用性:確認支援直排與橫排書籍。
1. 準備工作:分割 PDF 或組合圖像
為了符合限制,需先將書籍內容切分為適當大小。
方法 A:使用 PDFsam Basic 分割
- 安裝:PDFsam Basic。
- 設定:選擇
Split by every "n" pages,輸入 50。
方法 B:使用 ImageMagick 轉換 (img2pdf.bat)
將附錄中的 img2pdf.bat 存至圖像目錄並執行。它會自動將圖像每 50 張打包。
2. 執行 Google Docs OCR
- 上傳:將 PDF 檔上傳至 Google Drive。
- 轉換:右鍵點選檔案,選擇 「選擇開啟工具」 -> 「Google Doc」。
- 清理格式:
Ctrl + A全選後按Ctrl + \清除格式。
3. 快速轉換標點與英數 (OCR_FIX.py)
透過 Python 腳本 ocr_fix.py(見附錄),一鍵將半形標點與英數強制轉為全形。
- 複製:Google Doc 中
Ctrl + A全選,Ctrl + C複製。 - 執行:執行
ocr_fix.py腳本。 - 貼回:文字即完成全形轉換。
二、 使用 Google Gemini 進行自動校正
本步驟利用 Google Gemini 模擬「資深出版社編輯」。建議預先建立一個專屬 Gem。
1. 建立您的 Gem 設定
- 名稱:
OCR 編輯校對助手 v1.3 - 指令 (Instructions):
<角色>你是一名資深的出版社編輯。</角色><任務>1. 校正一篇OCR後產生的文字稿。處理漏字、錯別字、簡繁轉換,去除書名、頁數等雜訊。2. 將英文半形空格/標點改成中文全型格式。3. 依照文義將跑掉的片段句子接回正確位置。</任務><限制>以最少的改動校正稿子,只修改錯誤處,不修飾字詞風格。</限制><輸出格式>將「校正後結果」放入獨立的程式碼區塊(Code Block)中。</輸出格式>
2. 如何使用建立好的編輯校對助手
⚠️CAUTION
Gemini 3 (Fast) 的「上下文窗口」(context window)大約是20K,處理數百頁後
可能會忘掉 Gem 的設定。所以最好每處理約100頁,就重新開啟
OCR 編輯校對助手 v1.3對話窗。
- 開啟助手:在 Gemini 左側選單點選您建立好的 「OCR 編輯校對助手 v1.3」。
- 貼上文字:將之前完成 OCR 步驟的文字直接貼入對話框並送出。
- 自動處理:助手會開始工作,螢幕也會逐步上捲。由於頁數較多,通常要等待約兩三分鐘,請耐心等待。
- 一鍵複製:
- 等待助手處理完畢,找到標示為 「原始文字」 或 「校正後結果」 的灰色區塊。
- 將滑鼠移到該區塊右上方,點擊 「Copy code」(複製)按鈕。
- 貼入編輯器:回到編輯器或其它程式,直接貼上(Ctrl+V)即可。
三、比對校正前後文字檔案差異 (Diff)
本步驟說明如何使用 WinMerge 工具,直觀地確認 Gemini 修改前與修改後的文字差異。
提示: 此步驟並非必須。當您熟悉 Gemini 的校對品質且具備信心後,可以選擇省略此步以加快進度。
1. 什麼是 WinMerge?
WinMerge 是一款免費、支援中文的電腦軟體。它能自動比對兩個檔案的內容,並用 顏色 標示出不一樣的地方。
- 實用場景: 比對兩份文字版本、檢查清單差異、找出草稿修改處。
- 核心優點: 告別肉眼找錯!軟體會直接標註「哪裡被刪除」與「哪裡被新增」。
2. 安裝說明
請依照以下步驟完成簡易安裝:
- 下載: 前往 WinMerge 官方網站,點擊 Download Now。
- 執行: 雙擊下載的安裝檔(
.exe檔案)。 - 安裝: 過程中的選項請保持預設,一路點擊「下一步」直到「完成」。
- 語言: 若開啟後為英文,請至選單
Edit>Options>General將語言更改為 Chinese-Traditional。
3. 比對 Gemini 校對成果
在前一個步驟中,Gemini 已將 「原始文字」 與 「校正後結果」 放在兩個獨立的灰色區塊(Code Block)內。請依照下列步驟進行快速比對:
第一步:準備 WinMerge 畫面
- 開啟 WinMerge。
- 點擊左上角的 黃色資料夾圖示(或按快捷鍵
Ctrl + O)。 - 直接點擊視窗下方的 「對比 (Compare)」 按鈕(不需先選取檔案,這會開啟兩個空白的左右編輯區)。
第二步:貼上內容
- 左側(原始內容): 回到 Gemini,點擊「原始文字」區塊右上角的 Copy,再到 WinMerge 左邊視窗貼上。
- 右側(結果內容): 回到 Gemini,點擊「校正後結果」區塊右上角的 Copy,再到 WinMerge 右邊視窗貼上。
第三步:執行比對
- 按下鍵盤上的
F5(重新整理)。 - 查看結果: 有顏色背景的區塊即代表兩者不同之處。您可以輕鬆確認 Gemini 是否正確修正了錯字,或是否有誤刪的情形。
💡 小技巧
- 同步捲動: 當您捲動左側視窗時,右側會同步捲動,方便您對照查看。
- 快速導覽: 可以使用工具列上的上下箭頭按鈕,快速跳轉到下一個差異點。
四. 人工最後修飾、分割章節
最後一步是將 AI 的產出轉化為結構完整的電子書:
- 覆蓋原始稿: 將 Gemini 校正後的文字從 Code Block 複製,貼入編輯程式(如 mPDB 2.6)。
- 章節分割: 根據原書目錄進行章節切割。
- 細部修正: 閱讀內文並參考原 PDF,重點檢查:
- 段落順序: 特別是語意較模糊的「短句對話」是否接錯。
- 段落合併: 檢查較短的段落是否被 AI 誤併為長段。
- 極少數錯誤: 檢查原書本身的錯誤用法或極罕見的漏字。
- 完稿: 產生目錄並匯出 ePub 格式。

