Google 快速製書編輯流程


The valuable information below was provided by Jack, a long-time Haodoo community contributor. Haodoo is grateful to Jack for sharing his expertise.

本流程透過結合雲端工具與 AI 技術,提供一套標準化步驟,讓製作高品質電子書變得前所未有的簡單與快速。

💡 優點

  • 高效自動化:節省大量繁瑣工序。例如:使用 Google Doc 進行批次 OCR,300頁的書籍(jpg檔或pdf檔)平行處理,僅需約 4~5 分鐘 即可完成OCR。
  • AI 深度校正: 利用 AI 執行自動校正編輯,可完成 99% 以上 的校正工作,有效減少人工字字校對的壓力,且錯誤率極低。相當於20~30頁的文字可在 3~4 分鐘 內完成校正。
  • 精準品質控管: 提供「並排比對 (Diff)」步驟,能快速檢查 AI 校正是否有誤,確保文稿正確性。
  • 享受閱讀: 人工檢查階段僅需專注於段落調整與極少數錯別字,讓人工檢查過程如同輕鬆閱讀。

🛠 核心流程

為了達到最佳效率,建議依照以下四個階段進行:

階段步驟名稱說明
1雲端批次 OCR將圖像或 PDF 轉為初步文字檔
2AI 自動校正使用 Gemini 進行錯字修正、簡轉繁及去雜訊
3檔案比對 (可選)使用 WinMerge 比對原始檔與校正檔
4人工檢查最後的章節分割與段落調整,修正尚存的極少數錯誤

一、 雲端批次 OCR 指南

Google Docs 擁有一項強大的隱藏功能:當初次開啟 PDF 檔案時,系統會自動執行 OCR(光學字元辨識)。本流程利用此特性。

📌 重要限制

  • 檔案大小:必須小於 40MB
  • 頁數限制:建議少於 80 頁(超過則僅插入圖像而不執行 OCR)。
  • 適用性:確認支援直排與橫排書籍。

1. 準備工作:分割 PDF 或組合圖像

為了符合限制,需先將書籍內容切分為適當大小。

方法 A:使用 PDFsam Basic 分割

  1. 安裝PDFsam Basic
  2. 設定:選擇 Split by every "n" pages,輸入 50

方法 B:使用 ImageMagick 轉換 (img2pdf.bat)

將附錄中的 img2pdf.bat 存至圖像目錄並執行。它會自動將圖像每 50 張打包。

2. 執行 Google Docs OCR

  1. 上傳:將 PDF 檔上傳至 Google Drive。
  2. 轉換:右鍵點選檔案,選擇 「選擇開啟工具」 -> 「Google Doc」
  3. 清理格式Ctrl + A 全選後按 Ctrl + \ 清除格式。

3. 快速轉換標點與英數 (OCR_FIX.py)

透過 Python 腳本 ocr_fix.py(見附錄),一鍵將半形標點與英數強制轉為全形。

  1. 複製:Google Doc 中 Ctrl + A 全選,Ctrl + C 複製。
  2. 執行:執行 ocr_fix.py 腳本。
  3. 貼回:文字即完成全形轉換。

二、 使用 Google Gemini 進行自動校正

本步驟利用 Google Gemini 模擬「資深出版社編輯」。建議預先建立一個專屬 Gem

1. 建立您的 Gem 設定

  • 名稱: OCR 編輯校對助手 v1.3
  • 指令 (Instructions)
<角色>你是一名資深的出版社編輯。</角色>
<任務>
1. 校正一篇OCR後產生的文字稿。處理漏字、錯別字、簡繁轉換,去除書名、頁數等雜訊。
2. 將英文半形空格/標點改成中文全型格式。
3. 依照文義將跑掉的片段句子接回正確位置。
</任務>
<限制>
以最少的改動校正稿子,只修改錯誤處,不修飾字詞風格。
</限制>
<輸出格式>
將「校正後結果」放入獨立的程式碼區塊(Code Block)中。
</輸出格式>

2. 如何使用建立好的編輯校對助手

⚠️CAUTION

Gemini 3 (Fast) 的「上下文窗口」(context window)大約是20K,處理數百頁後

可能會忘掉 Gem 的設定。所以最好每處理約100頁,就重新開啟 OCR 編輯校對助手 v1.3 對話窗。

  1. 開啟助手:在 Gemini 左側選單點選您建立好的 「OCR 編輯校對助手 v1.3」
  2. 貼上文字:將之前完成 OCR 步驟的文字直接貼入對話框並送出。
  3. 自動處理:助手會開始工作,螢幕也會逐步上捲。由於頁數較多,通常要等待約兩三分鐘,請耐心等待。
  4. 一鍵複製
    • 等待助手處理完畢,找到標示為 「原始文字」 或 「校正後結果」 的灰色區塊。
    • 將滑鼠移到該區塊右上方,點擊 「Copy code」(複製)按鈕。
  5. 貼入編輯器:回到編輯器或其它程式,直接貼上(Ctrl+V)即可。

三、比對校正前後文字檔案差異 (Diff)

本步驟說明如何使用 WinMerge 工具,直觀地確認 Gemini 修改前與修改後的文字差異。

提示: 此步驟並非必須。當您熟悉 Gemini 的校對品質且具備信心後,可以選擇省略此步以加快進度。


1. 什麼是 WinMerge?

WinMerge 是一款免費、支援中文的電腦軟體。它能自動比對兩個檔案的內容,並用 顏色 標示出不一樣的地方。

  • 實用場景: 比對兩份文字版本、檢查清單差異、找出草稿修改處。
  • 核心優點: 告別肉眼找錯!軟體會直接標註「哪裡被刪除」與「哪裡被新增」。

2. 安裝說明

請依照以下步驟完成簡易安裝:

  1. 下載: 前往 WinMerge 官方網站,點擊 Download Now
  2. 執行: 雙擊下載的安裝檔(.exe 檔案)。
  3. 安裝: 過程中的選項請保持預設,一路點擊「下一步」直到「完成」。
  4. 語言: 若開啟後為英文,請至選單 Edit > Options > General 將語言更改為 Chinese-Traditional

3. 比對 Gemini 校對成果

在前一個步驟中,Gemini 已將 「原始文字」 與 「校正後結果」 放在兩個獨立的灰色區塊(Code Block)內。請依照下列步驟進行快速比對:

第一步:準備 WinMerge 畫面

  1. 開啟 WinMerge。
  2. 點擊左上角的 黃色資料夾圖示(或按快捷鍵 Ctrl + O)。
  3. 直接點擊視窗下方的 「對比 (Compare)」 按鈕(不需先選取檔案,這會開啟兩個空白的左右編輯區)。

第二步:貼上內容

  1. 左側(原始內容): 回到 Gemini,點擊「原始文字」區塊右上角的 Copy,再到 WinMerge 左邊視窗貼上。
  2. 右側(結果內容): 回到 Gemini,點擊「校正後結果」區塊右上角的 Copy,再到 WinMerge 右邊視窗貼上。

第三步:執行比對

  • 按下鍵盤上的 F5 (重新整理)
  • 查看結果: 有顏色背景的區塊即代表兩者不同之處。您可以輕鬆確認 Gemini 是否正確修正了錯字,或是否有誤刪的情形。

💡 小技巧

  • 同步捲動: 當您捲動左側視窗時,右側會同步捲動,方便您對照查看。
  • 快速導覽: 可以使用工具列上的上下箭頭按鈕,快速跳轉到下一個差異點。

四. 人工最後修飾、分割章節

最後一步是將 AI 的產出轉化為結構完整的電子書:

  1. 覆蓋原始稿: 將 Gemini 校正後的文字從 Code Block 複製,貼入編輯程式(如 mPDB 2.6)。
  2. 章節分割: 根據原書目錄進行章節切割。
  3. 細部修正: 閱讀內文並參考原 PDF,重點檢查:
    • 段落順序: 特別是語意較模糊的「短句對話」是否接錯。
    • 段落合併: 檢查較短的段落是否被 AI 誤併為長段。
    • 極少數錯誤: 檢查原書本身的錯誤用法或極罕見的漏字。
  4. 完稿: 產生目錄並匯出 ePub 格式。