Google 快速製書編輯流程

The valuable information below was provided by Jack, a long-time Haodoo community contributor. Haodoo is grateful to Jack for sharing his expertise.

本流程透過結合雲端工具與 AI 技術，提供一套標準化步驟，讓製作高品質電子書變得前所未有的簡單與快速。

💡 優點

高效自動化：節省大量繁瑣工序。例如：使用 Google Doc 進行批次 OCR，300頁的書籍（jpg檔或pdf檔）平行處理，僅需約 4～5 分鐘 即可完成OCR。
AI 深度校正：利用 AI 執行自動校正編輯，可完成 99% 以上 的校正工作，有效減少人工字字校對的壓力，且錯誤率極低。相當於20～30頁的文字可在 3~4 分鐘 內完成校正。
精準品質控管：提供「並排比對 (Diff)」步驟，能快速檢查 AI 校正是否有誤，確保文稿正確性。
享受閱讀：人工檢查階段僅需專注於段落調整與極少數錯別字，讓人工檢查過程如同輕鬆閱讀。

🛠 核心流程

為了達到最佳效率，建議依照以下四個階段進行：

階段	步驟名稱	說明
1	雲端批次 OCR	將圖像或 PDF 轉為初步文字檔
2	AI 自動校正	使用 Gemini 進行錯字修正、簡轉繁及去雜訊
3	檔案比對 (可選)	使用 WinMerge 比對原始檔與校正檔
4	人工檢查	最後的章節分割與段落調整，修正尚存的極少數錯誤

一、雲端批次 OCR 指南

Google Docs 擁有一項強大的隱藏功能：當初次開啟 PDF 檔案時，系統會自動執行 OCR（光學字元辨識）。本流程利用此特性。

📌 重要限制

檔案大小：必須小於 40MB。
頁數限制：建議少於 80 頁（超過則僅插入圖像而不執行 OCR）。
適用性：確認支援直排與橫排書籍。

1. 準備工作：分割 PDF 或組合圖像

為了符合限制，需先將書籍內容切分為適當大小。

方法 A：使用 PDFsam Basic 分割

安裝：PDFsam Basic。
設定：選擇 Split by every "n" pages，輸入 50。

方法 B：使用 ImageMagick 轉換 (img2pdf.bat)

將附錄中的 img2pdf.bat 存至圖像目錄並執行。它會自動將圖像每 50 張打包。

2. 執行 Google Docs OCR

上傳：將 PDF 檔上傳至 Google Drive。
轉換：右鍵點選檔案，選擇 「選擇開啟工具」 -> 「Google Doc」。
清理格式：Ctrl + A 全選後按 Ctrl + \ 清除格式。

3. 快速轉換標點與英數 (OCR_FIX.py)

透過 Python 腳本 ocr_fix.py（見附錄），一鍵將半形標點與英數強制轉為全形。

複製：Google Doc 中 Ctrl + A 全選，Ctrl + C 複製。
執行：執行 ocr_fix.py 腳本。
貼回：文字即完成全形轉換。

二、使用 Google Gemini 進行自動校正

本步驟利用 Google Gemini 模擬「資深出版社編輯」。建議預先建立一個專屬 Gem。

1. 建立您的 Gem 設定

名稱： OCR 編輯校對助手 v1.3
指令 (Instructions)：

			
<角色>你是一名資深的出版社編輯。</角色>
<任務>
1. 校正一篇OCR後產生的文字稿。處理漏字、錯別字、簡繁轉換，去除書名、頁數等雜訊。
2. 將英文半形空格/標點改成中文全型格式。
3. 依照文義將跑掉的片段句子接回正確位置。
</任務>
<限制>
以最少的改動校正稿子，只修改錯誤處，不修飾字詞風格。
</限制>
<輸出格式>
將「校正後結果」放入獨立的程式碼區塊（Code Block）中。
</輸出格式>

		

2. 如何使用建立好的編輯校對助手

⚠️CAUTION

Gemini 3 （Fast）的「上下文窗口」（context window）大約是20K，處理數百頁後

可能會忘掉 Gem 的設定。所以最好每處理約100頁，就重新開啟 OCR 編輯校對助手 v1.3 對話窗。

開啟助手：在 Gemini 左側選單點選您建立好的 「OCR 編輯校對助手 v1.3」。
貼上文字：將之前完成 OCR 步驟的文字直接貼入對話框並送出。
自動處理：助手會開始工作，螢幕也會逐步上捲。由於頁數較多，通常要等待約兩三分鐘，請耐心等待。
一鍵複製：
- 等待助手處理完畢，找到標示為 「原始文字」 或 「校正後結果」 的灰色區塊。
- 將滑鼠移到該區塊右上方，點擊 「Copy code」（複製）按鈕。
貼入編輯器：回到編輯器或其它程式，直接貼上（Ctrl+V）即可。

三、比對校正前後文字檔案差異 (Diff)

本步驟說明如何使用 WinMerge 工具，直觀地確認 Gemini 修改前與修改後的文字差異。

提示：此步驟並非必須。當您熟悉 Gemini 的校對品質且具備信心後，可以選擇省略此步以加快進度。

1. 什麼是 WinMerge？

WinMerge 是一款免費、支援中文的電腦軟體。它能自動比對兩個檔案的內容，並用顏色標示出不一樣的地方。

實用場景：比對兩份文字版本、檢查清單差異、找出草稿修改處。
核心優點：告別肉眼找錯！軟體會直接標註「哪裡被刪除」與「哪裡被新增」。

2. 安裝說明

請依照以下步驟完成簡易安裝：

下載：前往 WinMerge 官方網站，點擊 Download Now。
執行：雙擊下載的安裝檔（.exe 檔案）。
安裝：過程中的選項請保持預設，一路點擊「下一步」直到「完成」。
語言：若開啟後為英文，請至選單 Edit > Options > General 將語言更改為 Chinese-Traditional。

3. 比對 Gemini 校對成果

在前一個步驟中，Gemini 已將 「原始文字」 與 「校正後結果」 放在兩個獨立的灰色區塊（Code Block）內。請依照下列步驟進行快速比對：

第一步：準備 WinMerge 畫面

開啟 WinMerge。
點擊左上角的 黃色資料夾圖示（或按快捷鍵 Ctrl + O）。
直接點擊視窗下方的 「對比 (Compare)」 按鈕（不需先選取檔案，這會開啟兩個空白的左右編輯區）。

第二步：貼上內容

左側（原始內容）：回到 Gemini，點擊「原始文字」區塊右上角的 Copy，再到 WinMerge 左邊視窗貼上。
右側（結果內容）：回到 Gemini，點擊「校正後結果」區塊右上角的 Copy，再到 WinMerge 右邊視窗貼上。

第三步：執行比對

按下鍵盤上的 F5 (重新整理)。
查看結果：有顏色背景的區塊即代表兩者不同之處。您可以輕鬆確認 Gemini 是否正確修正了錯字，或是否有誤刪的情形。

💡 小技巧

同步捲動：當您捲動左側視窗時，右側會同步捲動，方便您對照查看。
快速導覽：可以使用工具列上的上下箭頭按鈕，快速跳轉到下一個差異點。

四. 人工最後修飾、分割章節

最後一步是將 AI 的產出轉化為結構完整的電子書：

覆蓋原始稿：將 Gemini 校正後的文字從 Code Block 複製，貼入編輯程式（如 mPDB 2.6）。
章節分割：根據原書目錄進行章節切割。
細部修正：閱讀內文並參考原 PDF，重點檢查：
- 段落順序：特別是語意較模糊的「短句對話」是否接錯。
- 段落合併：檢查較短的段落是否被 AI 誤併為長段。
- 極少數錯誤：檢查原書本身的錯誤用法或極罕見的漏字。
完稿： 產生目錄並匯出 ePub 格式。