簡介:將無法翻譯的掃描文件轉變為清晰的雙語文檔
是否曾嘗試翻譯掃描的 PDF 或模糊的合約照片,結果卻發現它只是一張圖片?沒有可選取的文字,無法複製貼上,而且您常用的翻譯工具也束手無策。這就是 OCR 翻譯的用武之地——它結合了文字提取(光學字元辨識)和精準翻譯。透過 Sider AI 的 OCR 和 PDF 翻譯工具,您可以從「受困於掃描文件」轉變為「完成翻譯」,所有流程都在一個工作流程中完成。讓我們掌握提示、流程和陷阱,讓您的掃描文件能夠乾淨、一致且快速地翻譯。
您可以使用 Sider AI 對掃描文件執行的操作
- 從圖像/螢幕截圖中提取文字:使用 Sider 的 OCR 從照片、掃描文件或螢幕截圖中提取文字(甚至是數學公式)。
- 並排翻譯 PDF:Sider 的 PDF 翻譯工具讓您可以上傳文件,並在單一介面中比較原始文字和翻譯文字。
- 建立混合工作流程:對於掃描的 PDF,首先執行 OCR(如果需要),然後將清晰的文字輸入翻譯工具,以提高準確性。
為什麼 OCR 翻譯與眾不同(而且棘手)
掃描文件是圖像,而不是文字。這意味著:
- OCR 敏感度:低對比度、傾斜的頁面或奇怪的字體會降低辨識度。
- 版面複雜度:表格、註腳和多欄版面可能會混淆文字流。
- 語言和腳本檢測:混合語言或非拉丁腳本需要明確的指導。
- 翻譯的準確性:一旦提取了文字,語氣和術語仍然需要仔細的提示。
Sider AI OCR 翻譯提示(複製、自訂、使用)
在處理需要精確提取和翻譯的掃描文件時,請將此主要提示與 Sider AI 搭配使用。將其與正確的步驟(如下)配對,以獲得最佳效果。
提示:OCR + 翻譯主範本
目標:從掃描文件或圖像中提取準確的文字,然後以清晰的格式和詞彙表控制進行翻譯。
第一階段 — OCR 提取
「您是一位 OCR 助理。逐頁分析上傳的圖像或掃描的 PDF。輸出清晰、可選取的文字,並遵循以下規則:
- 重建列表、表格(以帶有清晰分隔符的純文字形式)和段落分行。
- 保留特殊字元 (°, ±, µ, →) 和數學公式。對於公式,請用 包裹
- 對於具有複雜版面的掃描 PDF:考慮逐頁 OCR 提取以保持順序。儲存每個頁面的 EXTRACTED TEXT。
- 修正明顯的字元錯誤(I vs l,0 vs O)。
- 如果並排格式不是必要的,請將您的 EXTRACTED TEXT 貼到聊天室中,然後執行第二階段翻譯提示。
- 為品牌名稱、產品術語、法律短語或醫學術語準備一個簡短的詞彙表。
- 將其新增到提示中,以便 Sider 強制執行一致的翻譯。
- 要求 Sider 檢查數字、日期、單位和名稱。確認結構與來源相符。
- 對於多語言掃描,請驗證每個語言片段是否已正確翻譯和標記。
- 匯出翻譯並進行快速的人工檢查,特別是對於法律、醫療或合規性要求高的文件。
真實世界的用例和迷你劇本
- 翻譯風格:正式、保守的語氣。包括已定義術語的詞彙表。
- OCR 提示:保留標題、引文、註腳;將方程式用 包裹
- AI PDF 翻譯工具:並排顯示原始文件和翻譯文件,以便於審閱和更正。
值得注意的是:如果您正在處理混合了語言、表格和圖像的掃描 PDF,Sider 的 OCR 和並排 PDF 翻譯工具的結合可以加快驗證速度。您可以查看結構、追蹤術語並線上修正錯誤,而無需處理多個工具。
完整範例:從掃描到最終翻譯
情境:一份 12 頁的德語掃描技術手冊,其中包含表格和公式;目標語言是英語。
後續步驟
- 在單個掃描圖像上試用 Sider 的 OCR,並檢查 EXTRACTED TEXT 輸出。
- 將您的下一個掃描 PDF 上傳到 PDF 翻譯工具,並比較並排結果。
- 將上面的主要提示儲存為可重複使用的範本,用於所有未來的掃描文件翻譯。
常見問題解答
Q1:如何使用 Sider AI 翻譯掃描的 PDF?
首先執行 OCR 以逐頁提取文字,然後將清理後的文字輸入 Sider 的 PDF 翻譯工具以進行並排翻譯。這種兩步驟的 OCR 翻譯方法可提高掃描文件的準確性。
Q2:Sider AI 可以處理用於 OCR 翻譯的圖像或螢幕截圖嗎?
是的,您可以將圖像或螢幕截圖上傳到 Sider 的 OCR 工具以提取文字,然後進行翻譯。這非常適合用於文件、菜單或收據的照片。
Q3:掃描文件 OCR 翻譯的最佳提示是什麼?
使用兩階段提示:第一階段用於結構化 OCR 提取(保留標題、表格、公式),第二階段用於翻譯,包含詞彙表和 QA 檢查。包括格式規則和不明確標記。
Q4:如何在 OCR 翻譯期間保持表格和公式的準確性?
要求 Sider 將表格重建為以管道符號分隔的文字,並將方程式用 [FORMULA] 區塊括起來。在翻譯中,保持變數不變,同時翻譯周圍的文字。
Q5:Sider AI 是否在翻譯 PDF 時同時顯示原始文件?
是的。Sider 的 AI PDF 翻譯工具提供原始文字和翻譯文字的並排檢視,使其易於審閱和更正。