はじめに:翻訳不可能だったスキャンを、クリーンなバイリンガル文書に変える
スキャンされたPDFや、ぼやけた契約書の写真を翻訳しようとして、それが単なる画像だと気づいたことはありませんか?選択可能なテキストも、コピー&ペーストもできず、いつもの翻訳ツールは肩をすくめるばかり。そこで登場するのがOCR翻訳です。これは、まずテキストを抽出(Optical Character Recognition:光学文字認識)し、次に正確に翻訳するコンボ技です。Sider AIのOCRとPDF翻訳ツールを使えば、「スキャンで行き詰まり」から「翻訳完了」へと、すべてを一つのワークフローで進めることができます。スキャンされたファイルを、クリーンに、一貫して、そして迅速に翻訳できるように、プロンプト、プロセス、そして落とし穴をマスターしましょう。
スキャンされたファイルに対してSider AIでできること
- 画像/スクリーンショットからテキストを抽出:SiderのOCRを使って、写真、スキャン、スクリーンショットから、テキスト(数式も含む)を抽出します。
- PDFを並べて翻訳:SiderのPDF翻訳ツールを使えば、ドキュメントをアップロードして、元のテキストと翻訳されたテキストを一つのインターフェースで比較できます。
- ハイブリッドワークフローを構築:スキャンされたPDFの場合は、まずOCRを実行し(必要に応じて)、次にクリーンなテキストを翻訳ツールに送り込むことで、精度を高めます。
OCR翻訳が異なる理由(そして厄介な理由)
スキャンされたファイルは画像であり、テキストではありません。つまり:
- OCRの感度:コントラストが低い、ページが傾いている、または奇妙なフォントは、認識を低下させます。
- レイアウトの複雑さ:表、脚注、および複数列のレイアウトは、テキストの流れを混乱させる可能性があります。
- 言語とスクリプトの検出:混在する言語または非ラテン文字のスクリプトには、明確なガイダンスが必要です。
- 翻訳の忠実度:テキストが抽出されたら、トーンと用語を慎重に指示する必要があります。
Sider AI OCR翻訳プロンプト(コピー、カスタマイズ、使用)
正確な抽出と翻訳が必要なスキャンされたファイルを扱う場合は、このマスタープロンプトをSider AIで使用してください。最適な結果を得るために、適切な手順(下記)と組み合わせてください。
プロンプト:OCR + 翻訳マスターテンプレート
目標:スキャンされたファイルまたは画像から正確なテキストを抽出し、明確な書式設定と用語集の制御で翻訳します。
フェーズ1 — OCR抽出
「あなたはOCRアシスタントです。アップロードされた画像またはスキャンされたPDFをページごとに分析してください。以下のルールに従って、クリーンで選択可能なテキストを出力します:
- リスト、表(明確な区切り文字を持つプレーンテキストとして)、および段落区切りを再構築します。
- 特殊文字(°、±、µ、→)と数式を保持します。数式の場合は、<FORMULA>で囲みます。
- 複雑なレイアウトのスキャンされたPDFの場合:順序を維持するために、ページごとのOCR抽出を検討してください。各ページのEXTRACTED TEXTを保存します。
- 明らかな文字エラー(I vs l、0 vs O)を修正します。
- 表を区切り文字付きのプレーンテキストとして再構築します。
- 判読できない部分を<UNREADABLE>でマークします。
- 並列形式が必須でない場合は、EXTRACTED TEXTをチャットに貼り付け、フェーズ2の翻訳プロンプトを実行します。
- ブランド名、製品用語、法律用語、または医療用語の短い用語集を準備します。
- Siderが一貫した翻訳を強制するように、プロンプトに追加します。
- Siderに、数字、日付、単位、および名前を確認するように依頼します。構造がソースを反映していることを確認します。
- 多言語スキャンの場合は、各言語セグメントが正しく翻訳され、タグ付けされていることを確認します。
- 翻訳をエクスポートし、特に法律、医療、またはコンプライアンス関連のドキュメントについては、人間の目で簡単にチェックします。
実際のユースケースとミニプレイブック
- OCRプロンプト:段落番号と条項の参照を強調します。
- 翻訳スタイル:形式的で保守的なトーン。定義された用語の用語集を含めます。
- OCRプロンプト:見出し、引用、脚注を保持します。数式を<FORMULA>で囲みます。
- AI PDF翻訳ツール:レビューと修正を容易にするために、オリジナルと翻訳を並べて表示します。
注目すべき点:言語、表、画像を混在させたスキャンされたPDFを処理する場合、SiderのOCRと並列PDF翻訳ツールの組み合わせにより、検証が迅速化されます。構造を確認し、用語を追跡し、エラーをインラインで修正できます。複数のツールを使い分ける必要はありません。
完全な例:スキャンから最終翻訳まで
シナリオ:表と数式を含むドイツ語の12ページのスキャンされた技術マニュアル。ターゲットは英語です。
次のステップ
- 単一のスキャン画像でSiderのOCRを試し、EXTRACTED TEXTの出力を検査します。
- 次のスキャンされたPDFをPDF翻訳ツールにアップロードし、並べて結果を比較します。
- 上記のマスタープロンプトを、今後のスキャンされたファイルの翻訳すべてに再利用可能なテンプレートとして保存します。
FAQ
Q1:Sider AIでスキャンされたPDFを翻訳するにはどうすればよいですか?
まずOCRを実行してページごとにテキストを抽出し、次にクリーンアップされたテキストをSiderのPDF翻訳ツールに送り込んで、並列翻訳を行います。この2段階のOCR翻訳アプローチにより、スキャンされたファイルの精度が向上します。
Q2:Sider AIは、OCR翻訳用の画像やスクリーンショットを処理できますか?
はい、画像またはスクリーンショットをSiderのOCRツールにアップロードしてテキストを抽出し、翻訳することができます。これは、ドキュメント、メニュー、または領収書の写真に最適です。
Q3:スキャンされたファイルのOCR翻訳に最適なプロンプトは何ですか?
2段階のプロンプトを使用します。構造化されたOCR抽出(見出し、表、数式を保持)のためのフェーズ1、用語集とQAチェックを使用した翻訳のためのフェーズ2。書式設定ルールと曖昧さフラグを含めます。
Q4:OCR翻訳中に表と数式の精度を維持するにはどうすればよいですか?
Siderに、表をパイプ区切りのテキストとして再構築し、数式を[FORMULA]ブロックで囲むように依頼します。翻訳では、周囲のテキストを翻訳しながら、変数はそのままにしておきます。
Q5:Sider AIは、オリジナルを並べて表示しながらPDFを翻訳しますか?
はい。SiderのAI PDF翻訳ツールは、オリジナルテキストと翻訳されたテキストを並べて表示するため、レビューと修正が簡単です。