บทนำ: เปลี่ยนเอกสารสแกนที่แปลไม่ได้ ให้เป็นเอกสารสองภาษาที่สวยงาม
เคยพยายามแปลไฟล์ PDF ที่สแกน หรือรูปภาพสัญญาที่ไม่ชัด แต่กลับพบว่าเป็นแค่รูปภาพใช่ไหม ไม่มีข้อความให้เลือก ไม่มีให้คัดลอกวาง และเครื่องมือแปลภาษาที่คุณใช้เป็นประจำก็ไม่สามารถทำได้ นั่นคือจุดที่การแปลด้วย OCR เข้ามามีบทบาท ซึ่งเป็นการผสมผสานการทำงานที่เริ่มจากการดึงข้อความ (Optical Character Recognition) จากนั้นจึงแปลอย่างแม่นยำ ด้วยเครื่องมือ OCR และแปล PDF ของ Sider AI คุณสามารถเปลี่ยนจาก "ติดอยู่กับเอกสารสแกน" เป็น "แปลเสร็จเรียบร้อย" ได้ในขั้นตอนเดียว มาเรียนรู้การใช้ Prompt กระบวนการ และข้อควรระวัง เพื่อให้ไฟล์สแกนของคุณได้รับการแปลอย่างราบรื่น สม่ำเสมอ และรวดเร็ว
สิ่งที่คุณสามารถทำได้ด้วย Sider AI สำหรับไฟล์สแกน
- ดึงข้อความจากรูปภาพ/ภาพหน้าจอ: ใช้ OCR ของ Sider เพื่อดึงข้อความ แม้แต่สูตรคณิตศาสตร์ จากรูปภาพ เอกสารสแกน หรือภาพหน้าจอ
- แปล PDF แบบเคียงข้างกัน: เครื่องมือแปล PDF ของ Sider ช่วยให้คุณอัปโหลดเอกสารและเปรียบเทียบข้อความต้นฉบับกับข้อความที่แปลได้ภายในอินเทอร์เฟซเดียว
- สร้างขั้นตอนการทำงานแบบผสมผสาน: สำหรับ PDF ที่สแกน ให้รัน OCR ก่อน (หากจำเป็น) จากนั้นป้อนข้อความที่สวยงามให้กับเครื่องมือแปลภาษาเพื่อความแม่นยำที่สูงขึ้น
เหตุใดการแปลด้วย OCR จึงแตกต่าง (และซับซ้อน)
ไฟล์สแกนคือรูปภาพ ไม่ใช่ข้อความ นั่นหมายความว่า:
- ความไวต่อ OCR: ความคมชัดต่ำ หน้าที่เอียง หรือฟอนต์ที่แปลก จะทำให้การจดจำลดลง
- ความซับซ้อนของเค้าโครง: ตาราง เชิงอรรถ และเค้าโครงหลายคอลัมน์ สามารถทำให้การไหลของข้อความสับสนได้
- การตรวจจับภาษาและสคริปต์: ภาษาที่ผสมกัน หรือสคริปต์ที่ไม่ใช่ละติน จำเป็นต้องมีคำแนะนำที่ชัดเจน
- ความถูกต้องของการแปล: เมื่อดึงข้อความออกมาแล้ว น้ำเสียงและคำศัพท์ยังคงต้องมีการปรับ Prompt อย่างระมัดระวัง
Prompt การแปลด้วย OCR ของ Sider AI (คัดลอก ปรับแต่ง ใช้)
ใช้ Master Prompt นี้กับ Sider AI เมื่อทำงานกับไฟล์สแกนที่ต้องการการดึงข้อมูลและการแปลที่แม่นยำ จับคู่กับขั้นตอนที่ถูกต้อง (ด้านล่าง) เพื่อผลลัพธ์ที่ดีที่สุด
Prompt: เทมเพลตหลัก OCR + การแปล
เป้าหมาย: ดึงข้อความที่ถูกต้องจากไฟล์สแกนหรือรูปภาพ จากนั้นแปลด้วยการจัดรูปแบบที่ชัดเจนและการควบคุมคำศัพท์
ระยะที่ 1 — การดึงข้อมูลด้วย OCR
“คุณคือผู้ช่วย OCR วิเคราะห์รูปภาพที่อัปโหลดหรือ PDF ที่สแกนทีละหน้า ส่งออกข้อความที่สวยงามและเลือกได้ พร้อมกฎต่อไปนี้:
- รักษาสลำดับการอ่านและหัวข้อ
- สร้างรายการ ตาราง (เป็นข้อความธรรมดาที่มีตัวคั่นที่ชัดเจน) และการขึ้นย่อหน้าใหม่
- เก็บรักษาอักขระพิเศษ (°, ±, µ, →) และสูตรคณิตศาสตร์ สำหรับสูตร ให้ครอบด้วย
- สำหรับ PDF ที่สแกนที่มีเค้าโครงที่ซับซ้อน: พิจารณาการดึงข้อมูล OCR ทีละหน้าเพื่อรักษาลำดับ บันทึก EXTRACTED TEXT ของแต่ละหน้า
- แก้ไขข้อผิดพลาดของอักขระที่เห็นได้ชัด (I เทียบกับ l, 0 เทียบกับ O)
- สร้างตารางใหม่เป็นข้อความธรรมดาพร้อมตัวคั่น
- ทำเครื่องหมายส่วนที่อ่านไม่ออกด้วย
- หากการจัดรูปแบบเคียงข้างกันไม่จำเป็น ให้วาง EXTRACTED TEXT ของคุณลงในแชทและรัน Prompt การแปลในระยะที่ 2
- ใช้คำศัพท์เฉพาะเพื่อให้สอดคล้องกัน
- เตรียมคำศัพท์สั้นๆ สำหรับชื่อแบรนด์ คำศัพท์ผลิตภัณฑ์ วลีทางกฎหมาย หรือคำศัพท์ทางการแพทย์
- เพิ่มลงใน Prompt เพื่อให้ Sider บังคับใช้การแปลที่สอดคล้องกัน
- ขอให้ Sider ตรวจสอบตัวเลข วันที่ หน่วย และชื่อ ยืนยันว่าโครงสร้างสะท้อนถึงแหล่งที่มา
- สำหรับการสแกนหลายภาษา ให้ตรวจสอบว่าแต่ละส่วนของภาษาได้รับการแปลอย่างถูกต้องและติดแท็ก
- ส่งออกการแปลและให้คนตรวจสอบอย่างรวดเร็ว โดยเฉพาะอย่างยิ่งสำหรับเอกสารทางกฎหมาย การแพทย์ หรือเอกสารที่เน้นการปฏิบัติตามข้อกำหนด
กรณีการใช้งานจริงและ Mini-Playbooks
- สัญญาและเอกสารสแกนทางกฎหมาย
- Prompt OCR: เน้นการใส่หมายเลขย่อหน้าและการอ้างอิงข้อ
- รูปแบบการแปล: น้ำเสียงที่เป็นทางการและระมัดระวัง ใส่คำศัพท์เฉพาะสำหรับคำที่กำหนด
- เน้น QA: หมายเลขข้อ คำที่กำหนด วันที่
- เอกสารทางวิชาการและวิทยานิพนธ์
- Prompt OCR: รักษาส่วนหัว การอ้างอิง เชิงอรรถ ครอบสมการด้วย
- AI PDF Translator: ต้นฉบับเทียบกับการแปลแบบเคียงข้างกัน เพื่อการตรวจสอบและการแก้ไขที่ง่ายขึ้น
สิ่งที่ควรทราบ: หากคุณกำลังจัดการ PDF ที่สแกนซึ่งผสมผสานภาษา ตาราง และรูปภาพ การผสมผสาน OCR ของ Sider กับเครื่องมือแปล PDF แบบเคียงข้างกันจะช่วยเร่งการตรวจสอบ คุณสามารถเห็นโครงสร้าง ติดตามคำศัพท์ และแก้ไขข้อผิดพลาดแบบอินไลน์ โดยไม่ต้องสลับไปมาระหว่างเครื่องมือหลายตัว
ตัวอย่างที่สมบูรณ์: จากเอกสารสแกนไปสู่การแปลขั้นสุดท้าย
สถานการณ์: คู่มือทางเทคนิคที่สแกน 12 หน้าในภาษาเยอรมัน พร้อมตารางและสูตร เป้าหมายคือภาษาอังกฤษ
ขั้นตอนต่อไป
- ลองใช้ OCR ของ Sider กับรูปภาพสแกนเดียวและตรวจสอบผลลัพธ์ EXTRACTED TEXT
- อัปโหลด PDF ที่สแกนถัดไปของคุณไปยัง PDF Translator และเปรียบเทียบผลลัพธ์แบบเคียงข้างกัน
- บันทึก Master Prompt ด้านบนเป็นเทมเพลตที่นำกลับมาใช้ใหม่ได้สำหรับการแปลไฟล์สแกนทั้งหมดในอนาคต
คำถามที่พบบ่อย
Q1: ฉันจะแปล PDF ที่สแกนด้วย Sider AI ได้อย่างไร
ขั้นแรก ให้รัน OCR เพื่อดึงข้อความทีละหน้า จากนั้นป้อนข้อความที่ทำความสะอาดแล้วลงใน PDF Translator ของ Sider เพื่อการแปลแบบเคียงข้างกัน แนวทางการแปล OCR สองขั้นตอนนี้ช่วยปรับปรุงความแม่นยำของไฟล์สแกน
Q2: Sider AI สามารถจัดการรูปภาพหรือภาพหน้าจอสำหรับการแปลด้วย OCR ได้หรือไม่
ได้ คุณสามารถอัปโหลดรูปภาพหรือภาพหน้าจอไปยังเครื่องมือ OCR ของ Sider เพื่อดึงข้อความ จากนั้นแปลได้ วิธีนี้ใช้ได้ดีสำหรับรูปภาพเอกสาร เมนู หรือใบเสร็จ
Q3: Prompt ที่ดีที่สุดสำหรับการแปล OCR ของไฟล์สแกนคืออะไร
ใช้ Prompt สองระยะ: ระยะที่ 1 สำหรับการดึงข้อมูล OCR ที่มีโครงสร้าง (รักษาส่วนหัว ตาราง สูตร) ระยะที่ 2 สำหรับการแปลด้วยคำศัพท์เฉพาะและการตรวจสอบ QA รวมถึงกฎการจัดรูปแบบและ Flags ที่มีความคลุมเครือ
Q4: ฉันจะรักษาตารางและสูตรให้ถูกต้องได้อย่างไรระหว่างการแปล OCR
ขอให้ Sider สร้างตารางใหม่เป็นข้อความที่คั่นด้วยไปป์ และครอบสมการในบล็อก [FORMULA] ในการแปล ให้คงตัวแปรไว้ตามเดิมขณะแปลข้อความโดยรอบ
Q5: Sider AI แปล PDF โดยแสดงต้นฉบับควบคู่ไปด้วยหรือไม่
ใช่ AI PDF Translator ของ Sider มีมุมมองแบบเคียงข้างกันของข้อความต้นฉบับและข้อความที่แปล ทำให้ง่ายต่อการตรวจสอบและแก้ไข