การแปลง PDF เป็น Word เป็นหนึ่งในการแปลงไฟล์ที่มีคนค้นหามากที่สุดบนอินเทอร์เน็ต และเป็นหนึ่งในการแปลงที่ถูกเข้าใจผิดมากที่สุดด้วย PDF ถูกออกแบบมาให้เป็นรูปแบบเอกสารแบบ final-form โดยจะรักษารูปลักษณ์ของเอกสารไว้อย่างแม่นยำ แต่ไม่ได้ออกแบบมาเพื่อให้แก้ไข การแปลง PDF กลับเป็นรูปแบบที่แก้ไขได้นั้นเหมือนกับการวิศวกรรมย้อนกลับเลย์เอาต์ของเอกสาร และผลลัพธ์ก็แตกต่างกันไปขึ้นอยู่กับความซับซ้อนของ PDF
คู่มือนี้อธิบายว่าทำไมการแปลง PDF เป็น Word จึงเป็นเรื่องยาก เครื่องมือต่าง ๆ สามารถทำอะไรได้บ้างในความเป็นจริง วิธีที่จะได้ผลลัพธ์ที่ดีที่สุดโดยใช้เครื่องมือที่ทำงานบนเบราว์เซอร์อย่าง WebConverter และเคล็ดลับเชิงปฏิบัติสำหรับ PDF แต่ละประเภท
ทำไมการแปลง PDF เป็น Word จึงเป็นเรื่องยาก
เพื่อทำความเข้าใจกับความท้าทายนี้ คุณต้องเข้าใจก่อนว่า PDF จัดเก็บเนื้อหาอย่างไร ไฟล์ PDF ไม่ได้ จัดเก็บเอกสารแบบเดียวกับที่ Word ทำ — ที่มีย่อหน้า หัวเรื่อง ตาราง และสไตล์ แต่ PDF จัดเก็บชุดของ คำสั่งวาด: "วางอักขระนี้ที่พิกัด (x, y)", "วาดเส้นจากที่นี่ไปที่นั่น", "เติมสี่เหลี่ยมนี้ด้วยสี"
ไม่มีโครงสร้างเชิงความหมาย
เอกสาร Word รู้ว่า "บทที่ 1" คือหัวเรื่อง บล็อกถัดไปคือย่อหน้า และกริดของช่องคือตาราง โดยทั่วไป PDF ไม่รู้สิ่งเหล่านี้ มันรู้แค่ตำแหน่งภาพของอักขระและรูปทรงแต่ละตัวเท่านั้น การสร้างโครงสร้างเชิงตรรกะขึ้นมาใหม่ — อักขระใดประกอบเป็นย่อหน้า คอลัมน์หนึ่งสิ้นสุดและอีกคอลัมน์เริ่มต้นที่ไหน เส้นใดประกอบเป็นตาราง — ต้องใช้ฮิวริสติกที่ซับซ้อนและโดยธรรมชาติแล้วไม่สมบูรณ์แบบ
ความท้าทายเรื่องฟอนต์และสไตล์
PDF สามารถฝังฟอนต์ (หรือชุดย่อยของฟอนต์) ที่อาจไม่มีในระบบของคุณได้ เมื่อแปลงเป็น Word ตัวแปลงต้องฝังฟอนต์เหล่านี้ ใช้ฟอนต์ที่ใกล้เคียงแทน หรือใช้ค่าเริ่มต้นของระบบ ฟอนต์ที่ถูกแทนที่อาจมีความกว้างของอักขระแตกต่างกัน ทำให้ข้อความไหลใหม่และเลย์เอาต์เลื่อน
เลย์เอาต์ที่ซับซ้อน
เลย์เอาต์หลายคอลัมน์ ข้อความที่ห่อรอบรูปภาพ แถบข้าง หัวกระดาษและท้ายกระดาษ ลายน้ำ — ทั้งหมดนี้เป็นเรื่องง่ายสำหรับโปรแกรมแสดงผล PDF แต่ยากมากสำหรับตัวแปลงที่จะสร้างขึ้นใหม่ให้เป็นโครงสร้าง Word ที่แก้ไขได้ ยิ่งเลย์เอาต์ซับซ้อนมากเท่าไหร่ การแปลงก็จะยิ่งแม่นยำน้อยลงเท่านั้น
PDF ที่สแกน
PDF จำนวนมาก — โดยเฉพาะเอกสารเก่า เอกสารทางกฎหมาย และแบบฟอร์มราชการ — เป็นภาพที่สแกนมา ไม่ใช่ข้อความดิจิทัล ไฟล์เหล่านี้ไม่มีข้อมูลข้อความเลย เป็นเพียงภาพถ่ายของหน้ากระดาษ การแปลงไฟล์เหล่านี้ต้องใช้ OCR (Optical Character Recognition) ซึ่งเพิ่มชั้นของข้อผิดพลาดที่อาจเกิดขึ้นได้อีกหนึ่งชั้น
WebConverter ทำอะไรได้บ้าง
WebConverter มีเครื่องมือสองตัวที่ทรงพลังและทำงานบนเบราว์เซอร์สำหรับการดึงเนื้อหาออกจาก PDF ทั้งสองตัวประมวลผลไฟล์บนอุปกรณ์ของคุณทั้งหมด ไม่มีอะไรถูกอัปโหลดไปยังเซิร์ฟเวอร์ใด ๆ
PDF เป็นข้อความ
ตัวแปลง PDF เป็นข้อความ ดึงเนื้อหาข้อความทั้งหมดจาก PDF และส่งออกเป็นข้อความธรรมดา นี่เป็นวิธีการดึงข้อความที่น่าเชื่อถือที่สุดเพราะไม่พยายามรักษาการจัดรูปแบบ — มันเพียงดึงข้อความออกมาตามลำดับการอ่าน
เหมาะสำหรับ:
- การดึงเนื้อหาข้อความของเอกสารเพื่อใช้ซ้ำในโปรแกรมประมวลผลคำใด ๆ
- การคัดลอกข้อความจาก PDF ที่เปิดใช้งานการป้องกันการคัดลอก
- การได้ข้อความที่ค้นหาได้และจัดทำดัชนีได้จากรายงาน PDF
- การป้อนเข้าเครื่องมือแปลภาษา เครื่องตรวจไวยากรณ์ หรือการประมวลผลข้อความอื่น ๆ
PDF เป็น Markdown
ตัวแปลง PDF เป็น Markdown ดึงข้อความและพยายามรักษาโครงสร้างพื้นฐาน — หัวเรื่อง รายการ ตัวหนา/ตัวเอียง — โดยใช้การจัดรูปแบบ Markdown ไฟล์ Markdown สามารถเปิดได้ง่ายใน Word, Google Docs หรือโปรแกรมแก้ไข Markdown ใด ๆ แล้วจึงจัดรูปแบบใหม่ตามต้องการ
เหมาะสำหรับ:
- การรักษาโครงสร้างของเอกสาร (หัวเรื่อง รายการ) ขณะดึงข้อความ
- การสร้างเนื้อหาที่แก้ไขได้จากบทความหรือรายงาน PDF
- การแปลง PDF เป็นรูปแบบที่เหมาะสำหรับแพลตฟอร์ม CMS หรือเครื่องมือสร้างเว็บไซต์แบบสแตติก
- เอกสารทางเทคนิคที่จะดูแลรักษาในรูปแบบ Markdown
ทีละขั้นตอน: การดึงข้อความที่แก้ไขได้จาก PDF
วิธีที่ 1: PDF เป็นข้อความ (การดึงแบบเรียบง่าย)
- เปิดเครื่องมือ ไปที่ ตัวแปลง PDF เป็นข้อความของ WebConverter
- อัปโหลด PDF ของคุณ ลากและวางไฟล์ PDF ของคุณลงบนหน้านี้ หรือคลิกเพื่อเรียกดู ไฟล์จะถูกประมวลผลในเครื่อง — ไม่มีอะไรถูกอัปโหลด
- ตรวจสอบข้อความที่ดึงออกมา เครื่องมือจะแสดงข้อความที่ดึงออกมา ซึ่งคุณสามารถตรวจสอบและแก้ไขได้โดยตรงในเบราว์เซอร์
- คัดลอกหรือดาวน์โหลด คัดลอกข้อความไปยังคลิปบอร์ดของคุณหรือดาวน์โหลดเป็นไฟล์ .txt จากนั้นวางลงใน Word, Google Docs หรือโปรแกรมแก้ไขที่คุณเลือก
วิธีที่ 2: PDF เป็น Markdown (การดึงแบบมีโครงสร้าง)
- เปิดเครื่องมือ ไปที่ ตัวแปลง PDF เป็น Markdown ของ WebConverter
- อัปโหลด PDF ของคุณ ลากและวางไฟล์ PDF ของคุณ
- ตรวจสอบผลลัพธ์ Markdown เครื่องมือจะสร้าง Markdown ที่มีหัวเรื่อง รายการ และการจัดรูปแบบพื้นฐานคงไว้
- เปิดใน Word บันทึกไฟล์ .md และเปิดใน Word (Word 2019+ สามารถเปิดไฟล์ Markdown ได้) หรือวางเนื้อหาลงใน Google Docs อีกทางเลือกหนึ่ง ใช้โปรแกรมแก้ไข Markdown เช่น Typora หรือ VS Code เพื่อปรับการจัดรูปแบบ แล้วส่งออกเป็น .docx
วิธีที่ 3: OCR สำหรับ PDF ที่สแกน
หาก PDF ของคุณเป็นเอกสารที่สแกน (ข้อความเป็นส่วนหนึ่งของรูปภาพ ไม่สามารถเลือกได้) เครื่องมือ PDF ของ WebConverter มี OCR ที่ขับเคลื่อนโดย Tesseract.js ซึ่งจะวิเคราะห์ภาพหน้ากระดาษและจดจำอักขระข้อความ ทำให้ได้ผลลัพธ์ที่แก้ไขได้แม้จากหน้าที่สแกน
ความแม่นยำของ OCR ขึ้นอยู่กับปัจจัยหลายอย่าง:
- คุณภาพการสแกน: การสแกนความละเอียดสูง (300 DPI ขึ้นไป) ให้ผลลัพธ์ที่ดีกว่า
- ความชัดของฟอนต์: ฟอนต์มาตรฐานที่สะอาดจะถูกจดจำได้แม่นยำกว่าลายมือหรือฟอนต์ที่มีลวดลาย
- ภาษา: เครื่องยนต์ OCR ทำงานได้ดีที่สุดกับภาษาที่ใช้กันทั่วไป เช่น อังกฤษ เยอรมัน ฝรั่งเศส และสเปน
- คอนทราสต์: ข้อความสีดำบนพื้นหลังสีขาวให้ผลลัพธ์ที่ดีที่สุด พื้นหลังที่มีสี ลายน้ำ และคอนทราสต์ต่ำจะลดความแม่นยำ
เคล็ดลับเพื่อผลลัพธ์ที่ดีที่สุด
เริ่มต้นด้วยเครื่องมือที่เหมาะสม
หากคุณต้องการเพียงเนื้อหาข้อความและวางแผนที่จะจัดรูปแบบใหม่เอง ใช้ PDF เป็นข้อความ — เร็วกว่าและน่าเชื่อถือมากกว่าการพยายามรักษาการจัดรูปแบบที่อาจไม่แปลงได้อย่างแม่นยำ หากโครงสร้างของเอกสาร (หัวเรื่อง รายการ) มีความสำคัญ ลองใช้ PDF เป็น Markdown ก่อน
จัดการตารางแยกต่างหาก
ตารางเป็นองค์ประกอบที่ยากที่สุดในการแปลงให้แม่นยำ หาก PDF ของคุณมีตารางที่สำคัญ ลองพิจารณาวิธีเหล่านี้:
- ดึงข้อความ และสร้างตารางใหม่ด้วยตนเองใน Word หรือ Excel ใช้ความพยายามมากกว่าแต่รับประกันความแม่นยำ
- ถ่ายภาพหน้าจอของตาราง และแทรกเป็นรูปภาพในเอกสาร Word ของคุณหากการแสดงผลภาพที่แม่นยำสำคัญกว่าความสามารถในการแก้ไข
- ใช้เครื่องมือดึงตารางเฉพาะทาง — เครื่องมือบางตัวออกแบบมาโดยเฉพาะสำหรับการดึงข้อมูลแบบตารางจาก PDF ไปยังสเปรดชีต
การจัดการเลย์เอาต์หลายคอลัมน์
PDF หลายคอลัมน์ (บทความวิชาการ หนังสือพิมพ์ จดหมายข่าว) เป็นเรื่องท้าทายเพราะลำดับการดึงข้อความอาจไม่ตรงกับลำดับการอ่านตามภาพ หากข้อความจากคอลัมน์ต่าง ๆ ปะปนกัน:
- ลองดึงข้อมูลทีละหน้าแทนที่จะดึงทั้งเอกสารพร้อมกัน
- ใช้ PDF เป็นข้อความ (ซึ่งพยายามเคารพลำดับการอ่าน) แทนการคัดลอก-วางดิบ ๆ
- จัดเรียงส่วนต่าง ๆ ใหม่ด้วยตนเองหลังการดึงข้อมูลหากจำเป็น
รักษารูปภาพแยกต่างหาก
เครื่องมือดึงข้อความเน้นที่ข้อความ — ไม่ได้ดึงรูปภาพที่ฝังอยู่ หาก PDF ของคุณมีรูปภาพ แผนภาพ หรือชาร์ตที่สำคัญ:
- ถ่ายภาพหน้าจอของรูปภาพที่คุณต้องการและแทรกลงในเอกสาร Word ของคุณด้วยตนเอง
- ใช้คุณสมบัติ "ดึงรูปภาพ" ของโปรแกรมดู PDF หากมี
- พิจารณาว่ารูปภาพจำเป็นต้องอยู่ในเอกสาร Word หรือไม่ หรืออาจอ้างอิงแยกต่างหากได้
ตรวจสอบฟอนต์หลังการแปลง
หลังจากวางข้อความที่ดึงออกมาลงใน Word ให้ตรวจสอบฟอนต์ หาก PDF ใช้ฟอนต์ที่ฝังไว้หรือฟอนต์ที่ไม่ปกติ Word อาจใช้ฟอนต์อื่นแทน เลือกข้อความทั้งหมดและใช้ฟอนต์ที่สอดคล้องกัน (เช่น Calibri หรือ Arial) เพื่อให้แน่ใจว่ารูปลักษณ์เป็นเอกภาพ
เมื่อคุณต้องการการแปลง PDF เป็น Word แบบเต็มรูปแบบ
สำหรับเอกสารที่ซับซ้อนซึ่งคุณต้องรักษาการจัดรูปแบบที่แม่นยำ — เลย์เอาต์หน้า รูปภาพที่ฝัง หัวกระดาษ ท้ายกระดาษ และสไตล์ฟอนต์ — คุณอาจต้องใช้เครื่องมือแปลง PDF เป็น Word เฉพาะที่ทำงานในเครื่องบนเดสก์ท็อปของคุณ เช่น:
- LibreOffice Draw/Writer — ฟรี โอเพนซอร์ส และทำงานออฟไลน์ทั้งหมด สามารถเปิด PDF และแปลงเป็น .docx ได้โดยรักษาการจัดรูปแบบไว้ได้พอสมควร
- Microsoft Word — Word 2013 และเวอร์ชันใหม่กว่าสามารถเปิดไฟล์ PDF ได้โดยตรง คุณภาพการแปลงแตกต่างกันไปแต่มักจะดีสำหรับเอกสารที่เรียบง่าย
สำหรับการดึงข้อความที่เรียบง่าย การจัดรูปแบบใหม่ และการนำเนื้อหากลับมาใช้ใหม่ เครื่องมือที่ทำงานบนเบราว์เซอร์ของ WebConverter เป็นโซลูชันที่รวดเร็ว เป็นส่วนตัว และมีประสิทธิภาพ
ทำความเข้าใจประเภทของ PDF
ไม่ใช่ PDF ทุกฉบับจะเหมือนกัน การรู้ว่าคุณกำลังทำงานกับ PDF ประเภทใดช่วยให้คุณคาดหวังคุณภาพการแปลงได้
PDF ที่สร้างขึ้นในรูปแบบดิจิทัล
เหล่านี้คือ PDF ที่สร้างขึ้นจาก Word, LaTeX, InDesign หรือเว็บเพจ มีข้อมูลข้อความจริง พร้อมการเข้ารหัสอักขระและข้อมูลฟอนต์ การดึงข้อความจาก PDF เหล่านี้มักจะแม่นยำมาก — ทุกอักขระถูกจัดเก็บเป็นข้อความ ไม่ใช่รูปภาพ
PDF ที่สแกน (เฉพาะภาพ)
เหล่านี้คือ PDF ที่สร้างขึ้นโดยการสแกนเอกสารกระดาษ แต่ละหน้าเป็นภาพแรสเตอร์ (เหมือนภาพถ่าย) ไม่มีข้อมูลข้อความ — มีแค่พิกเซล การดึงข้อความต้องใช้ OCR ซึ่งแม่นยำน้อยกว่าการดึงข้อมูลโดยตรง ความแม่นยำจะดีขึ้นตามคุณภาพการสแกน
PDF แบบไฮบริด (สแกนที่ค้นหาได้)
เครื่องสแกนและเครื่องมือบางตัวสร้าง "PDF ที่ค้นหาได้" โดยการใช้ OCR ระหว่างการสแกนและฝังเลเยอร์ข้อความที่มองไม่เห็นไว้ด้านหลังภาพหน้ากระดาษ ไฟล์เหล่านี้ดูเหมือนหน้าที่สแกนแต่มีข้อความที่เลือกได้ คุณภาพการดึงข้อมูลขึ้นอยู่กับความแม่นยำของ OCR ในซอฟต์แวร์การสแกนต้นฉบับ
PDF ที่มีการรักษาความปลอดภัย/ป้องกัน
PDF บางฉบับมีการตั้งค่าสิทธิ์ที่จำกัดการคัดลอก การพิมพ์ หรือการแก้ไข เครื่องมือของ WebConverter สามารถดึงข้อความจาก PDF ที่จำกัดสิทธิ์ส่วนใหญ่ได้ เพราะข้อจำกัดอยู่ที่ระดับแอปพลิเคชัน ไม่ใช่ระดับข้อมูล — ข้อความยังคงอยู่ในไฟล์ อย่างไรก็ตาม PDF ที่เข้ารหัสซึ่งต้องใช้รหัสผ่านเพื่อเปิดไม่สามารถประมวลผลได้หากไม่มีรหัสผ่านที่ถูกต้อง
ข้อพิจารณาด้านความเป็นส่วนตัวและความปลอดภัย
PDF มักมีข้อมูลที่ละเอียดอ่อน — สัญญา งบการเงิน บันทึกทางการแพทย์ เอกสารทางกฎหมาย การอัปโหลดไฟล์เหล่านี้ไปยังตัวแปลงออนไลน์สร้างความเสี่ยงอย่างมีนัยสำคัญ:
- การเปิดเผยข้อมูล: เอกสารของคุณผ่านเซิร์ฟเวอร์ของบุคคลที่สาม คุณไม่มีหลักประกันเกี่ยวกับวิธีการจัดเก็บ ใครสามารถเข้าถึงได้ หรือเมื่อใดที่จะถูกลบ
- การละเมิดข้อกำหนด: การอัปโหลดเอกสารที่มีข้อมูลส่วนบุคคล (ชื่อ ที่อยู่ ข้อมูลสุขภาพ) ไปยังเซิร์ฟเวอร์ที่ไม่ผ่านการตรวจสอบอาจละเมิด GDPR, HIPAA หรือกฎระเบียบคุ้มครองข้อมูลอื่น ๆ
- การรั่วไหลของเมตาดาต้า: PDF อาจมีเมตาดาต้าที่ซ่อนอยู่ — ชื่อผู้เขียน ประวัติการแก้ไข ความคิดเห็น — ที่คุณอาจไม่ต้องการแบ่งปันกับบุคคลที่สาม
WebConverter ประมวลผลไฟล์ทั้งหมด ในเครื่องในเบราว์เซอร์ของคุณ PDF ของคุณไม่เคยออกจากอุปกรณ์ของคุณ นี่ทำให้เป็นตัวเลือกที่ปลอดภัยที่สุดสำหรับการแปลงเอกสารที่ละเอียดอ่อน ไม่มีการอัปโหลด ไม่มีการประมวลผลฝั่งเซิร์ฟเวอร์ และไม่มีการเก็บข้อมูล
วิธีอื่น ๆ
คัดลอก-วางจากโปรแกรมดู PDF
วิธีที่ง่ายที่สุด — เปิด PDF ใน Chrome, Adobe Reader หรือ Preview เลือกข้อความ คัดลอก แล้ววางลงใน Word วิธีนี้ใช้ได้ดีกับ PDF ที่เรียบง่าย คอลัมน์เดียว ที่ใช้ฟอนต์มาตรฐาน แต่ใช้ไม่ได้กับเลย์เอาต์ที่ซับซ้อน เอกสารหลายคอลัมน์ และ PDF ที่สแกน
Google Docs
อัปโหลด PDF ไปยัง Google Drive และเปิดด้วย Google Docs Google จะทำ OCR กับ PDF ที่สแกนและพยายามแปลงเลย์เอาต์ ผลลัพธ์แตกต่างกันมาก — เอกสารที่เรียบง่ายแปลงได้ดี เลย์เอาต์ที่ซับซ้อนไม่ดี โปรดทราบว่าวิธีนี้อัปโหลดเอกสารของคุณไปยังเซิร์ฟเวอร์ของ Google
ซอฟต์แวร์เดสก์ท็อป
LibreOffice และ Microsoft Word สามารถเปิดไฟล์ PDF ได้โดยตรง นี่เป็นตัวเลือกที่ดีสำหรับการแปลงเอกสารที่มีความซับซ้อนปานกลางเป็นครั้งคราวเมื่อคุณต้องการให้ทุกอย่างอยู่แบบออฟไลน์
คำถามที่พบบ่อย
ฉันสามารถแปลง PDF เป็น Word ได้ฟรีหรือไม่?
ได้ คุณสามารถดึงข้อความจาก PDF ได้ฟรีโดยใช้ เครื่องมือ PDF เป็นข้อความของ WebConverter หรือ เครื่องมือ PDF เป็น Markdown ซึ่งทั้งสองทำงานในเบราว์เซอร์ของคุณโดยไม่ต้องอัปโหลด สำหรับการแปลงที่รักษาเลย์เอาต์อย่างเต็มรูปแบบ LibreOffice (ฟรี โอเพนซอร์ส) และ Microsoft Word (2013 ขึ้นไป) สามารถเปิดไฟล์ PDF ได้โดยตรง
ทำไมเอกสารที่แปลงแล้วของฉันถึงดูแตกต่างจาก PDF ต้นฉบับ?
PDF จัดเก็บคำสั่งเลย์เอาต์ภาพ ไม่ใช่โครงสร้างเอกสาร ตัวแปลงต้องวิศวกรรมย้อนกลับโครงสร้าง ซึ่งโดยธรรมชาติแล้วไม่สมบูรณ์แบบ การแทนที่ฟอนต์ การจัดเรียงคอลัมน์ใหม่ และการสร้างตารางใหม่เป็นสาเหตุที่พบบ่อยของความแตกต่าง เอกสารที่เรียบง่ายกว่าจะแปลงได้แม่นยำกว่า
ฉันสามารถแปลง PDF ที่สแกนเป็นข้อความที่แก้ไขได้หรือไม่?
ได้ โดยใช้ OCR (Optical Character Recognition) WebConverter มี OCR ที่ใช้ Tesseract.js ซึ่งสามารถจดจำข้อความใน PDF ที่สแกนได้ ความแม่นยำขึ้นอยู่กับคุณภาพการสแกน ความชัดของฟอนต์ และภาษา เพื่อผลลัพธ์ที่ดีที่สุด ใช้การสแกนความละเอียดสูง (300 DPI ขึ้นไป) ด้วยฟอนต์มาตรฐานที่ชัดเจน
การแปลง PDF ออนไลน์ปลอดภัยหรือไม่?
ตัวแปลงออนไลน์ส่วนใหญ่อัปโหลดไฟล์ของคุณไปยังเซิร์ฟเวอร์ ซึ่งก่อให้เกิดความเสี่ยงด้านความเป็นส่วนตัวและความปลอดภัย — โดยเฉพาะอย่างยิ่งสำหรับเอกสารที่ละเอียดอ่อน WebConverter ประมวลผลทุกอย่างในเครื่องในเบราว์เซอร์ของคุณ PDF ของคุณไม่เคยออกจากอุปกรณ์ของคุณ ทำให้ปลอดภัยสำหรับเอกสารลับ เอกสารทางกฎหมาย และเอกสารทางการแพทย์
ฉันจะรักษาการจัดรูปแบบไว้เมื่อแปลง PDF เป็น Word ได้อย่างไร?
เพื่อรักษาการจัดรูปแบบให้ดีที่สุด ลองเปิด PDF โดยตรงใน Microsoft Word หรือ LibreOffice Writer สำหรับการดึงข้อความที่เน้นข้อความ ใช้เครื่องมือ PDF เป็น Markdown ของ WebConverter ซึ่งรักษาหัวเรื่องและโครงสร้างรายการไว้ การจัดรูปแบบที่ซับซ้อน (เลย์เอาต์หลายคอลัมน์ รูปภาพที่ฝัง) อาจต้องปรับด้วยตนเองโดยไม่คำนึงถึงเครื่องมือที่ใช้
ฉันสามารถแปลง PDF ที่ป้องกันด้วยรหัสผ่านได้หรือไม่?
หาก PDF ต้องใช้รหัสผ่านเพื่อเปิด คุณต้องป้อนรหัสผ่านนั้นก่อนที่เครื่องมือใด ๆ จะสามารถประมวลผลได้ หาก PDF เปิดอยู่แต่มีข้อจำกัดในการคัดลอกหรือแก้ไข (การรักษาความปลอดภัยตามสิทธิ์) เครื่องมือส่วนใหญ่ — รวมถึง WebConverter — ยังคงสามารถดึงเนื้อหาข้อความได้
พร้อมที่จะแปลงรูปภาพของคุณแล้วหรือยัง?
ทดลองใช้ WebConverter ฟรี