ทุกฟีเจอร์ของ WebConverter ตอนนี้เป็นเครื่องมือ WebMCP — PDF, OCR, Whisper, วิดีโอ, ลบพื้นหลัง

หมายเหตุของบรรณาธิการ (2026-05) Chrome 150 ได้ทำเครื่องหมาย navigator.modelContext เป็นที่ไม่แนะนำให้ใช้แล้ว และเปลี่ยนไปใช้ document.modelContext แทน (ตาม WebMCP spec PR #184) ตัวอย่างในโพสต์นี้ใช้รูปแบบการตรวจจับคุณลักษณะแบบเข้ากันได้ในอนาคตที่ทีม Chrome แนะนำ:
const modelContext = document.modelContext || navigator.modelContext;
if (modelContext) {
  // Register tools...
}
การเชื่อมต่อของ WebConverter เองก็ใช้รูปแบบสำรองนี้แบบเดียวกัน จึงยังคงทำงานได้บนเบราว์เซอร์ที่ยังคงใช้ตัวระบุแบบเก่า

ตอนที่เราเปิดตัวการรองรับ WebMCP ครั้งแรก มีเพียงการแปลงรูปภาพเท่านั้นที่ถูกเชื่อมต่อ ณ วันนี้ทุกฟีเจอร์บนเว็บไซต์ถูกเปิดเผยเป็นเครื่องมือ WebMCP: เอเจนต์ AI สามารถเรียก document.modelContext และแปลงรูปภาพ, สร้างและแก้ไข PDF, OCR เอกสารสแกน, สกัดข้อความ PDF, แปลงเอกสารด้วย Pandoc, แปลงและตัดวิดีโอ, แปลงและสกัดเสียง, ถอดเสียงพูดด้วย Whisper และลบพื้นหลังรูปภาพ — ทั้งหมดในเครื่องภายในเบราว์เซอร์ ทั้งหมดโดยไม่ต้องอัปโหลดอะไรเลย

แคตตาล็อกเครื่องมือฉบับเต็ม

เครื่องมือทั้งสิบสามถูกลงทะเบียนทั่วทั้งระบบ — บนทุกหน้าของ WebConverter ไม่ใช่แค่บนหน้า WebMCP — เพื่อให้เอเจนต์สามารถใช้งานได้จากที่ใดก็ตามที่ผู้ใช้อยู่ ทั้งหมดคืนค่าไฟล์ base64 พร้อม URL data: (และเมื่อเหมาะสม เอาต์พุตเชิงโครงสร้างเป็นข้อความธรรมดาหรือ JSON)

เครื่องมือประกอบด้วย: convert_image (พร้อมตัวสำรองถอดรหัสของเบราว์เซอร์ที่เพิ่ม HEIC บน Safari/iOS และ AVIF), images_to_pdf, images_to_searchable_pdf (Tesseract OCR), merge_pdfs, reorder_pdf_pages, delete_pdf_pages, extract_pdf_text (pdf.js), convert_document (Pandoc), convert_audio, convert_video และ trim_video (ffmpeg-wasm), remove_image_background (U²-Net + matting WASM), transcribe_audio (Whisper) และ list_supported_formats สำหรับการค้นพบ

ทำไมเรื่องนี้สำคัญสำหรับเอเจนต์

ผู้ช่วย AI ที่ต้องการทำอะไรกับไฟล์ในวันนี้มักจะมีสามทางเลือกที่ไม่ดี: อัปโหลดไปยัง API ของบุคคลที่สาม เรียกใช้เครื่องมือฝั่งเซิร์ฟเวอร์ที่แตะข้อมูลของคุณ หรือปฏิเสธ WebMCP เปลี่ยนสิ่งนั้นเพราะเครื่องมือ คือ JavaScript ของหน้าเว็บเอง เอเจนต์ได้รับความสามารถ ไฟล์ของคุณไม่เคยออกจากแท็บ ไม่มีคีย์ API ไม่มีการจำกัดอัตรา ไม่มีค่าใช้จ่าย และแทบไม่มี CO₂ เพราะวงจรอัปโหลด-ประมวลผล-ดาวน์โหลดไม่เคยเกิดขึ้น

ขี้เกียจตามการออกแบบ

โค้ดบูตสแตรป webmcp.js มีขนาดเล็กมาก ส่วนที่แพง — Pandoc's ~56 MB WASM, แกน ffmpeg, โมเดล ONNX U²-Net, โมเดล Whisper, ข้อมูลภาษาของ Tesseract — จะถูกดึงมาเฉพาะครั้งแรกที่เครื่องมือที่ตรงกันถูกเรียกเท่านั้น จากนั้นเบราว์เซอร์จะแคชไว้ เอเจนต์ที่ไม่เคยเรียก convert_video จะไม่เคยต้องจ่ายค่าดาวน์โหลด ffmpeg

ความเป็นส่วนตัว ความปลอดภัย ความซื่อสัตย์

ทุกเครื่องมือมีคำอธิบายประกอบ readOnlyHint: ไบต์เข้า ไบต์ออก ไม่มีการเขียน ไม่มีการเรียกเครือข่ายยกเว้นการดาวน์โหลดเอนจินแบบ lazy ครั้งเดียว เราซื่อสัตย์เกี่ยวกับรูปแบบเช่นกัน — HEIC ถูกระบุว่า "เฉพาะ Safari/iOS" เพราะนั่นคือความจริง: Chrome และ Firefox ไม่ถอดรหัส HEIC โดยกำเนิด และการส่งตัวถอดรหัส HEIC ขนาดหลายเมกะไบต์จะละเมิดงบประมาณขนาดทรัพยากรของโปรเจกต์ ตัวสำรองถอดรหัสสิ่งใดก็ตามที่เบราว์เซอร์เองสามารถถอดรหัสได้ และไม่เกินกว่านั้น

ลองใช้

หน้า WebMCP แสดงรายการเครื่องมือที่ลงทะเบียนทุกตัวและมีเดโมสดที่ใช้งานได้ หากคุณกำลังสร้างเอเจนต์ในเบราว์เซอร์ — หรือเพียงแค่อยากเห็นว่าเซิร์ฟเวอร์ WebMCP ที่สมบูรณ์มีหน้าตาอย่างไร — นี่คือลักษณะของพื้นผิวเครื่องมือไฟล์ที่ซื่อสัตย์ เป็นส่วนตัว ไม่มีค่าใช้จ่าย และมันเป็นเพียงหน้าเว็บ

พร้อมที่จะแปลงรูปภาพของคุณแล้วหรือยัง?

ทดลองใช้ WebConverter ฟรี