หมายเหตุของบรรณาธิการ (2026-05) Chrome 150 ได้ทำเครื่องหมาย
navigator.modelContextเป็นที่ไม่แนะนำให้ใช้แล้ว และเปลี่ยนไปใช้document.modelContextแทน (ตาม WebMCP spec PR #184) ตัวอย่างในโพสต์นี้ใช้รูปแบบการตรวจจับคุณลักษณะแบบเข้ากันได้ในอนาคตที่ทีม Chrome แนะนำ:const modelContext = document.modelContext || navigator.modelContext; if (modelContext) { // Register tools... }การเชื่อมต่อของ WebConverter เองก็ใช้รูปแบบสำรองนี้แบบเดียวกัน จึงยังคงทำงานได้บนเบราว์เซอร์ที่ยังคงใช้ตัวระบุแบบเก่า
ตอนที่เราเปิดตัวการรองรับ WebMCP ครั้งแรก มีเพียงการแปลงรูปภาพเท่านั้นที่ถูกเชื่อมต่อ ณ วันนี้ทุกฟีเจอร์บนเว็บไซต์ถูกเปิดเผยเป็นเครื่องมือ WebMCP: เอเจนต์ AI สามารถเรียก document.modelContext และแปลงรูปภาพ, สร้างและแก้ไข PDF, OCR เอกสารสแกน, สกัดข้อความ PDF, แปลงเอกสารด้วย Pandoc, แปลงและตัดวิดีโอ, แปลงและสกัดเสียง, ถอดเสียงพูดด้วย Whisper และลบพื้นหลังรูปภาพ — ทั้งหมดในเครื่องภายในเบราว์เซอร์ ทั้งหมดโดยไม่ต้องอัปโหลดอะไรเลย
แคตตาล็อกเครื่องมือฉบับเต็ม
เครื่องมือทั้งสิบสามถูกลงทะเบียนทั่วทั้งระบบ — บนทุกหน้าของ WebConverter ไม่ใช่แค่บนหน้า WebMCP — เพื่อให้เอเจนต์สามารถใช้งานได้จากที่ใดก็ตามที่ผู้ใช้อยู่ ทั้งหมดคืนค่าไฟล์ base64 พร้อม URL data: (และเมื่อเหมาะสม เอาต์พุตเชิงโครงสร้างเป็นข้อความธรรมดาหรือ JSON)
เครื่องมือประกอบด้วย: convert_image (พร้อมตัวสำรองถอดรหัสของเบราว์เซอร์ที่เพิ่ม HEIC บน Safari/iOS และ AVIF), images_to_pdf, images_to_searchable_pdf (Tesseract OCR), merge_pdfs, reorder_pdf_pages, delete_pdf_pages, extract_pdf_text (pdf.js), convert_document (Pandoc), convert_audio, convert_video และ trim_video (ffmpeg-wasm), remove_image_background (U²-Net + matting WASM), transcribe_audio (Whisper) และ list_supported_formats สำหรับการค้นพบ
ทำไมเรื่องนี้สำคัญสำหรับเอเจนต์
ผู้ช่วย AI ที่ต้องการทำอะไรกับไฟล์ในวันนี้มักจะมีสามทางเลือกที่ไม่ดี: อัปโหลดไปยัง API ของบุคคลที่สาม เรียกใช้เครื่องมือฝั่งเซิร์ฟเวอร์ที่แตะข้อมูลของคุณ หรือปฏิเสธ WebMCP เปลี่ยนสิ่งนั้นเพราะเครื่องมือ คือ JavaScript ของหน้าเว็บเอง เอเจนต์ได้รับความสามารถ ไฟล์ของคุณไม่เคยออกจากแท็บ ไม่มีคีย์ API ไม่มีการจำกัดอัตรา ไม่มีค่าใช้จ่าย และแทบไม่มี CO2 เพราะวงจรอัปโหลด-ประมวลผล-ดาวน์โหลดไม่เคยเกิดขึ้น
ขี้เกียจตามการออกแบบ
โค้ดบูตสแตรป webmcp.js มีขนาดเล็กมาก ส่วนที่แพง — Pandoc's ~56 MB WASM, แกน ffmpeg, โมเดล ONNX U²-Net, โมเดล Whisper, ข้อมูลภาษาของ Tesseract — จะถูกดึงมาเฉพาะครั้งแรกที่เครื่องมือที่ตรงกันถูกเรียกเท่านั้น จากนั้นเบราว์เซอร์จะแคชไว้ เอเจนต์ที่ไม่เคยเรียก convert_video จะไม่เคยต้องจ่ายค่าดาวน์โหลด ffmpeg
ความเป็นส่วนตัว ความปลอดภัย ความซื่อสัตย์
ทุกเครื่องมือมีคำอธิบายประกอบ readOnlyHint: ไบต์เข้า ไบต์ออก ไม่มีการเขียน ไม่มีการเรียกเครือข่ายยกเว้นการดาวน์โหลดเอนจินแบบ lazy ครั้งเดียว เราซื่อสัตย์เกี่ยวกับรูปแบบเช่นกัน — HEIC ถูกระบุว่า "เฉพาะ Safari/iOS" เพราะนั่นคือความจริง: Chrome และ Firefox ไม่ถอดรหัส HEIC โดยกำเนิด และการส่งตัวถอดรหัส HEIC ขนาดหลายเมกะไบต์จะละเมิดงบประมาณขนาดทรัพยากรของโปรเจกต์ ตัวสำรองถอดรหัสสิ่งใดก็ตามที่เบราว์เซอร์เองสามารถถอดรหัสได้ และไม่เกินกว่านั้น
ลองใช้
หน้า WebMCP แสดงรายการเครื่องมือที่ลงทะเบียนทุกตัวและมีเดโมสดที่ใช้งานได้ หากคุณกำลังสร้างเอเจนต์ในเบราว์เซอร์ — หรือเพียงแค่อยากเห็นว่าเซิร์ฟเวอร์ WebMCP ที่สมบูรณ์มีหน้าตาอย่างไร — นี่คือลักษณะของพื้นผิวเครื่องมือไฟล์ที่ซื่อสัตย์ เป็นส่วนตัว ไม่มีค่าใช้จ่าย และมันเป็นเพียงหน้าเว็บ
พร้อมที่จะแปลงรูปภาพของคุณแล้วหรือยัง?
ทดลองใช้ WebConverter ฟรี