संपादक की टिप्पणी (2026-05)। Chrome 150 ने navigator.modelContext को document.modelContext के पक्ष में अप्रचलित कर दिया (WebMCP स्पेक PR #184 के अनुसार)। इस पोस्ट के उदाहरण Chrome टीम द्वारा अनुशंसित आगे-संगत फीचर-डिटेक्शन पैटर्न का उपयोग करते हैं:

const modelContext = document.modelContext || navigator.modelContext;
if (modelContext) {
  // Register tools...
}

WebConverter का अपना एकीकरण इसी फॉलबैक का उपयोग करता है, इसलिए यह उन ब्राउज़रों पर भी काम करता रहता है जो अभी भी पुराने पहचानकर्ता का उपयोग करते हैं।

जब हमने पहली बार WebMCP समर्थन शिप किया था, तब केवल छवि रूपांतरण ही जुड़ा हुआ था। आज से, साइट की हर सुविधा को एक WebMCP टूल के रूप में उजागर किया गया है: एक AI एजेंट document.modelContext कॉल कर सकता है और छवियाँ रूपांतरित कर सकता है, PDF बना और संपादित कर सकता है, स्कैन पर OCR कर सकता है, PDF टेक्स्ट निकाल सकता है, Pandoc से दस्तावेज़ रूपांतरित कर सकता है, वीडियो रूपांतरित और ट्रिम कर सकता है, ऑडियो रूपांतरित और निकाल सकता है, Whisper से वाक ट्रांसक्राइब कर सकता है, और छवि की पृष्ठभूमि हटा सकता है — सब कुछ स्थानीय रूप से ब्राउज़र में, बिना कुछ भी अपलोड किए।

संपूर्ण टूल कैटलॉग

तेरह टूल वैश्विक रूप से पंजीकृत हैं — WebConverter के हर पेज पर, केवल WebMCP पेज पर नहीं — ताकि एक एजेंट जहाँ भी उपयोगकर्ता हो वहाँ से उनका उपयोग कर सके। वे सभी एक base64 फ़ाइल और एक data: URL लौटाते हैं (और जहाँ उपयुक्त हो, संरचित आउटपुट को सादे टेक्स्ट या JSON के रूप में)।

टूल में शामिल हैं: convert_image (एक ब्राउज़र-डिकोड फ़ॉलबैक के साथ जो Safari/iOS पर HEIC और AVIF जोड़ता है), images_to_pdf, images_to_searchable_pdf (Tesseract OCR), merge_pdfs, reorder_pdf_pages, delete_pdf_pages, extract_pdf_text (pdf.js), convert_document (Pandoc), convert_audio, convert_video और trim_video (ffmpeg-wasm), remove_image_background (U²-Net + WASM matting), transcribe_audio (Whisper), और खोज के लिए list_supported_formats

यह एजेंट के लिए क्यों मायने रखता है

एक AI सहायक जो आज किसी फ़ाइल के साथ कुछ करना चाहता है, उसके पास आमतौर पर तीन ख़राब विकल्प होते हैं: किसी तीसरे पक्ष की API पर अपलोड करें, सर्वर-साइड टूल चलाएँ जो आपके डेटा को छूता है, या मना कर दे। WebMCP इसे बदल देता है क्योंकि टूल पेज का अपना JavaScript ही है। एजेंट को क्षमता मिलती है; आपकी फ़ाइल कभी टैब नहीं छोड़ती। कोई API कुंजी नहीं, कोई दर सीमा नहीं, कोई लागत नहीं, और लगभग शून्य CO2 क्योंकि अपलोड-प्रोसेस-डाउनलोड का चक्कर कभी होता ही नहीं।

डिज़ाइन से लेज़ी

webmcp.js बूटस्ट्रैप छोटा है। महँगे हिस्से — Pandoc का ~56 MB WASM, ffmpeg कोर, U²-Net ONNX मॉडल, Whisper मॉडल, Tesseract के भाषा डेटा — केवल पहली बार ही फ़ेच होते हैं जब संगत टूल को कॉल किया जाता है, फिर ब्राउज़र उन्हें कैश कर लेता है। जो एजेंट कभी convert_video नहीं कॉल करते वे कभी ffmpeg डाउनलोड की क़ीमत नहीं चुकाते।

गोपनीयता, सुरक्षा, ईमानदारी

हर टूल readOnlyHint के रूप में चिह्नित है: बाइट्स अंदर, बाइट्स बाहर, कोई लेखन नहीं, और एक बार के लेज़ी इंजन डाउनलोड के अलावा कोई नेटवर्क कॉल नहीं। हम प्रारूपों के बारे में भी ईमानदार हैं — HEIC को "केवल Safari/iOS" के रूप में सूचीबद्ध किया गया है क्योंकि यही सच है: Chrome और Firefox HEIC को मूल रूप से डिकोड नहीं करते, और एक मल्टी-मेगाबाइट HEIC डिकोडर शिप करना परियोजना के एसेट-साइज़ बजट का उल्लंघन होगा। फ़ॉलबैक वही डिकोड करता है जो ब्राउज़र स्वयं कर सकता है, और उससे अधिक नहीं।

इसे आज़माएँ

WebMCP पेज हर पंजीकृत टूल को सूचीबद्ध करता है और इसमें एक कार्यशील लाइव डेमो शामिल है। यदि आप एक इन-ब्राउज़र एजेंट बना रहे हैं — या केवल देखना चाहते हैं कि एक संपूर्ण WebMCP सर्वर कैसा दिखता है — तो यही है कि एक ईमानदार, निजी, शून्य-लागत वाली फ़ाइल-टूल सतह कैसी दिखती है। और यह केवल एक वेब पेज है।

अपनी तस्वीरें कन्वर्ट करने के लिए तैयार हैं?

WebConverter मुफ़्त में आज़माएँ