مدیر کا نوٹ (2026-05)۔ Chrome 150 نے
navigator.modelContextکو متروک قرار دیا اور اس کی جگہdocument.modelContextاپنایا (WebMCP اسپیک PR #184 کے مطابق)۔ اس پوسٹ کی مثالیں Chrome ٹیم کی تجویز کردہ آگے-ہم آہنگ فیچر ڈیٹیکشن پیٹرن استعمال کرتی ہیں:const modelContext = document.modelContext || navigator.modelContext; if (modelContext) { // Register tools... }WebConverter کا اپنا انضمام بھی بالکل یہی فال بیک استعمال کرتا ہے، اس لیے یہ ان براؤزرز پر کام کرتا رہتا ہے جو پرانا شناخت کنندہ استعمال کرتے ہیں۔
جب ہم نے پہلی بار WebMCP سپورٹ شپ کیا تھا، تو صرف تصویر کی تبدیلی ہی جوڑی گئی تھی۔ آج سے سائٹ کی ہر خصوصیت کو ایک WebMCP ٹول کے طور پر ظاہر کیا گیا ہے: ایک AI ایجنٹ document.modelContext کال کر سکتا ہے اور تصاویر تبدیل کر سکتا ہے، PDF بنا اور ترمیم کر سکتا ہے، اسکین پر OCR کر سکتا ہے، PDF متن نکال سکتا ہے، Pandoc کے ساتھ دستاویزات تبدیل کر سکتا ہے، ویڈیو تبدیل اور ٹرم کر سکتا ہے، آڈیو تبدیل اور نکال سکتا ہے، Whisper کے ساتھ تقریر ٹرانسکرائب کر سکتا ہے، اور تصاویر کا پس منظر ہٹا سکتا ہے — سب کچھ مقامی طور پر براؤزر میں، بغیر کچھ اپلوڈ کیے۔
مکمل ٹول کیٹلاگ
تیرہ ٹولز عالمی سطح پر رجسٹرڈ ہیں — WebConverter کے ہر صفحے پر، صرف WebMCP صفحے پر نہیں — تاکہ ایک ایجنٹ صارف جہاں بھی ہو وہاں سے انہیں استعمال کر سکے۔ وہ سب ایک base64 فائل کے ساتھ ایک data: URL واپس کرتے ہیں (اور جہاں مناسب ہو، منظم آؤٹ پٹ کو سادہ متن یا JSON کے طور پر)۔
ٹولز میں شامل ہیں: convert_image (ایک براؤزر-ڈیکوڈ فال بیک کے ساتھ جو Safari/iOS پر HEIC اور AVIF شامل کرتا ہے)، images_to_pdf، images_to_searchable_pdf (Tesseract OCR)، merge_pdfs، reorder_pdf_pages، delete_pdf_pages، extract_pdf_text (pdf.js)، convert_document (Pandoc)، convert_audio، convert_video اور trim_video (ffmpeg-wasm)، remove_image_background (U²-Net + WASM matting)، transcribe_audio (Whisper)، اور دریافت کے لیے list_supported_formats۔
ایجنٹس کے لیے یہ کیوں اہم ہے
ایک AI معاون جو آج کسی فائل کے ساتھ کچھ کرنا چاہتا ہے، اس کے پاس عام طور پر تین برے انتخاب ہوتے ہیں: کسی تیسرے فریق کی API پر اپلوڈ کریں، ایک سرور-سائیڈ ٹول چلائیں جو آپ کے ڈیٹا کو چھوتا ہے، یا انکار کر دیں۔ WebMCP یہ بدل دیتا ہے کیونکہ ٹول صفحے کا اپنا JavaScript ہے۔ ایجنٹ کو صلاحیت ملتی ہے؛ آپ کی فائل کبھی ٹیب نہیں چھوڑتی۔ کوئی API کلید نہیں، کوئی شرح حد نہیں، کوئی لاگت نہیں، اور تقریباً صفر CO2 کیونکہ اپلوڈ-پراسیس-ڈاؤن لوڈ کا چکر کبھی ہوتا ہی نہیں۔
ڈیزائن کے لحاظ سے کسل آلود
webmcp.js بوٹ سٹریپ چھوٹا ہے۔ مہنگے حصے — Pandoc کا ~56 MB WASM، ffmpeg کور، U²-Net ONNX ماڈل، Whisper ماڈل، Tesseract کا زبان کا ڈیٹا — صرف پہلی بار جب متعلقہ ٹول کو کال کیا جاتا ہے تب فیچ ہوتے ہیں، پھر براؤزر انہیں کیش کر لیتا ہے۔ وہ ایجنٹس جو کبھی convert_video کال نہیں کرتے وہ کبھی ffmpeg ڈاؤن لوڈ کی قیمت ادا نہیں کرتے۔
رازداری، حفاظت، ایمانداری
ہر ٹول readOnlyHint کے ساتھ نشان زد ہے: بائٹس اندر، بائٹس باہر، کوئی لکھائی نہیں، اور ایک بار کے کسل آلود انجن ڈاؤن لوڈ کے علاوہ کوئی نیٹ ورک کال نہیں۔ ہم فارمیٹس کے بارے میں بھی ایماندار ہیں — HEIC کو "صرف Safari/iOS" کے طور پر درج کیا گیا ہے کیونکہ یہی سچ ہے: Chrome اور Firefox HEIC کو مقامی طور پر ڈیکوڈ نہیں کرتے، اور کئی میگابائٹ کا HEIC ڈیکوڈر شپ کرنا منصوبے کے اثاثہ-سائز بجٹ کی خلاف ورزی ہوگی۔ فال بیک وہی ڈیکوڈ کرتا ہے جو براؤزر خود ڈیکوڈ کر سکتا ہے، اور اس سے زیادہ کچھ نہیں۔
اسے آزمائیں
WebMCP صفحہ ہر رجسٹرڈ ٹول کی فہرست دیتا ہے اور اس میں ایک کام کرنے والا لائیو ڈیمو شامل ہے۔ اگر آپ ایک ان-براؤزر ایجنٹ بنا رہے ہیں — یا صرف یہ دیکھنا چاہتے ہیں کہ ایک مکمل WebMCP سرور کیسا دکھتا ہے — تو ایک ایماندار، نجی، صفر-لاگت والی فائل-ٹولز کی سطح ایسی ہی دکھتی ہے۔ اور یہ صرف ایک ویب پیج ہے۔
اپنی تصاویر کنورٹ کرنے کے لیے تیار ہیں؟
WebConverter مفت آزمائیں