Примечание редактора (2026-05). Chrome 150 объявил navigator.modelContext устаревшим в пользу document.modelContext (согласно PR #184 спецификации WebMCP). Примеры в этой статье используют рекомендованный командой Chrome прямо-совместимый шаблон обнаружения функций:

const modelContext = document.modelContext || navigator.modelContext;
if (modelContext) {
  // Register tools...
}

Собственная интеграция WebConverter использует именно этот резервный шаблон, поэтому продолжает работать в браузерах, которые всё ещё предоставляют старый идентификатор.

Когда мы только выпустили поддержку WebMCP, была подключена лишь конвертация изображений. С сегодняшнего дня каждая функция сайта предоставляется как инструмент WebMCP: ИИ-агент может вызывать document.modelContext и конвертировать изображения, создавать и редактировать PDF, выполнять OCR сканов, извлекать текст из PDF, конвертировать документы с помощью Pandoc, конвертировать и обрезать видео, конвертировать и извлекать аудио, расшифровывать речь с помощью Whisper и удалять фон с изображений — всё локально в браузере, всё без какой-либо загрузки.

Полный каталог инструментов

Тринадцать инструментов зарегистрированы глобально — на каждой странице WebConverter, а не только на странице WebMCP — поэтому агент может использовать их откуда бы ни находился пользователь. Все они возвращают файл в base64 плюс URL data: (и, где уместно, структурированный вывод в виде простого текста или JSON).

Инструменты включают: convert_image (с откатом на декодирование браузером, который добавляет HEIC в Safari/iOS и AVIF), images_to_pdf, images_to_searchable_pdf (Tesseract OCR), merge_pdfs, reorder_pdf_pages, delete_pdf_pages, extract_pdf_text (pdf.js), convert_document (Pandoc), convert_audio, convert_video и trim_video (ffmpeg-wasm), remove_image_background (U²-Net + маттинг на WASM), transcribe_audio (Whisper) и list_supported_formats для обнаружения.

Почему это важно для агентов

У ИИ-ассистента, который хочет сделать что-то с файлом сегодня, обычно три плохих варианта: загрузить его в стороннее API, запустить серверный инструмент, который касается ваших данных, или отказаться. WebMCP меняет это, потому что инструмент — это собственный JavaScript страницы. Агент получает возможность; ваш файл никогда не покидает вкладку. Нет ни ключа API, ни ограничения частоты, ни затрат, и почти нулевые выбросы CO2, потому что цикла загрузка-обработка-скачивание просто не происходит.

Лениво по замыслу

Бутстрап webmcp.js крошечный. Тяжёлые части — WASM Pandoc ~56 МБ, ядра ffmpeg, ONNX-модель U²-Net, модель Whisper, языковые данные Tesseract — скачиваются только при первом вызове соответствующего инструмента, после чего браузер кэширует их. Агенты, которые никогда не вызывают convert_video, никогда не платят за загрузку ffmpeg.

Приватность, безопасность, честность

Каждый инструмент помечен readOnlyHint: байты на вход, байты на выход, никаких записей, никаких сетевых вызовов, кроме разовой ленивой загрузки движка. Мы честны и насчёт форматов — HEIC указан как «только Safari/iOS», потому что это правда: Chrome и Firefox не декодируют HEIC нативно, а поставлять многомегабайтный декодер HEIC означало бы нарушить бюджет размера ассетов проекта. Откат декодирует только то, что может декодировать сам браузер, и не более того.

Попробуйте

Страница WebMCP содержит список всех зарегистрированных инструментов и включает работающую живую демонстрацию. Если вы создаёте агента в браузере — или просто хотите увидеть, как выглядит полноценный сервер WebMCP — вот так выглядит честная, приватная, бесплатная поверхность файловых инструментов. И это всего лишь веб-страница.

Готовы конвертировать изображения?

Попробуйте WebConverter бесплатно