Готов для агентов · WebMCP

Конвертер файлов WebMCP

WebConverter теперь является сервером WebMCP: ИИ-агенты могут конвертировать ваши файлы через document.modelContext — и конвертация по-прежнему выполняется полностью в вашем браузере.

WebMCP (Web Model Context Protocol) позволяет веб-сайту передавать структурированные инструменты напрямую ИИ-агентам. WebConverter регистрирует свои инструменты конвертации, чтобы агент мог конвертировать изображения для вас — без загрузки, без ключа API и без того, чтобы какой-либо сервер когда-либо касался ваших файлов.

Что такое WebMCP?

WebMCP — это черновой стандарт W3C от Web Machine Learning Community Group. Он добавляет в браузер document.modelContext, чтобы страница могла регистрировать инструменты — каждый с именем, описанием и JSON Schema — которые ИИ-агент может обнаружить и вызвать. В отличие от классического сервера MCP здесь нет отдельного процесса и нет токена: инструмент — это собственный JavaScript страницы, поэтому ваши данные никогда не покидают вкладку.

Почему File Converter MCP без загрузки?

Большинство ИИ-ассистентов может конвертировать файл только путём его загрузки в стороннее API. Инструменты WebMCP в WebConverter выполняют тот же конвейер WebAssembly, который использует человеческий интерфейс, внутри Web Worker. Агент передаёт байты на вход и получает байты на выходе — без загрузки, без ограничений частоты, без затрат, с почти нулевым CO₂. Это самый приватный способ для агента конвертировать файл.

Как агент это использует

Сначала агент вызывает list_supported_formats, чтобы узнать, какие форматы допустимы, затем вызывает convert_image с файлом и целевым форматом. Инструмент возвращает сконвертированный файл в виде base64 плюс URL data:. Всё детерминировано и описано через JSON Schema, поэтому агенту никогда не приходится гадать.

Приватность и безопасность по умолчанию

Предоставляемые инструменты строго доступны только для чтения: они принимают байты и возвращают байты. Они никогда не пишут на диск, никогда не делают сетевых запросов и никогда не читают другие вкладки. Агент, вызывающий эти инструменты, обладает ровно той же возможностью, что и человек, нажимающий «конвертировать» — и ничем больше.

Зарегистрированные инструменты WebMCP

Эти инструменты регистрируются через document.modelContext на каждой странице WebConverter и дублируются в программном реестре, чтобы они работали даже до появления нативной поддержки браузера.

convert_image

Конвертирует изображение (BMP, DDS, GIF, HDR, ICO, JPEG, KTX, PGM, PIC, PNG, PPM, PSD, TGA, WebP, а также HEIC/AVIF через декодер браузера) в PNG, JPEG, BMP, TGA, HDR, EXR, KTX2 или WebP. Возвращает base64 + URL data:. Выполняется локально, без загрузки.

images_to_pdf

Объединяет одно или несколько изображений в единый PDF, по одному изображению на страницу, в браузере.

images_to_searchable_pdf

Объединяет изображения в PDF и выполняет Tesseract OCR, чтобы итоговый PDF имел выделяемый и поисковый текст поверх исходных пикселей.

merge_pdfs

Объединяет несколько PDF в один (все страницы, по порядку) локально — без загрузки.

reorder_pdf_pages

Меняет порядок страниц PDF и записывает новый PDF с заданным порядком.

delete_pdf_pages

Удаляет указанные страницы из PDF, создавая новый PDF из оставшихся страниц в их исходном порядке.

extract_pdf_text

Извлекает текст из PDF (pdf.js) — простой текст по умолчанию или простой Markdown с одним заголовком на страницу.

convert_document

Конвертирует документы между форматами с помощью Pandoc (WASM): DOCX, ODT, RTF, HTML, Markdown, LaTeX, RST, EPUB, MediaWiki, … ↔ Markdown, HTML, plain, LaTeX, RST, AsciiDoc, DOCX, ODT. Ленивая загрузка ~56 МБ при первом использовании.

convert_audio

Конвертирует аудиофайл — или извлекает звуковую дорожку из видео — в MP3, OGG, WAV или FLAC. Принимается всё, что может декодировать браузер.

convert_video

Перекодирует видео в MP4 (H.264 + AAC), WebM (VP9 + Opus) или анимированный GIF с помощью ffmpeg-wasm. Ленивая загрузка для каждого варианта.

trim_video

Вырезает фрагмент с startTime → endTime из видео с помощью ffmpeg-wasm, локально.

remove_image_background

Создаёт прозрачную PNG- или WebP-версию изображения с помощью крошечной ONNX-модели U²-Net-P и детерминированного прохода маттинга на WASM.

transcribe_audio

Расшифровывает аудио — или звуковую дорожку видео — в текст с временными метками, используя квантизованную модель Whisper (whisper.cpp WASM). По умолчанию английский язык.

list_supported_formats

Перечисляет все входные/выходные форматы и движки по всем инструментам WebMCP, чтобы агент мог спланировать допустимую конвертацию.

Живая демонстрация — конвертация через инструмент WebMCP

Здесь вызывается тот же самый инструмент convert_image, который вызвал бы ИИ-агент. Выберите изображение, выберите формат, и конвертация выполнится локально в вашем браузере.

Совет: в Chrome вы можете включить нативное API по адресу chrome://flags/#enable-webmcp-testing. Эта демонстрация также работает без него благодаря встроенному реестру инструментов.

Конвертер файлов WebMCP — Вопросы и ответы

Что такое конвертер файлов WebMCP?

Это WebConverter, представленный как сервер WebMCP. Используя document.modelContext, ИИ-агенты могут вызывать convert_image и list_supported_formats, чтобы конвертировать изображения полностью в браузере — без загрузки и без ключа API.

Загружает ли он мои файлы на сервер?

Нет. Инструмент convert_image выполняет ту же конвертацию WebAssembly, что и интерфейс, внутри Web Worker. Ваш файл никогда не покидает вкладку браузера.

Какие браузеры поддерживают document.modelContext?

Оно доступно за флагом в недавних сборках Chrome (chrome://flags/#enable-webmcp-testing) и требует безопасного контекста. WebConverter также предоставляет программный реестр инструментов, чтобы те же инструменты работали до появления нативной поддержки.

Бесплатен ли File Converter MCP?

Да. Здесь нет бэкенда, нет ключа API и нет ограничений частоты — это так же бесплатно, как открыть страницу.

Какие форматы может конвертировать MCP?

Вход: BMP, DDS, GIF, HDR, ICO, JPEG, KTX, PGM, PIC, PNG, PPM, PSD, TGA, WebP. Выход: PNG, JPEG, BMP, TGA, HDR, EXR, KTX2, WebP.

Безопасно ли позволять агенту вызывать эти инструменты?

Да. Инструменты доступны только для чтения — байты на вход, байты на выход. Они никогда не пишут файлы, не делают сетевых запросов и не читают другие вкладки.

Просмотрите всё, что может конвертировать WebConverter

Каждый конвертер на сайте готов для агентов. Изучите полный каталог или прочитайте, как была создана интеграция WebMCP.

Все конвертации