智能体就绪 · WebMCP

WebMCP文件转换器

WebConverter现在是一个WebMCP服务器：AI智能体可以通过document.modelContext转换你的文件 — 而转换仍然完全在你的浏览器中运行。

WebMCP（Web Model Context Protocol）让网站能够将结构化的工具直接交给AI智能体。WebConverter注册了它的转换工具，因此智能体可以为你转换图像 — 无需上传，无需API密钥，没有任何服务器接触你的文件。

什么是WebMCP？

WebMCP是Web Machine Learning Community Group提出的W3C标准草案。它在浏览器中添加了document.modelContext，使页面能够注册工具 — 每个工具都有名称、描述和JSON Schema — 供AI智能体发现和调用。与传统的MCP服务器不同，这里没有单独的进程，也没有令牌：工具就是页面自身的JavaScript，因此你的数据永远不会离开标签页。

为什么要一个无需上传的File Converter MCP？

大多数AI助手只能通过将文件上传到第三方API来转换文件。WebConverter的WebMCP工具在Web Worker中运行与人类界面相同的WebAssembly流水线。智能体传入字节并得到字节 — 无需上传，无速率限制，无成本，CO₂接近于零。这是智能体转换文件最私密的方式。

智能体如何使用它

智能体首先调用list_supported_formats来了解哪些格式有效，然后用文件和目标格式调用convert_image。该工具将转换后的文件以base64和data:URL的形式返回。一切都是确定性的，并由JSON Schema描述，因此智能体无需猜测。

从设计上保障隐私与安全

公开的工具严格只读：接收字节并返回字节。它们从不写入磁盘，从不发起网络请求，从不读取其他标签页。调用这些工具的智能体所拥有的能力，与一个人点击"转换"完全相同 — 不多一分。

已注册的WebMCP工具

这些工具在每个WebConverter页面上都注册到document.modelContext，并镜像到一个程序化注册表中，因此即使在浏览器原生支持发布之前它们也能正常工作。

convert_image

将图像（BMP、DDS、GIF、HDR、ICO、JPEG、KTX、PGM、PIC、PNG、PPM、PSD、TGA、WebP，加上通过浏览器解码的HEIC/AVIF）转换为PNG、JPEG、BMP、TGA、HDR、EXR、KTX2或WebP。返回base64加一个data: URL。本地运行，无需上传。

images_to_pdf

在浏览器中将一张或多张图像合并为单个PDF，每页一张图像。

images_to_searchable_pdf

将图像合并为PDF并运行Tesseract OCR，使生成的PDF在原始像素之上具有可选中、可搜索的文本。

merge_pdfs

将多个PDF按顺序（所有页面）合并为一个 — 本地处理，无需上传。

reorder_pdf_pages

重新排序PDF的页面，并按给定顺序写入新的PDF。

delete_pdf_pages

从PDF中删除指定的页面，将剩余页面按原始顺序写入新的PDF。

extract_pdf_text

从PDF中提取文本（pdf.js）— 默认是纯文本，或是每页一个标题的简单Markdown。

convert_document

使用Pandoc（WASM）在格式之间转换文档：DOCX、ODT、RTF、HTML、Markdown、LaTeX、RST、EPUB、MediaWiki、… ↔ Markdown、HTML、纯文本、LaTeX、RST、AsciiDoc、DOCX、ODT。首次使用时延迟下载约56MB。

convert_audio

将音频文件 — 或从视频中提取音频轨道 — 转换为MP3、OGG、WAV或FLAC。接受浏览器能解码的任何内容。

convert_video

使用ffmpeg-wasm将视频转码为MP4（H.264 + AAC）、WebM（VP9 + Opus）或动画GIF。按变体延迟下载。

trim_video

使用ffmpeg-wasm在本地从视频中剪出startTime → endTime的片段。

remove_image_background

使用微型U²-Net-P ONNX模型加确定性WASM抠图过程，生成图像的透明PNG或WebP版本。

transcribe_audio

使用量化后的Whisper模型（whisper.cpp WASM），将音频 — 或视频的音频轨道 — 转录为带时间戳的文本。默认英语。

list_supported_formats

枚举所有WebMCP工具中的每种输入/输出格式和引擎，便于智能体规划有效的转换。

实时演示 — 通过WebMCP工具转换

这会调用与AI智能体将调用的完全相同的convert_image工具。选择一张图像，选择一种格式，转换便会在你的浏览器中本地运行。

提示：在Chrome中你可以在chrome://flags/#enable-webmcp-testing启用原生API。本演示也可通过内置的工具注册表在不启用的情况下工作。

WebMCP文件转换器 — 常见问题

什么是WebMCP文件转换器？

它是作为WebMCP服务器公开的WebConverter。借助document.modelContext，AI智能体可以调用convert_image和list_supported_formats，完全在浏览器中转换图像 — 无需上传，无需API密钥。

它会把我的文件上传到服务器吗？

不会。convert_image工具在Web Worker中运行与UI相同的WebAssembly转换。你的文件永远不会离开浏览器标签页。

哪些浏览器支持document.modelContext？

它在最近的Chrome版本中通过一个标志提供（chrome://flags/#enable-webmcp-testing），并需要安全上下文。WebConverter还公开了一个程序化的工具注册表，因此在原生支持发布之前相同的工具也能工作。

File Converter MCP是免费的吗？

是的。没有后端，没有API密钥，没有速率限制 — 就像打开页面一样免费。

这个MCP可以转换哪些格式？

输入：BMP、DDS、GIF、HDR、ICO、JPEG、KTX、PGM、PIC、PNG、PPM、PSD、TGA、WebP。输出：PNG、JPEG、BMP、TGA、HDR、EXR、KTX2、WebP。

让智能体调用这些工具安全吗？

安全。这些工具是只读的 — 字节进，字节出。它们从不写入文件、发起网络请求或读取其他标签页。

浏览WebConverter能转换的一切

网站上的每个转换器都是智能体就绪的。浏览完整目录，或了解WebMCP集成是如何构建的。

所有转换