智能体就绪 · WebMCP

WebMCP文件转换器

WebConverter现在是一个WebMCP服务器:AI智能体可以通过document.modelContext转换你的文件 — 而转换仍然完全在你的浏览器中运行。

WebMCP(Web Model Context Protocol)让网站能够将结构化的工具直接交给AI智能体。WebConverter注册了它的转换工具,因此智能体可以为你转换图像 — 无需上传,无需API密钥,没有任何服务器接触你的文件。

什么是WebMCP?

WebMCP是Web Machine Learning Community Group提出的W3C标准草案。它在浏览器中添加了document.modelContext,使页面能够注册工具 — 每个工具都有名称、描述和JSON Schema — 供AI智能体发现和调用。与传统的MCP服务器不同,这里没有单独的进程,也没有令牌:工具就是页面自身的JavaScript,因此你的数据永远不会离开标签页。

为什么要一个无需上传的File Converter MCP?

大多数AI助手只能通过将文件上传到第三方API来转换文件。WebConverter的WebMCP工具在Web Worker中运行与人类界面相同的WebAssembly流水线。智能体传入字节并得到字节 — 无需上传,无速率限制,无成本,CO₂接近于零。这是智能体转换文件最私密的方式。

智能体如何使用它

智能体首先调用list_supported_formats来了解哪些格式有效,然后用文件和目标格式调用convert_image。该工具将转换后的文件以base64和data:URL的形式返回。一切都是确定性的,并由JSON Schema描述,因此智能体无需猜测。

从设计上保障隐私与安全

公开的工具严格只读:接收字节并返回字节。它们从不写入磁盘,从不发起网络请求,从不读取其他标签页。调用这些工具的智能体所拥有的能力,与一个人点击"转换"完全相同 — 不多一分。

已注册的WebMCP工具

这些工具在每个WebConverter页面上都注册到document.modelContext,并镜像到一个程序化注册表中,因此即使在浏览器原生支持发布之前它们也能正常工作。

convert_image

将图像(BMP、DDS、GIF、HDR、ICO、JPEG、KTX、PGM、PIC、PNG、PPM、PSD、TGA、WebP,加上通过浏览器解码的HEIC/AVIF)转换为PNG、JPEG、BMP、TGA、HDR、EXR、KTX2或WebP。返回base64加一个data: URL。本地运行,无需上传。

images_to_pdf

在浏览器中将一张或多张图像合并为单个PDF,每页一张图像。

images_to_searchable_pdf

将图像合并为PDF并运行Tesseract OCR,使生成的PDF在原始像素之上具有可选中、可搜索的文本。

merge_pdfs

将多个PDF按顺序(所有页面)合并为一个 — 本地处理,无需上传。

reorder_pdf_pages

重新排序PDF的页面,并按给定顺序写入新的PDF。

delete_pdf_pages

从PDF中删除指定的页面,将剩余页面按原始顺序写入新的PDF。

extract_pdf_text

从PDF中提取文本(pdf.js)— 默认是纯文本,或是每页一个标题的简单Markdown。

convert_document

使用Pandoc(WASM)在格式之间转换文档:DOCX、ODT、RTF、HTML、Markdown、LaTeX、RST、EPUB、MediaWiki、… ↔ Markdown、HTML、纯文本、LaTeX、RST、AsciiDoc、DOCX、ODT。首次使用时延迟下载约56MB。

convert_audio

将音频文件 — 或从视频中提取音频轨道 — 转换为MP3、OGG、WAV或FLAC。接受浏览器能解码的任何内容。

convert_video

使用ffmpeg-wasm将视频转码为MP4(H.264 + AAC)、WebM(VP9 + Opus)或动画GIF。按变体延迟下载。

trim_video

使用ffmpeg-wasm在本地从视频中剪出startTime → endTime的片段。

remove_image_background

使用微型U²-Net-P ONNX模型加确定性WASM抠图过程,生成图像的透明PNG或WebP版本。

transcribe_audio

使用量化后的Whisper模型(whisper.cpp WASM),将音频 — 或视频的音频轨道 — 转录为带时间戳的文本。默认英语。

list_supported_formats

枚举所有WebMCP工具中的每种输入/输出格式和引擎,便于智能体规划有效的转换。

实时演示 — 通过WebMCP工具转换

这会调用与AI智能体将调用的完全相同的convert_image工具。选择一张图像,选择一种格式,转换便会在你的浏览器中本地运行。

提示:在Chrome中你可以在chrome://flags/#enable-webmcp-testing启用原生API。本演示也可通过内置的工具注册表在不启用的情况下工作。

WebMCP文件转换器 — 常见问题

什么是WebMCP文件转换器?

它是作为WebMCP服务器公开的WebConverter。借助document.modelContext,AI智能体可以调用convert_image和list_supported_formats,完全在浏览器中转换图像 — 无需上传,无需API密钥。

它会把我的文件上传到服务器吗?

不会。convert_image工具在Web Worker中运行与UI相同的WebAssembly转换。你的文件永远不会离开浏览器标签页。

哪些浏览器支持document.modelContext?

它在最近的Chrome版本中通过一个标志提供(chrome://flags/#enable-webmcp-testing),并需要安全上下文。WebConverter还公开了一个程序化的工具注册表,因此在原生支持发布之前相同的工具也能工作。

File Converter MCP是免费的吗?

是的。没有后端,没有API密钥,没有速率限制 — 就像打开页面一样免费。

这个MCP可以转换哪些格式?

输入:BMP、DDS、GIF、HDR、ICO、JPEG、KTX、PGM、PIC、PNG、PPM、PSD、TGA、WebP。输出:PNG、JPEG、BMP、TGA、HDR、EXR、KTX2、WebP。

让智能体调用这些工具安全吗?

安全。这些工具是只读的 — 字节进,字节出。它们从不写入文件、发起网络请求或读取其他标签页。

浏览WebConverter能转换的一切

网站上的每个转换器都是智能体就绪的。浏览完整目录,或了解WebMCP集成是如何构建的。

所有转换