WebMCP文件转换器
WebConverter现在是一个WebMCP服务器:AI智能体可以通过document.modelContext转换你的文件 — 而转换仍然完全在你的浏览器中运行。
WebMCP(Web Model Context Protocol)让网站能够将结构化的工具直接交给AI智能体。WebConverter注册了它的转换工具,因此智能体可以为你转换图像 — 无需上传,无需API密钥,没有任何服务器接触你的文件。
什么是WebMCP?
WebMCP是Web Machine Learning Community Group提出的W3C标准草案。它在浏览器中添加了document.modelContext,使页面能够注册工具 — 每个工具都有名称、描述和JSON Schema — 供AI智能体发现和调用。与传统的MCP服务器不同,这里没有单独的进程,也没有令牌:工具就是页面自身的JavaScript,因此你的数据永远不会离开标签页。
为什么要一个无需上传的File Converter MCP?
大多数AI助手只能通过将文件上传到第三方API来转换文件。WebConverter的WebMCP工具在Web Worker中运行与人类界面相同的WebAssembly流水线。智能体传入字节并得到字节 — 无需上传,无速率限制,无成本,CO₂接近于零。这是智能体转换文件最私密的方式。
智能体如何使用它
智能体首先调用list_supported_formats来了解哪些格式有效,然后用文件和目标格式调用convert_image。该工具将转换后的文件以base64和data:URL的形式返回。一切都是确定性的,并由JSON Schema描述,因此智能体无需猜测。
从设计上保障隐私与安全
公开的工具严格只读:接收字节并返回字节。它们从不写入磁盘,从不发起网络请求,从不读取其他标签页。调用这些工具的智能体所拥有的能力,与一个人点击"转换"完全相同 — 不多一分。
已注册的WebMCP工具
这些工具在每个WebConverter页面上都注册到document.modelContext,并镜像到一个程序化注册表中,因此即使在浏览器原生支持发布之前它们也能正常工作。
convert_image
将图像(BMP、DDS、GIF、HDR、ICO、JPEG、KTX、PGM、PIC、PNG、PPM、PSD、TGA、WebP,加上通过浏览器解码的HEIC/AVIF)转换为PNG、JPEG、BMP、TGA、HDR、EXR、KTX2或WebP。返回base64加一个data: URL。本地运行,无需上传。
images_to_pdf
在浏览器中将一张或多张图像合并为单个PDF,每页一张图像。
images_to_searchable_pdf
将图像合并为PDF并运行Tesseract OCR,使生成的PDF在原始像素之上具有可选中、可搜索的文本。
merge_pdfs
将多个PDF按顺序(所有页面)合并为一个 — 本地处理,无需上传。
reorder_pdf_pages
重新排序PDF的页面,并按给定顺序写入新的PDF。
delete_pdf_pages
从PDF中删除指定的页面,将剩余页面按原始顺序写入新的PDF。
extract_pdf_text
从PDF中提取文本(pdf.js)— 默认是纯文本,或是每页一个标题的简单Markdown。
convert_document
使用Pandoc(WASM)在格式之间转换文档:DOCX、ODT、RTF、HTML、Markdown、LaTeX、RST、EPUB、MediaWiki、… ↔ Markdown、HTML、纯文本、LaTeX、RST、AsciiDoc、DOCX、ODT。首次使用时延迟下载约56MB。
convert_audio
将音频文件 — 或从视频中提取音频轨道 — 转换为MP3、OGG、WAV或FLAC。接受浏览器能解码的任何内容。
convert_video
使用ffmpeg-wasm将视频转码为MP4(H.264 + AAC)、WebM(VP9 + Opus)或动画GIF。按变体延迟下载。
trim_video
使用ffmpeg-wasm在本地从视频中剪出startTime → endTime的片段。
remove_image_background
使用微型U²-Net-P ONNX模型加确定性WASM抠图过程,生成图像的透明PNG或WebP版本。
transcribe_audio
使用量化后的Whisper模型(whisper.cpp WASM),将音频 — 或视频的音频轨道 — 转录为带时间戳的文本。默认英语。
list_supported_formats
枚举所有WebMCP工具中的每种输入/输出格式和引擎,便于智能体规划有效的转换。
实时演示 — 通过WebMCP工具转换
这会调用与AI智能体将调用的完全相同的convert_image工具。选择一张图像,选择一种格式,转换便会在你的浏览器中本地运行。
提示:在Chrome中你可以在chrome://flags/#enable-webmcp-testing启用原生API。本演示也可通过内置的工具注册表在不启用的情况下工作。
WebMCP文件转换器 — 常见问题
什么是WebMCP文件转换器?
它是作为WebMCP服务器公开的WebConverter。借助document.modelContext,AI智能体可以调用convert_image和list_supported_formats,完全在浏览器中转换图像 — 无需上传,无需API密钥。
它会把我的文件上传到服务器吗?
不会。convert_image工具在Web Worker中运行与UI相同的WebAssembly转换。你的文件永远不会离开浏览器标签页。
哪些浏览器支持document.modelContext?
它在最近的Chrome版本中通过一个标志提供(chrome://flags/#enable-webmcp-testing),并需要安全上下文。WebConverter还公开了一个程序化的工具注册表,因此在原生支持发布之前相同的工具也能工作。
File Converter MCP是免费的吗?
是的。没有后端,没有API密钥,没有速率限制 — 就像打开页面一样免费。
这个MCP可以转换哪些格式?
输入:BMP、DDS、GIF、HDR、ICO、JPEG、KTX、PGM、PIC、PNG、PPM、PSD、TGA、WebP。输出:PNG、JPEG、BMP、TGA、HDR、EXR、KTX2、WebP。
让智能体调用这些工具安全吗?
安全。这些工具是只读的 — 字节进,字节出。它们从不写入文件、发起网络请求或读取其他标签页。