Ogni funzionalità di WebConverter è ora uno strumento WebMCP — PDF, OCR, Whisper, video, rimozione sfondo

Nota del redattore (2026-05). Chrome 150 ha deprecato navigator.modelContext a favore di document.modelContext (secondo la PR #184 della specifica WebMCP). Gli esempi in questo articolo usano il pattern di feature detection compatibile in avanti raccomandato dal team Chrome:
const modelContext = document.modelContext || navigator.modelContext;
if (modelContext) {
  // Register tools...
}
L'integrazione di WebConverter usa esattamente questo fallback, quindi continua a funzionare sui browser che espongono ancora il vecchio identificatore.

Quando abbiamo rilasciato il supporto WebMCP per la prima volta, era cablata solo la conversione di immagini. Da oggi ogni funzionalità del sito è esposta come strumento WebMCP: un agente IA può richiamare document.modelContext e convertire immagini, creare e modificare PDF, eseguire OCR su scansioni, estrarre testo da PDF, convertire documenti con Pandoc, convertire e tagliare video, convertire ed estrarre audio, trascrivere voce con Whisper e rimuovere lo sfondo dalle immagini — tutto localmente nel browser, tutto senza caricare nulla.

Il catalogo completo degli strumenti

I tredici strumenti sono registrati globalmente — su ogni pagina di WebConverter, non solo sulla pagina WebMCP — così un agente può usarli ovunque si trovi l'utente. Tutti restituiscono un file base64 più un URL data: (e, dove appropriato, l'output strutturato come testo semplice o JSON).

Gli strumenti includono: convert_image (con un fallback di decodifica del browser che aggiunge HEIC su Safari/iOS e AVIF), images_to_pdf, images_to_searchable_pdf (Tesseract OCR), merge_pdfs, reorder_pdf_pages, delete_pdf_pages, extract_pdf_text (pdf.js), convert_document (Pandoc), convert_audio, convert_video e trim_video (ffmpeg-wasm), remove_image_background (U²-Net + matting WASM), transcribe_audio (Whisper) e list_supported_formats per la scoperta.

Perché questo è importante per gli agenti

Un assistente IA che oggi voglia fare qualcosa con un file ha di solito tre cattive opzioni: caricarlo su un'API di terze parti, eseguire uno strumento lato server che tocca i tuoi dati, oppure rifiutare. WebMCP cambia questo perché lo strumento è il JavaScript stesso della pagina. L'agente ottiene la capacità; il tuo file non lascia mai la scheda. Non c'è chiave API, né limite di frequenza, né costo, e CO₂ quasi nulla perché il viaggio carica-elabora-scarica non avviene mai.

Lazy by design

Il bootstrap di webmcp.js è minuscolo. Le parti pesanti — il WASM da ~56 MB di Pandoc, i core di ffmpeg, il modello ONNX U²-Net, il modello Whisper, i dati linguistici di Tesseract — vengono scaricati solo la prima volta che lo strumento corrispondente viene richiamato, poi il browser li mette in cache. Gli agenti che non chiamano mai convert_video non pagano mai il download di ffmpeg.

Privacy, sicurezza, onestà

Ogni strumento è annotato readOnlyHint: byte in ingresso, byte in uscita, nessuna scrittura, nessuna chiamata di rete tranne il download lazy una tantum del motore. Siamo onesti anche sui formati — HEIC è indicato come "solo Safari/iOS" perché questa è la verità: Chrome e Firefox non decodificano HEIC nativamente e spedire un decoder HEIC di più megabyte violerebbe il budget per la dimensione degli asset del progetto. Il fallback decodifica solo ciò che il browser stesso può decodificare, e nulla di più.

Provalo

La pagina WebMCP elenca ogni strumento registrato e include una demo dal vivo funzionante. Se stai costruendo un agente nel browser — o vuoi semplicemente vedere com'è fatto un server WebMCP completo — questo è l'aspetto di una superficie di strumenti per file onesta, privata e a costo zero. Ed è solo una pagina web.

Pronto a convertire le tue immagini?

Prova WebConverter gratis