PK Systems PK Systems
Strumenti per le immagini

OCR — Estrattore di testo da immagine

Trascina un'immagine ed estrai il testo — italiano (oltre a inglese, portoghese o spagnolo) — senza caricare nulla da nessuna parte.

OCR — Estrattore di testo da immagine

Trascina un'immagine qui o clicca per selezionarla PNG, JPG, WebP, BMP — max 12 MB

Il riconoscimento avviene in locale — la tua immagine non lascia mai il browser.

Stato

Cosa fa questo strumento

Il riconoscimento ottico dei caratteri (OCR) trasforma il testo all'interno di un'immagine — uno screenshot, la foto di un contratto, una lavagna fotografata, uno scontrino digitalizzato, la pagina di un libro — di nuovo in testo selezionabile, copiabile e ricercabile. Trascina l'immagine, scegli la lingua e il testo riconosciuto appare in pochi secondi, pronto da incollare nel tuo documento o nelle tue note. L'immagine e il testo riconosciuto non lasciano mai il tuo dispositivo — niente upload, niente copia del file conservata su un server di terze parti, niente log. Questa garanzia di privacy è importante perché i documenti che si passano più spesso a un OCR sono proprio quelli che non dovresti incollare in uno strumento online qualunque: documenti d'identità, passaporti, contratti, moduli medici, buste paga, lettere fiscali, screenshot di app interne. Scegli la lingua che corrisponde all'immagine (inglese, portoghese o spagnolo) — l'accuratezza del riconoscimento crolla bruscamente se si usa il modello sbagliato. L'output è modificabile in loco: puoi correggere le classiche confusioni dell'OCR (0 vs O, 1 vs l vs I, m vs rn) prima di copiare o scaricare. Facoltativamente, abilita l'affidabilità per parola in modo che ogni parola sia etichettata con quanto il motore ne è certo — utile per individuare rapidamente quali parti di una scansione di bassa qualità richiedono ancora un occhio umano.

Come usarlo

  1. Trascina l'immagine — Funzionano meglio gli screenshot e le scansioni pulite. Anche le foto di documenti vanno bene se l'illuminazione è uniforme e la fotocamera tenuta dritta.
  2. Scegli la lingua — Abbinala alla lingua del testo nell'immagine. Ogni modello viene scaricato una volta sola e messo in cache. Modelli sbagliati restituiscono risultati senza senso.
  3. Estrai — Clicca su Estrai testo. La prima esecuzione scarica il motore e il modello linguistico — le esecuzioni successive nella stessa lingua sono rapide.
  4. Modifica, copia, scarica — La casella di output è modificabile. Correggi eventuali errori, poi copia o scarica come file .txt.

Come funziona l'OCR (in 200 parole)

L'OCR moderno funziona in cinque passaggi. Per primo, l'immagine viene binarizzata — trasformata in puro bianco e nero così il motore può distinguere l'inchiostro dallo sfondo a prescindere dal colore della carta o dalle ombre. In secondo luogo, i pixel connessi vengono raggruppati in forme, poi in parole e righe seguendo il flusso di lettura naturale della pagina. Terzo, ogni parola viene segmentata in singoli caratteri candidati. Quarto, questi candidati vengono dati in pasto a una rete neurale addestrata specificamente sulla lingua scelta, ed è per questo che è così importante scegliere la lingua giusta: la stessa forma di lettera può essere la corrispondenza più probabile in inglese e una lettera completamente diversa in portoghese o spagnolo. Quinto, un modello linguistico guarda l'intera parola nel contesto e sceglie la lettura più plausibile da un dizionario di forme comuni — è quello che intercetta confusioni come uficio silenziosamente corretto in ufficio. Il punteggio di affidabilità per parola è la certezza autoriportata dal motore per ogni parola; punteggi molto alti sono quasi sempre corretti, punteggi bassi sono dove dovresti dare un'occhiata all'originale.

Cosa funziona bene, cosa no

Ottimo: screenshot puliti di PDF, scansioni ben illuminate di pagine dattiloscritte, catture di schermo di articoli, pagine di libri stampati fotografate dritte. Discreto: pagine stampate fotografate con luce uniforme, scansioni leggermente storte (sotto i 5°), scontrini in buono stato, segnaletica scattata da angolazioni moderate. Scarso: scrittura a mano (il motore è addestrato sullo stampato, non sul corsivo), pagine molto ruotate o deformate, foto in scarsa luminosità, JPEG molto compressi e pieni di rumore, font decorativi o stilizzati, testo molto piccolo (sotto i 10 pixel di altezza). Per immagini difficili, aumenta la risoluzione prima di eseguire l'OCR — pixel nitidi e ben illuminati contano molto più della dimensione del file, e un ritaglio largo 1500 pixel di solito batte un originale 4K sfocato.

Domande frequenti

La mia immagine viene caricata?
No. L'OCR gira interamente sul tuo dispositivo. La tua immagine e il testo riconosciuto non lasciano mai il browser, non viaggiano mai verso i nostri server e non vengono memorizzati, indicizzati, registrati o condivisi. Le uniche chiamate di rete sono i download una tantum del motore di riconoscimento e del modello linguistico al primo utilizzo, dopo di che la pagina funziona anche se vai offline.
Perché la prima esecuzione è lenta?
La prima volta che esegui l'OCR per una determinata lingua, il browser scarica il modello linguistico (~10 MB). Le esecuzioni successive riutilizzano il file in cache e partono all'istante.
Posso fare l'OCR della scrittura a mano?
Il modello di riconoscimento è addestrato principalmente sul testo stampato. Lettere stampatello ordinato a volte funzionano; il corsivo o la calligrafia disordinata daranno risultati senza senso. L'OCR della scrittura a mano è un problema molto più difficile — i motori open source nel browser non lo gestiscono ancora in modo affidabile, e preferiamo non darti alcun risultato piuttosto che uno sbagliato.
Perché confonde 0/O e l/1?
Quei caratteri sono visivamente identici in molti font — anche gli umani hanno bisogno del contesto per distinguerli. Il motore usa un modello linguistico per orientare la scelta, ma a volte sbaglia. La modalità affidabilità evidenzia esattamente dove ricontrollare.
Posso aggiungere altre lingue?
Al momento esponiamo le tre con la maggiore richiesta per questo sito (inglese, portoghese, spagnolo), poiché ogni modello linguistico è un download di circa 10 MB. Se ti serve un'altra lingua, contattaci e valuteremo se aggiungerla.
Il risultato è quasi corretto ma pieno di piccoli errori di battitura.
Alcuni errori di riconoscimento sono normali su immagini imperfette. La casella di output è modificabile proprio per questo — correggi gli errori evidenti, poi copia o scarica. Per documenti lunghi, incolla nel tuo editor ed esegui un controllo ortografico per ripulire il resto.