30 giugno 2007: TechnéDonne chiude!


Grazie di tutto e alla prossima volta!
 
Home
Assistenza tecnica
Laboratorio
Magazine
Formazione
Osservatorio
Strumenti
E-wit
Home
Scansione di un testo PDF Stampa Invia
Scritto da Beatrice Cristofoli   
mercoledì 21 marzo 2007

Domanda inviata alle 17:00 il 20-03-2007

Buongiorno, avrei bisogno del vostro aiuto.
Mi capita spesso per lavoro di dover raccogliere degli articoli di giornali in varie lingue.
Ho l’abitudine di conservarli passandoli allo scanner e salvandoli come immagini .jpg , per poter avere una ‘rassegna stampa’ sempre disponibile ed evitare di essere sommersa di carta.
Mi piacerebbe poter lavorare su questi articoli, mi sarebbe per esempio utile farne una traduzione anche approssimativa con un programma di traduzione automatica, ma come si fa partendo da un’immagine .jpg?


Risposta:

Non è possibile utilizzare un traduttore automatico a partire da un file immagine (come può essere .tiff, .jpg), ma è possibile convertire in un file di testo, anziché in un file immagine, una scansione fatta.
Questo può avvenire grazie ai programmi di Riconoscimento Ottico dei Caratteri, in inglese Optical Caracter Recognition.
Dal file di testo sarà poi semplice copiare la parte da tradurre nel traduttore automatico per ottenere ciò che hai chiesto: come programma di traduzione automatica ti suggerisco Babel Fish di Altavista.

Ma torniamo alla scansione; nel caso più fortunato il programma con cui abitualmente esegui la scansione ha anche un programma OCR integrato, che ti permetterà di convertire una scansione in un file di testo.
Ti illustro le operazioni da fare a partire dal mio scanner, un HP di due anni; dovresti vedere se il tuo scanner ti dà delle opzioni simili.

  • Start -> Programmi -> HpPrecisionScan pro: si avvia l’interfaccia per l’acquisizione (Fig.1)
  • Clicco su Start a new scan
  • Posso decidere di selezionare anche solo una parte dell’area scansionata
  • Seleziono quale file di output desidero; questo è il passo più importante: anziché scegliere un file di tipo immagine, se è disponibile scegli l’opzione ‘File editabile (OCR)’ (Fig.2).
  • Hai finito: salva il tuo file nel formato testo preferito (.txt, .doc, etc…). Il salvataggio avvierà la funzionalità OCR del tuo programma di acquisizione e invierà il risultato dell’operazione ad un file nel formato da te scelto.
  • Ora apri il file ottenuto e verifica che il testo contenuto nella pagina scansionata sia stato interpretato correttamente; può capitare infatti che se i caratteri di stampa utilizzati nella pagina sono particolari, o scoloriti, il programma di riconoscimento tiri un po’ ad indovinare; bisognerà quindi correggere a mano eventuali errori.

Se il programma di acquisizione del tuo scanner non ti offre la funzionalità descritta, allora hai bisogno di installare un programma, che ti permetta di prendere i file immagine generati dall’acquisizione e trasformarli in file di testo. E’ possibile scaricare da Internet un buon programma gratuito, la cui installazione verrà descritta nel prossimo articolo di assistenza tecnica.


Fig. 1 Start -> Programmi -> HpPrecisionScan pro: si avvia l’interfaccia per l’acquisizione

Fig. 2 Se è disponibile scegli l’opzione ‘File editabile (OCR)’