aiuto.. Ho bisogno di un buon OCR! anche a pagamento

Postate qui per tutte le discussioni legate a Linux in generale.

Moderatore: Staff

Regole del forum
1) Citare sempre la versione di Slackware usata, la versione del Kernel e magari anche la versione della libreria coinvolta. Questi dati aiutano le persone che possono rispondere.
2) Per evitare confusione prego inserire in questo forum solo topic che riguardano appunto Gnu/Linux in genere, se l'argomento è specifico alla Slackware usate uno dei forum Slackware o Slackware64.
3) Leggere attentamente le risposte ricevute
4) Scrivere i messaggi con il colore di default, evitare altri colori.
5) Scrivere in Italiano o in Inglese, se possibile grammaticalmente corretto, evitate stili di scrittura poco chiari, quindi nessuna abbreviazione tipo telegramma o scrittura stile SMS o CHAT.
6) Appena registrati è consigliato presentarsi nel forum dedicato.

La non osservanza delle regole porta a provvedimenti di vari tipo da parte dello staff, in particolare la non osservanza della regola 5 porta alla cancellazione del post e alla segnalazione dell'utente. In caso di recidività l'utente rischia il ban temporaneo.
leocata
Linux 3.x
Linux 3.x
Messaggi: 598
Iscritto il: mar 5 feb 2008, 22:25
Slackware: 13.1
Desktop: xfce 4.x
Località: Giarre(CT)
Contatta:

aiuto.. Ho bisogno di un buon OCR! anche a pagamento

Messaggio da leocata »

Mi serve un ocr, che funzioni bene perchè devo fare un lavoro, ovviamente anche non free! [-o<

Avatar utente
Blallo
Packager
Packager
Messaggi: 3302
Iscritto il: ven 12 ott 2007, 11:37
Nome Cognome: Savino Liguori
Slackware: 14.2 / 12.2
Kernel: 4.4.14-smp
Desktop: DWM
Località: Torino / Torremaggiore (FG)
Contatta:

Re: aiuto.. Ho bisogno di un buon OCR! anche a pagamento

Messaggio da Blallo »

in ambito windows c'è abby fine reader, in ambito linux c'è il gratuitissimo kooka già incluso in slackware

leocata
Linux 3.x
Linux 3.x
Messaggi: 598
Iscritto il: mar 5 feb 2008, 22:25
Slackware: 13.1
Desktop: xfce 4.x
Località: Giarre(CT)
Contatta:

Re: aiuto.. Ho bisogno di un buon OCR! anche a pagamento

Messaggio da leocata »

tu hai esperienza sull'uso di kooka.... a me sembra che i motori ocr siano al quanto sperimentali... A me serve un OCR vero!

Avatar utente
Blallo
Packager
Packager
Messaggi: 3302
Iscritto il: ven 12 ott 2007, 11:37
Nome Cognome: Savino Liguori
Slackware: 14.2 / 12.2
Kernel: 4.4.14-smp
Desktop: DWM
Località: Torino / Torremaggiore (FG)
Contatta:

Re: aiuto.. Ho bisogno di un buon OCR! anche a pagamento

Messaggio da Blallo »

io mi sono sempre trovato bene...male che vada usa abby fine reader con wine..è il migliore nel suo campo (in ambito win ovviamente)

Avatar utente
navajo
Staff
Staff
Messaggi: 3884
Iscritto il: gio 8 gen 2004, 0:00
Nome Cognome: Massimiliano
Slackware: 13.37 (x86_64)
Kernel: 2.6.37.6
Desktop: KDE 4.7.0 (Alien)
Località: Roma

Re: aiuto.. Ho bisogno di un buon OCR! anche a pagamento

Messaggio da navajo »

non ho avuto mai grandi esigenze, kooka l ho trovato adatto per me.
Però ammetto, che cercando con google, ho visto che non sia propio il massimo.
Sempre attraverso google, ho visto Tesseract OCR. Non so dirti altro, se non il nome, magari provalo.
Ciao

leocata
Linux 3.x
Linux 3.x
Messaggi: 598
Iscritto il: mar 5 feb 2008, 22:25
Slackware: 13.1
Desktop: xfce 4.x
Località: Giarre(CT)
Contatta:

Re: aiuto.. Ho bisogno di un buon OCR! anche a pagamento

Messaggio da leocata »

ho scaricato tesseract e quando provo a scansire mi da:
leonardo@medusa:~$ tesseract out.pnm out.txt
Unable to load unicharset file /usr/share/tessdata/eng.unicharset
bohhh??? non voglio impazzire con lui io ho da lavorare... passo a windows

Meskalamdug
Iper Master
Iper Master
Messaggi: 3965
Iscritto il: ven 14 mag 2004, 0:00

Re: aiuto.. Ho bisogno di un buon OCR! anche a pagamento

Messaggio da Meskalamdug »


Avatar utente
phobos3576
Staff
Staff
Messaggi: 2980
Iscritto il: dom 17 apr 2005, 0:00
Slackware: 13.1
Kernel: 2.6.37-smp
Desktop: KDE 4.5.3

Re: aiuto.. Ho bisogno di un buon OCR! anche a pagamento

Messaggio da phobos3576 »

Meskalamdug ha scritto:Usando google esce..


http://code.google.com/p/tesseract-ocr/wiki/ReadMe
E qui ci sono tutti i language file:

http://code.google.com/p/tesseract-ocr/downloads/list

Avatar utente
phobos3576
Staff
Staff
Messaggi: 2980
Iscritto il: dom 17 apr 2005, 0:00
Slackware: 13.1
Kernel: 2.6.37-smp
Desktop: KDE 4.5.3

Re: aiuto.. Ho bisogno di un buon OCR! anche a pagamento

Messaggio da phobos3576 »

Ostrega se funziona!

Formidabile!

E' un software sviluppato dalla HP e nella home page si afferma che si tratta di uno dei 3 migliori engine per l'OCR!
Leocata è passato troppo frettolosamente a Windows.

La procedura di installazione è la seguente:

1) Scaricare tesseract-2.03.tar.gz da http://code.google.com/p/tesseract-ocr/downloads/list
2) Scaricare i language file tesseract-2.00.eng.tar.gz e tesseract-2.00.ita.tar.gz da http://code.google.com/p/tesseract-ocr/downloads/list
2) Decomprimere tesseract-2.03.tar.gz in una directory temporanea (ad esempio, $HOME/Temp) in modo da ottenere $HOME/Temp/tesseract-2.03
3) Da un terminale, posizionarsi in quella directory ed eseguire:

Codice: Seleziona tutto

./configure
make
4) Andare in $HOME/Temp/tesseract-2.03/tessdata e cancellare tutti i file (sono vuoti) che iniziano per eng e ita
5) Decomprimere tesseract-2.00.eng.tar.gz e tesseract-2.00.ita.tar.gz in $HOME/Temp/tesseract-2.03
6) Diventare root (sudare) ed eseguire:

Codice: Seleziona tutto

make install
(il make install termina con un errore ma ciò non sembra pregiudicare l'installazione).

Per testare il programma bisogna prima convertire in formato .TIF il file da scansionare; a questo punto, basta eseguire:

Codice: Seleziona tutto

tesseract nomefile.tif file_di_output -l ita
L'ho provato con un documento scritto piuttosto in piccolo ed è riuscito a ricavare correttamente il 99% del testo!

Roba da pacchettizzare subito!

Avatar utente
Blallo
Packager
Packager
Messaggi: 3302
Iscritto il: ven 12 ott 2007, 11:37
Nome Cognome: Savino Liguori
Slackware: 14.2 / 12.2
Kernel: 4.4.14-smp
Desktop: DWM
Località: Torino / Torremaggiore (FG)
Contatta:

Re: aiuto.. Ho bisogno di un buon OCR! anche a pagamento

Messaggio da Blallo »

l'ho pacchettizzato ma mi serve che mi mandiate un rc.inet2 standard..il mio non si avvia più correttamente e non so perchè non mi va più la connessione in ftp

Avatar utente
tigerwalk
Linux 3.x
Linux 3.x
Messaggi: 893
Iscritto il: lun 25 feb 2008, 22:08
Nome Cognome: Giuliano della Vecchia
Slackware: 13.37-14.2
Kernel: 3.10.17-tiger / 4.4.88-smp
Desktop: kde4/xfce4
Località: Napoli

Re: aiuto.. Ho bisogno di un buon OCR! anche a pagamento

Messaggio da tigerwalk »

Questo è il mio rc.inet2 "standard" della current...

Codice: Seleziona tutto

#!/bin/sh                                
#                                        
# rc.inet2      This shell script boots up the entire network system.
#               Note, that when this script is used to also fire     
#               up any important remote NFS disks (like the /usr     
#               directory), care must be taken to actually           
#               have all the needed binaries online _now_ ...        
#                                                                    
#               Uncomment or comment out sections depending on which 
#               services your site requires.                         
#                                                                    
# Author:       Fred N. van Kempen, <waltje@uwalt.nl.mugnet.org>     
# Modified for Slackware by Patrick Volkerding <volkerdi@slackware.com>


# At this point, we are ready to talk to The World...


# Mount remote (NFS) filesystems:
if cat /etc/fstab | grep -v '^#' | grep -w nfs 1> /dev/null 2> /dev/null ; then
  # Start rpc.portmap, /sbin/rpc.lockd, and /sbin/rpc.statd if we find NFS     
  # volumes defined in /etc/fstab since these will need to be running in order 
  # to mount them.  If they are not running, attempting to mount an NFS        
  # partition will cause mount to hang, or at least result in unreliable       
  # operation.  Keep this in mind if you plan to mount unlisted NFS            
  # partitions...                                                              
  # If you have uncommented NFS partitions in your /etc/fstab, rc.rpc is run   
  # whether it is set as executable or not.  If you don't want to run it,      
  # comment the NFS partitions out in /etc/fstab or erase/rename rc.rpc.       
  if [ -r /etc/rc.d/rc.rpc ]; then                                             
    sh /etc/rc.d/rc.rpc start                                                  
  fi                                                                           
  echo "Mounting remote (NFS) file systems:  /sbin/mount -a -t nfs"            
  /sbin/mount -a -t nfs          # This may be our /usr runtime!               
  # Show the mounted volumes:                                                  
  /sbin/mount -v -t nfs                                                        
fi                                                                             

# If /etc/rc.d/rc.rpc is executable, run it to load rpc.portmap, rpc.lockd,
# and rpc.statd.  This might be needed to mount NFS partitions that are not
# listed in /etc/fstab.  Starting this twice won't hurt as the script will 
# check if things are already running before trying to start them.         
if [ -x /etc/rc.d/rc.rpc ]; then                                           
  sh /etc/rc.d/rc.rpc start                                                
fi                                                                         

# Mount remote CIFS filesystems.  Note that where possible, using CIFS is
# preferred over SMBFS.  SMBFS is no longer actively maintained.         
if cat /etc/fstab | grep -v '^#' | grep -w cifs 1> /dev/null 2> /dev/null ; then
  echo "Mounting remote CIFS file systems:  /sbin/mount -a -t cifs"             
  /sbin/mount -a -t cifs                                                        
  # Show the mounted volumes:                                                   
  /sbin/mount -v -t cifs                                                        
fi                                                                              

# Mount remote SMB filesystems:
if cat /etc/fstab | grep -v '^#' | grep -w smbfs 1> /dev/null 2> /dev/null ; then
  echo "Mounting remote SMBFS file systems:  /sbin/mount -a -t smbfs"            
  /sbin/mount -a -t smbfs                                                        
  # Show the mounted volumes:                                                    
  /sbin/mount -v -t smbfs                                                        
fi                                                                               

# Start the system logger if it is not already running (maybe because /usr
# is on a network partition).                                             
if [ -x /etc/rc.d/rc.syslog -a -d /var/log -a ! -r /var/run/syslogd.pid ]; then
  . /etc/rc.d/rc.syslog start                                                  
fi                                                                             

# If there is a firewall script, run it before enabling packet forwarding.
# See the HOWTOs on http://www.netfilter.org/ for documentation on        
# setting up a firewall or NAT on Linux.  In some cases this might need to
# be moved past the section below dealing with IP packet forwarding.      
if [ -x /etc/rc.d/rc.firewall ]; then                                     
  /etc/rc.d/rc.firewall start                                             
fi                                                                        

# Turn on IPv4 packet forwarding support.
if [ -x /etc/rc.d/rc.ip_forward ]; then  
  . /etc/rc.d/rc.ip_forward start        
fi                                       

# Start the inetd server:
if [ -x /etc/rc.d/rc.inetd ]; then
  /etc/rc.d/rc.inetd start        
fi                                

# Start the OpenSSH SSH daemon:
if [ -x /etc/rc.d/rc.sshd ]; then
  echo "Starting OpenSSH SSH daemon:  /usr/sbin/sshd"
  /etc/rc.d/rc.sshd start                            
fi                                                   

# Start the BIND name server daemon:
if [ -x /etc/rc.d/rc.bind ]; then   
  /etc/rc.d/rc.bind start           
fi                                  

# Start NIS (the Network Information Service):
if [ -x /etc/rc.d/rc.yp ]; then               
  . /etc/rc.d/rc.yp start                     
fi                                            

# Start the NFS server.  Note that for this to work correctly, you'll
# need nfsd support in the kernel (the startup script will try to load
# the module for you).                                                
# You'll also need to set up some shares in /etc/exports.             
# Starting the NFS server:                                            
if [ -x /etc/rc.d/rc.nfsd ]; then                                     
  /etc/rc.d/rc.nfsd start                                             
fi                                                                    

# Stuff you won't need follows.  ;-)

# # Start the network routing daemon:
# if [ -x /usr/sbin/routed ]; then
#   echo "Starting network routing daemon:  /usr/sbin/routed"
#   /usr/sbin/routed -g -s
# fi

# # Start the system status server:
# if [ -x /usr/sbin/rwhod ]; then
#   echo "Starting system status server:  /usr/sbin/rwhod"
#   /usr/sbin/rwhod
# fi

#  # Fire up the PC-NFS daemon(s).  This is a primarily obsolete system, and may
#  # not be very secure.  It's not at all needed for normal NFS server support.
#  # You probably should not run this.
#  if [ -x /usr/sbin/rpc.pcnfsd ]; then
#    echo "Starting PC-NFS daemons:  /usr/sbin/rpc.pcnfsd /usr/sbin/rpc.bwnfsd"
#    /usr/sbin/rpc.pcnfsd /var/spool/lpd
#  fi
#  if [ -x /usr/sbin/rpc.bwnfsd ]; then
#    /usr/sbin/rpc.bwnfsd /var/spool/lpd
#  fi

Avatar utente
SIV
Linux 3.x
Linux 3.x
Messaggi: 921
Iscritto il: mer 25 apr 2007, 14:07

Re: aiuto.. Ho bisogno di un buon OCR! anche a pagamento

Messaggio da SIV »

phobos3576 con quale testo hai provato? scritto a mano? pagina scannerizzata?

Io ho provato con alcune pagine scritte al pc scannerizzate, ma non ricava molto.

Comunque se può essere utile ecco il mio (mai modificato) rc.inet2 (Slackware 12.1):

Codice: Seleziona tutto

#!/bin/sh
#
# rc.inet2	This shell script boots up the entire network system.
#		Note, that when this script is used to also fire
#		up any important remote NFS disks (like the /usr
#		directory), care must be taken to actually
#		have all the needed binaries online _now_ ...
#
#               Uncomment or comment out sections depending on which
#               services your site requires.
#
# Author:	Fred N. van Kempen, <waltje@uwalt.nl.mugnet.org>
# Modified for Slackware by Patrick Volkerding <volkerdi@slackware.com>


# At this point, we are ready to talk to The World...


# Mount remote (NFS) filesystems:
if cat /etc/fstab | grep -v '^#' | grep -w nfs 1> /dev/null 2> /dev/null ; then
  # Start rpc.portmap, /sbin/rpc.lockd, and /sbin/rpc.statd if we find NFS
  # volumes defined in /etc/fstab since these will need to be running in order
  # to mount them.  If they are not running, attempting to mount an NFS
  # partition will cause mount to hang, or at least result in unreliable
  # operation.  Keep this in mind if you plan to mount unlisted NFS
  # partitions... 
  # If you have uncommented NFS partitions in your /etc/fstab, rc.rpc is run
  # whether it is set as executable or not.  If you don't want to run it,
  # comment the NFS partitions out in /etc/fstab or erase/rename rc.rpc.
  if [ -r /etc/rc.d/rc.rpc ]; then
    sh /etc/rc.d/rc.rpc start
  fi
  echo "Mounting remote (NFS) file systems:  /sbin/mount -a -t nfs"
  /sbin/mount -a -t nfs          # This may be our /usr runtime!
  # Show the mounted volumes:
  /sbin/mount -v -t nfs
fi

# If /etc/rc.d/rc.rpc is executable, run it to load rpc.portmap, rpc.lockd,
# and rpc.statd.  This might be needed to mount NFS partitions that are not
# listed in /etc/fstab.  Starting this twice won't hurt as the script will
# check if things are already running before trying to start them.
if [ -x /etc/rc.d/rc.rpc ]; then
  sh /etc/rc.d/rc.rpc start
fi

# Mount remote CIFS filesystems.  Note that where possible, using CIFS is
# preferred over SMBFS.  SMBFS is no longer actively maintained.
if cat /etc/fstab | grep -v '^#' | grep -w cifs 1> /dev/null 2> /dev/null ; then
  echo "Mounting remote CIFS file systems:  /sbin/mount -a -t cifs"
  /sbin/mount -a -t cifs
  # Show the mounted volumes:
  /sbin/mount -v -t cifs
fi

# Mount remote SMB filesystems:
if cat /etc/fstab | grep -v '^#' | grep -w smbfs 1> /dev/null 2> /dev/null ; then
  echo "Mounting remote SMBFS file systems:  /sbin/mount -a -t smbfs"
  /sbin/mount -a -t smbfs
  # Show the mounted volumes:
  /sbin/mount -v -t smbfs
fi

# Start the system logger if it is not already running (maybe because /usr
# is on a network partition).
if [ -x /etc/rc.d/rc.syslog -a -d /var/log -a ! -r /var/run/syslogd.pid ]; then
  . /etc/rc.d/rc.syslog start
fi

# If there is a firewall script, run it before enabling packet forwarding.
# See the HOWTOs on http://www.netfilter.org/ for documentation on
# setting up a firewall or NAT on Linux.  In some cases this might need to
# be moved past the section below dealing with IP packet forwarding.
if [ -x /etc/rc.d/rc.firewall ]; then
  /etc/rc.d/rc.firewall start
fi

# Turn on IPv4 packet forwarding support.
if [ -x /etc/rc.d/rc.ip_forward ]; then
  . /etc/rc.d/rc.ip_forward start
fi

# Start the inetd server:
if [ -x /etc/rc.d/rc.inetd ]; then
  /etc/rc.d/rc.inetd start
fi

# Start the OpenSSH SSH daemon:
if [ -x /etc/rc.d/rc.sshd ]; then
  echo "Starting OpenSSH SSH daemon:  /usr/sbin/sshd"
  /etc/rc.d/rc.sshd start
fi

# Start the BIND name server daemon:
if [ -x /etc/rc.d/rc.bind ]; then
  /etc/rc.d/rc.bind start
fi

# Start NIS (the Network Information Service):
if [ -x /etc/rc.d/rc.yp ]; then
  . /etc/rc.d/rc.yp start
fi

# Start the NFS server.  Note that for this to work correctly, you'll
# need nfsd support in the kernel (the startup script will try to load
# the module for you).
# You'll also need to set up some shares in /etc/exports.
# Starting the NFS server:
if [ -x /etc/rc.d/rc.nfsd ]; then
  /etc/rc.d/rc.nfsd start
fi

# Stuff you won't need follows.  ;-)

# # Start the network routing daemon:
# if [ -x /usr/sbin/routed ]; then
#   echo "Starting network routing daemon:  /usr/sbin/routed"
#   /usr/sbin/routed -g -s
# fi

# # Start the system status server:
# if [ -x /usr/sbin/rwhod ]; then
#   echo "Starting system status server:  /usr/sbin/rwhod"
#   /usr/sbin/rwhod
# fi

#  # Fire up the PC-NFS daemon(s).  This is a primarily obsolete system, and may
#  # not be very secure.  It's not at all needed for normal NFS server support.
#  # You probably should not run this.
#  if [ -x /usr/sbin/rpc.pcnfsd ]; then
#    echo "Starting PC-NFS daemons:  /usr/sbin/rpc.pcnfsd /usr/sbin/rpc.bwnfsd"
#    /usr/sbin/rpc.pcnfsd /var/spool/lpd
#  fi
#  if [ -x /usr/sbin/rpc.bwnfsd ]; then
#    /usr/sbin/rpc.bwnfsd /var/spool/lpd
#  fi


Avatar utente
gohanz
Staff
Staff
Messaggi: 5832
Iscritto il: mar 30 nov 2004, 0:00

Re: aiuto.. Ho bisogno di un buon OCR! anche a pagamento

Messaggio da gohanz »

Su Slacky c'è anche ocropus, ma non ho idea di come funzioni. E' un Ocr usato da gnome-scan e usa come backend anche Tesseract. E' compilato staticamente con le librerie di Tesseract.

Avatar utente
phobos3576
Staff
Staff
Messaggi: 2980
Iscritto il: dom 17 apr 2005, 0:00
Slackware: 13.1
Kernel: 2.6.37-smp
Desktop: KDE 4.5.3

Re: aiuto.. Ho bisogno di un buon OCR! anche a pagamento

Messaggio da phobos3576 »

SIV ha scritto:phobos3576 con quale testo hai provato? scritto a mano? pagina scannerizzata?
Pagina scannerizzata, salvata poi in formato TIF non compresso; sono supportati anche i TIF compressi (attraverso la libtif esterna).

Avatar utente
SIV
Linux 3.x
Linux 3.x
Messaggi: 921
Iscritto il: mer 25 apr 2007, 14:07

Re: aiuto.. Ho bisogno di un buon OCR! anche a pagamento

Messaggio da SIV »

phobos, io ho usato questa immagine.

Ho dato:

Codice: Seleziona tutto

convert prova.jpg prova.tif
tesseract prova.tif prova -l ita
Ed ecco il risultato :oops:

Codice: Seleziona tutto

te I"'_"`_ È ie
L,y1111 I.Irx1]
Èalferŕa Jglnzrìr
Quexe c•}:»ere della tùaturìzài «
djspbìegaaxzne r1e11'aJ:11l:•ì-etite e s
pex1¤:c¤·Ia.|1clc> dalla earete ca apr]
cchstrmnzìcnnji di jsitttxra elzie si r
nc: a rnexaabrature di rea: snc;
vetro- È una ccr111;::1ìc.aa.zìc•¤:¤«: c
tfiexte a,1.1.1ì¢:z1 e }>ar$—s«:•.!]tLI.ra.11
dei referexzntì c•1·ga.¤:iì«:·e—|:|&I:1.xr:
l1·¤:I.I’.«•l¢*!ì¢:•r¤ pndìrrtirrg e raffert
tà fet¤c:111er1.ì|:11e dalla xiccnrisìc
(ferie eexxzne tese. dìjxzierxsinzxxe •;‘I
scblech cli \.1.i1a, rieere cli c:«c•:1i7x:|.e
gugrclie tecc.2 gzìtteri ::::::1: È/¢
rrxì e cleì Sechi. Cr Stella tin:
a·r1·ì.va.11cIc• 21 ìa1::|.`|:¤ìre aspetti :
reeerxte ìggetttaalisrrxch- Il Iìrx,
Ialxf è zr1c•1l:•:• se·d.ì.¤::1e1'LI',a(¤· ecu
t.ìv·azì¢:•r;.e prinmaria e strani «
<:\..1Iti.¤1ì1.i.s1;ìe•:> nella clicìxìarae
cli una traclìecsizxe che «:1:•r1l'.ì.|
¤:t¤2·r ¢:I1I,<:, «:|\,.1.asì settera.
SEC?}-3 §l.lI' €·lìl'!\V()lg€I'IÈIZI ÈIZDC
4%.1-): c Schvnrìxzers. E1 I..ìssìt.s1·:;
e `lZ)·e·;»er<)--- Èllellcr di I.I1:i·1]&\.1
ÈÈÈCCI E l'Zi1‘ì€l'lt$¢¢>·, (ZI'}.? £A:!:$1'jZlJ
te il segxcn (ii ijrns eesálìtà ea]
rc ì]. darsi ;>e11ì«:>e1a.re delle ]:•
dlìrtnetnsicsijì della r!¤'i‘tJ:·¤· rsetul
si e eeimsxsxzaarsi- Insìeniìe 11113

Rispondi