Module OCR

studio nigao
Messages : 19
Enregistré le : lun. févr. 10, 2014 9:47 am

ven. janv. 15, 2016 11:08 am

* install de tesseract
Le module OCR fonctionne correctement dorénavant.
Mais il subsiste des erreurs.

---- TVA écart arrondis ----
J'ai un message d'erreur m'indiquant 'le taux de TVA n'est pas pris en charge'
Je dispose d'une facture avec les montants déclarés
HT : 10.98
TVA : 0.24
TTC : 11.22

Apparemment un soucis avec les écarts arrondis ne facilite pas le contrôle de cohérence.
Mathématiquement si j'interviens sur les chiffres par
HT : 10.989
TVA : 0.231
TTC : 11.22
Le module ne renvoi plus de message d'erreur.
Mais hélas le bouton 'valider' ne renvoi pas de mouvement d'écriture malgré tout
Pas de message d'erreur ; il ne se passe rien (à cause de ID fournisseur ? cf ci-dessous)

---- ID Fournisseur ----
Il 'semblerait' que le champs 'fournisseur' soit de type texte libre.
Mon exemple de TVA 2.10% est issue d'une facture avec ID fournisseur non reconnu via OCR
Le champs fournisseur est ainsi prérempli avec '??'
Je clique sur le champs fournisseur pensant avoir accès à ma liste d'ID ; ou en tapant les premières lettre du nom
Mais rien ; pas d'auto remplissage.

Le rapprochement avec ID_Fournisseur se passera comment ?
Dans le cas d'un test avec facture OVH l'ID est bien remonté (l'écriture comptable à pris en considération le compte de charge associé à ID de OVH)
Je m'interroge donc dans le cas d'une saisie manuelle d'un fournisseur non reconnu.
Une fenêtre intermédiaire demande un rapprochement ? En tout cas dans mon cas, le bouton valider ne renvoi rien.
Aucune réaction du plugin (contrairement à OVH qui fonctionne)

---- Purge Dossier ----
Une fois la facture saisie via OCR, nous devons purger le dossier PNG manuellement.
En cas d'oubli de cette petite manipulation, relancer une seconde fois le module n'empêchera pas de faire une saisie en doublon des factures.
Modifié en dernier par studio nigao le ven. janv. 15, 2016 12:52 pm, modifié 6 fois.
cedric97
Messages : 1
Enregistré le : ven. janv. 15, 2016 11:18 am

ven. janv. 15, 2016 12:15 pm

Bonjour,

Serait-il possible de mettre les liens des programmes externes?
J'ai installé ImageMagick et convert est dans le path mais j'ai toujours le message d'erreur "ImageMagik est installé?"
J'ai installé tesseract,il scanne le répertoire mais peu de champs sont reconnus.
Quand je fais Améliorer le texte, il me demande d'installer le script texcleanner

Merci pour votre retour

Cordialement,

Cédric
studio nigao
Messages : 19
Enregistré le : lun. févr. 10, 2014 9:47 am

ven. janv. 15, 2016 12:44 pm

Cedric,

J'ai aussi le message pour textcleanner.
j'ai décidé de ne pas l'installer pour le moment, ça commence à faire beaucoup d'installation tant que les autres soucis restent obscurs. Je pense évaluer le bénéfice / lourdeur de ce plugin qui semble prometteur mais en l'état actuel semble peu aidant à mon flux personnel.

Tesseract reconnait 'peu de champs' dans mon cas également.
J'ai remarqué qu'il était possible de cliquer sur l'aperçu PNG du fichier.
Cela ouvre un éditeur texte avec la transcription OCR de tesseract.
A ce niveau, énormément de texte est reconnu et cela autorise le copier/coller de la référence facture par exemple.

La concordance entre un texte OCR et le champs OpenConcerto associé semble nécessiter du paramétrage supplémentaire de la part de OpenConcerto (tel qu'ils l'ont fait pour orange / ovh)
Cette méthode m'interroge sur la viabilité du plugin..
L'équipe OpenConcerto ne peut décemment pas passer son temps à paramétrer toutes les combinaisons possible de factures...
Modifié en dernier par studio nigao le ven. janv. 15, 2016 12:59 pm, modifié 1 fois.
pasck03
Messages : 70
Enregistré le : mer. janv. 01, 2014 1:28 pm

ven. janv. 15, 2016 12:50 pm

Excusez mon ignorance, mais pouvez vous préciser ou installer tessercat ? Qu'entendez vous pas PATH ?

Merci
Avatar du membre
guillaume
Messages : 2439
Enregistré le : ven. févr. 11, 2011 7:15 pm

ven. janv. 15, 2016 6:42 pm

studio nigao a écrit :Je pense évaluer le bénéfice / lourdeur de ce plugin qui semble prometteur mais en l'état actuel semble peu aidant à mon flux personnel.
Ce module n'est utile que si vous brassez des milliers de factures par an.

studio nigao a écrit : La concordance entre un texte OCR et le champs OpenConcerto associé semble nécessiter du paramétrage supplémentaire de la part de OpenConcerto (tel qu'ils l'ont fait pour orange / ovh)
Cette méthode m'interroge sur la viabilité du plugin..
L'équipe OpenConcerto ne peut décemment pas passer son temps à paramétrer toutes les combinaisons possible de factures...
Le format des factures des grosses sociétés est sensiblement identique, car généré par les ERPs classiques qu'OpenConcerto est en train de remplacer :)
Ce n'est pas très long d'ajouter des nouveaux formats spéciaux quand le système générique ne réussit pas à faire le boulot.

Ne vous embêtez pas à installer avec le module OCR pour 5 factures!
Directeur technique d'OpenConcerto qui dans son temps libre s'occupe du forum.
Pour une assistance pro, nous sommes joignables à ILM Informatique contre quelques jetons.
Pensez aussi à lire le manuel !
studio nigao
Messages : 19
Enregistré le : lun. févr. 10, 2014 9:47 am

ven. janv. 15, 2016 7:58 pm

guillaume a écrit : Ne vous embêtez pas à installer avec le module OCR pour 5 factures!
Volume 2014 : 455 factures
Volume 2015 : 573 factures

Ca devrait dépasser les 5 factures sous entendue ; après désolé ce n'est pas un millier par an.
Cette parenthèse faite, le plugin ne fonctionne pas à part avec OVH pour moi :(

Quid de la possibilité de valider manuellement les factures non reconnues identifié '??' (le bouton Valider ne réagit pas)
Avatar du membre
guillaume
Messages : 2439
Enregistré le : ven. févr. 11, 2011 7:15 pm

sam. janv. 16, 2016 2:48 pm

10 par semaine, cela fait court pour apprécier les vrais gains de temps avec l'OCR :)

Pour les factures ou champs non identifiées, vous pouvez corriger en manuel.

Cordialement,
Directeur technique d'OpenConcerto qui dans son temps libre s'occupe du forum.
Pour une assistance pro, nous sommes joignables à ILM Informatique contre quelques jetons.
Pensez aussi à lire le manuel !
brunets
Messages : 56
Enregistré le : dim. déc. 23, 2012 1:26 pm

sam. janv. 16, 2016 3:08 pm

Bonjour à tous,

Cette discussion sur l'OCR m'intéresse et me permets de vous donner mon avis.

Je pense que c'est une fonctionnalité utile des logiciels de gestion de flux (compta, ERP, ...) modernes. Au passage, chapeau et merci à ILM d'avoir pu commencer à implémenter cette fonctionnalité dans OC.
guillaume a écrit :Ne vous embêtez pas à installer avec le module OCR pour 5 factures!
Dans ce cas, je pense que tout le monde est d'accord. De la à dire qu'il faut plusieurs milliers de factures par an, je trouve cela un peu excessif. Le volume de studio nigao semble quand même déjà intéressant pour commencer à faire de l'OCR
studio nigao a écrit : ... le plugin ne fonctionne pas à part avec OVH pour moi :(
Quid de la possibilité de valider manuellement les factures non reconnues identifié '??' (le bouton Valider ne réagit pas)
La question qui se pose est de savoir si toutes les factures (ou une majorité) peuvent être reconnues facilement ou non par le module d'OCR. Si c'est le cas, pas de problèmes. Mais visiblement, ce n'est pas le cas vu les retours. Il faudrait alors que les zones des factures soient paramétrables dans un "format" (ou gabarit ou modèle ou ce que vous voulez) et enregistrables pour réutilisation et/ou mutualisation entre utilisateurs d'OC (mais là, je sais, je rêve, tiens cela me rappelle un publicité). C'est peut être ce qu'ILM entend par "... programmer quelques règles pour que tout fonctionne bien." C'est possible actuellement (et accessible aux utilisateurs d'OC) ? ou prévu à l'avenir dans le développement du module ?

Vous en remerciant,

Cordialement.
ChrisParis
Messages : 27
Enregistré le : jeu. janv. 14, 2016 1:25 pm

sam. janv. 23, 2016 2:14 pm

Bonjour

J'ai installé le module OCR.
J'ai copié le repertoire iCopy dans OpenConcerto.
J'ai installé ImageMagick.
J'ai installé Tesseract.
J'ai bien ImageMagick et Tesseract dans mon PATH.

Je progresse mais l'OCR ne se lance pas. Analyse toujours en cours...

1 - J'ai mis un PDF dans le répertoire PDF mais rien n'y fait.
2 - J'ai scanné une facture en TIF dans le répertoire TIFF mais rien n'y fait. J'ai choisi dossier images.
3 - J'ai lancé le scan depuis le module, je n'ai plus l'erreur de icopy mais pas de scan.

Avez-vous des procédures précises car je pense que je navigue mais ne tombe pas sur la/les bonne(s) procédure(s)

Merci

Bon Week-End 8-)
Répondre