Tesseract (logiciel)
Tesseract est un logiciel de reconnaissance optique de caractères sous licence Apache.
Tesseract
Développé par | Ray Smith (d) |
---|---|
Dernière version | 5.3.1 ()[1] |
DĂ©pĂ´t | github.com/tesseract-ocr/tesseract |
Assurance qualité | Intégration continue |
Écrit en | C++ |
Système d'exploitation | GNU/Linux, Microsoft Windows, macOS, BSD, GNU/Hurd (d), Android et iOS |
Environnement | Linux, OpenBSD, Mac OS X, Windows |
Formats lus | TIFF, Portable Network Graphics, JPEG File Interchange Format (JFIF), JP2 (d) et WebP |
Formats Ă©crits | HOCR (en), fichier texte, Portable Document Format, ALTO (XML) et TSV |
Type | OCR |
Licence | Apache |
Documentation | github.com/tesseract-ocr/tessdoc et tesseract-ocr.github.io |
Site web | https://github.com/tesseract-ocr/tesseract |
Conçu par les ingénieurs de Hewlett Packard de 1985 à 1995, son développement est abandonné pendant les dix années suivantes ; en 2005, les sources du logiciel sont publiées sous licence Apache et Google poursuit son développement. Initialement limité aux caractères ASCII, il reconnaît les caractères UTF-8 dans plus de 100 langues.
Notes et références
- « Release 5.3.1 », (consulté le )
Liens externes
- (en) Announcing Tesseract OCR (Luc Vincent, Google Code Blog, August 2006)
Cet article est issu de wikipedia. Text licence: CC BY-SA 4.0, Des conditions supplémentaires peuvent s’appliquer aux fichiers multimédias.