update Tue Jun 8 12:37:00 PDT 2010
[pkgsrc.git] / graphics / tesseract / DESCR
1 This code is a raw OCR engine. It has NO PAGE LAYOUT ANALYSIS, NO
2 OUTPUT FORMATTING, and NO UI. It can only process an image of a
3 single column and create text from it. It can detect fixed pitch
4 vs proportional text.  Having said that, in 1995, this engine was
5 in the top 3 in terms of character accuracy, and it compiles and
6 runs on both Linux and Windows. Another current limitation is that
7 it only recognizes English and its character set is only US-ASCII.
8 Training code IS included in the open source release however, and
9 will be included in a future release.