1# Unit Testing for Tesseract 2 3 4## Requirements 5 6### Files and structure 7``` 8 9├── langdata_lstm 10│ ├── common.punc 11│ ├── common.unicharambigs 12│ ├── desired_bigrams.txt 13│ ├── eng 14│ │ ├── desired_characters 15│ │ ├── eng.config 16│ │ ├── eng.numbers 17│ │ ├── eng.punc 18│ │ ├── eng.singles_text 19│ │ ├── eng.training_text 20│ │ ├── eng.unicharambigs 21│ │ ├── eng.wordlist 22│ │ └── okfonts.txt 23│ ├── extended 24│ │ └── extended.config 25│ ├── extendedhin 26│ │ └── extendedhin.config 27│ ├── font_properties 28│ ├── forbidden_characters_default 29│ ├── hin 30│ │ ├── hin.config 31│ │ ├── hin.numbers 32│ │ ├── hin.punc 33│ │ └── hin.wordlist 34│ ├── kan 35│ │ └── kan.config 36│ ├── kor 37│ │ └── kor.config 38│ ├── osd 39│ │ └── osd.unicharset 40│ └── radical-stroke.txt 41├── tessdata 42│ ├── ara.traineddata 43│ ├── chi_tra.traineddata 44│ ├── eng.traineddata 45│ ├── heb.traineddata 46│ ├── hin.traineddata 47│ ├── jpn.traineddata 48│ ├── kmr.traineddata 49│ ├── osd.traineddata 50│ └── vie.traineddata 51├── tessdata_best 52│ ├── eng.traineddata 53│ ├── fra.traineddata 54│ ├── kmr.traineddata 55│ └── osd.traineddata 56├── tessdata_fast 57│ ├── eng.traineddata 58│ ├── kmr.traineddata 59│ ├── osd.traineddata 60│ └── script 61│ └── Latin.traineddata 62└── tesseract 63 ... 64 ├── test 65 ├── unittest 66 │ └── third_party/googletest 67 └── VERSION 68``` 69 70### Fonts 71 72* Microsoft fonts: arialbi.ttf, times.ttf, verdana.ttf - [installation guide](https://www.makeuseof.com/tag/how-to-install-microsoft-core-fonts-in-ubuntu-linux/) 73* [ae_Arab.ttf](https://www.wfonts.com/download/data/2014/12/03/ae-arab/ae-arab.zip) 74* dejavu-fonts: [DejaVuSans-ExtraLight.ttf](https://dejavu-fonts.github.io/Download.html) 75* [Lohit-Hindi.ttf](https://raw.githubusercontent.com/pratul/packageofpractices/master/assets/fonts/Lohit-Hindi.ttf) 76* [UnBatang.ttf](https://raw.githubusercontent.com/byrongibson/fonts/master/backup/truetype.original/unfonts-core/UnBatang.ttf) 77 78 79## Run tests 80 81To run the tests, do the following in tesseract folder 82 83``` 84autoreconf -fiv 85git submodule update --init 86export TESSDATA_PREFIX=/prefix/to/path/to/tessdata 87make check 88``` 89