1# Unit Testing for Tesseract
2
3
4## Requirements
5
6### Files and structure
7```
8
9├── langdata_lstm
10│   ├── common.punc
11│   ├── common.unicharambigs
12│   ├── desired_bigrams.txt
13│   ├── eng
14│   │   ├── desired_characters
15│   │   ├── eng.config
16│   │   ├── eng.numbers
17│   │   ├── eng.punc
18│   │   ├── eng.singles_text
19│   │   ├── eng.training_text
20│   │   ├── eng.unicharambigs
21│   │   ├── eng.wordlist
22│   │   └── okfonts.txt
23│   ├── extended
24│   │   └── extended.config
25│   ├── extendedhin
26│   │   └── extendedhin.config
27│   ├── font_properties
28│   ├── forbidden_characters_default
29│   ├── hin
30│   │   ├── hin.config
31│   │   ├── hin.numbers
32│   │   ├── hin.punc
33│   │   └── hin.wordlist
34│   ├── kan
35│   │   └── kan.config
36│   ├── kor
37│   │   └── kor.config
38│   ├── osd
39│   │   └── osd.unicharset
40│   └── radical-stroke.txt
41├── tessdata
42│   ├── ara.traineddata
43│   ├── chi_tra.traineddata
44│   ├── eng.traineddata
45│   ├── heb.traineddata
46│   ├── hin.traineddata
47│   ├── jpn.traineddata
48│   ├── kmr.traineddata
49│   ├── osd.traineddata
50│   └── vie.traineddata
51├── tessdata_best
52│   ├── eng.traineddata
53│   ├── fra.traineddata
54│   ├── kmr.traineddata
55│   └── osd.traineddata
56├── tessdata_fast
57│   ├── eng.traineddata
58│   ├── kmr.traineddata
59│   ├── osd.traineddata
60│   └── script
61│       └── Latin.traineddata
62└── tesseract
63    ...
64    ├── test
65    ├── unittest
66    │   └── third_party/googletest
67    └── VERSION
68```
69
70### Fonts
71
72* Microsoft fonts: arialbi.ttf, times.ttf, verdana.ttf - [installation guide](https://www.makeuseof.com/tag/how-to-install-microsoft-core-fonts-in-ubuntu-linux/)
73* [ae_Arab.ttf](https://www.wfonts.com/download/data/2014/12/03/ae-arab/ae-arab.zip)
74* dejavu-fonts: [DejaVuSans-ExtraLight.ttf](https://dejavu-fonts.github.io/Download.html)
75* [Lohit-Hindi.ttf](https://raw.githubusercontent.com/pratul/packageofpractices/master/assets/fonts/Lohit-Hindi.ttf)
76* [UnBatang.ttf](https://raw.githubusercontent.com/byrongibson/fonts/master/backup/truetype.original/unfonts-core/UnBatang.ttf)
77
78
79## Run tests
80
81To run the tests, do the following in tesseract folder
82
83```
84autoreconf -fiv
85git submodule update --init
86export TESSDATA_PREFIX=/prefix/to/path/to/tessdata
87make check
88```
89