Каковы различные алгоритмы, используемые в Тессеракте?
Какие еще алгоритмы используются в Тессеракте? Я пытаюсь воссоздать некоторые из них с помощью моего собственного кода для моего проекта об OCR (в настоящее время работает над Otsu).
Что я уже пробовал:
Я уже читал статьи (включая обзор Tesseract paper), но я всегда вижу только этот процесс, но мне удалось прочитать несколько об используемых алгоритмах, и я уверен только в 2, которые используются для бинаризации, которая является Otsu и Sauvola, потому что я видел ее в исходном коде tesseract. Вот другие алгоритмы, которые я не уверен, что это именно тот алгоритм, который используется на Тессеракте.
Подключенный компонент: поиск в ширину или в глубину
Поиск линии: бард или Рэй Смит
Капля: Гауссовская, гессианская, хаф-или максимально стабильные экстремальные области
Извлечение Текста: Вольф-Джолион
Алгоритмы сегментации на Wiki
Алгоритмы шумоподавления на Wiki (не уверен, что Blob-объекты можно классифицировать как метод шумоподавления)
Я не вижу никакого алгоритма, который используется для подгонки базовой линии и фиксированного шага, в то время как распознавание текста использует обучающие данные.
Любой из этих алгоритмов используется в Тессеракте?