Обработки изображений для распознавания текста с эмгу
Я пытаюсь создать алгоритм обработки изображения для повышения точности распознавания tesseract OCR.
Я использую EmguCV для C#.
Сначала я применяю бинаризацию изображения
использование обнаружения края emguCV
затем как сделать заполнение отверстия с помощью emgucv
это мне немного непонятно
Вот некоторые результаты:
бинаризация
обнаружение краев
Что я уже пробовал:
Вот код, который я использую для обнаружения egde.
Для бинаризации я повторяю пиксели и делаю их белее и темнее.
bmp = ImageLibrary.FilterImage(bmp, 95); Image<gray, byte=""> input = new Image<gray, byte="">(bmp); Image<gray, byte=""> output = input.ThresholdAdaptive(new Gray(255), Emgu.CV.CvEnum.AdaptiveThresholdType.MeanC, Emgu.CV.CvEnum.ThresholdType.Binary, 3, new Gray(0.03)); input.ThresholdAdaptive(new Gray(255), AdaptiveThresholdType.GaussianC, ThresholdType.Binary, 11, new Gray(2));