Для использования и настройки средства распознавания Tesseract:
- В блоке Средство распознавания изображений модуля Распознавание изображений выберите Tesseract.
- Нажмите кнопку настроек.
- В окне Настройка плагина распознавания Tesseract выполните основные настройки и настройки бинаризации. Для восстановления настроек по умолчанию нажмите кнопку Использовать базовые настройки.
- По окончании всех настроек нажмите OK.
Основные настройкиОсновные настройки
На вкладке Основные настройки выберите язык или набор языков, которые необходимо будет распознавать на изображениях.
Для удобства выбора используйте кнопки Выбрать все, Отменить выбор и Инвертировать выбор. Рядом с панелью инструментов расположена информационная панель с данными об общем количестве поддерживаемых и количестве языков по умолчанию.
Настройки бинаризации
На вкладке Настройки бинаризации:
- Выберите метод бинаризации:
- бинаризация не применяется. Рекомендуется выбирать для распознавания изображений, не содержащих явно выраженных дефектов, например, засветов или затемнений.
- метод глобальной бинаризации с фиксированным порогом. Метод бинаризации, при котором к каждому пикселю применяется единое пороговое значение.
- метод бинаризации Оцу. Метод бинаризации с автоматическим вычислением порогового значения для оптимального разделения всех пикселей на изображении на текстовые и фоновые.
- метод бинаризации с маскированием порога выбора. Комбинированный метод, использующий маску для формирования итогового изображения.
- метод бинаризации с адаптивным порогом. Комбинированный метод, включающий определение порогового значения методом Оцу, нормализацию контраста и нормализацию фона.
- метод Саувола. Метод бинаризации с вычислением индивидуального порога бинаризации для каждого пикселя. Этот порог используется для последующей стандартной пороговой бинаризации.
- В зависимости от выбранного метода настройте параметры согласно таблице ниже.
- Нажмите ОК.
Параметры бинаризации
- Ширина/высота фрагмента для преобразования—ширина (a) и высота (b) фрагмента, на которые разбивается исходный документ. Преобразование выполняется в каждом отдельном фрагменте, после чего полученные изображения из фрагментов компилируются в общее.
- Пороговое значение, используемое для нахождения компонентов переднего плана—значение, позволяющее отфильтровать компоненты, принимаемые за компоненты переднего плана.
- Минимальное количество пикселей во фрагменте, для которых вычисляется пороговое значение—минимальное количество рандомно выбранных пикселей, которые используется для вычисления порогового значения. Низкое значение увеличивает скорость вычисления порогового значения, но отрицательно сказывается на точности распознавания. По умолчанию минимальное количество пикселей вычисляется по формуле a*b/3.
- Целевое значение фона нормализованного изображения—значение, которое присваивается отфильтрованным пикселям для их последующего размещения в область фона.
- Фактор сглаживания карты пороговых значений по ширине/высоте—коэффициент, используемый при сглаживании промежуточных изображений для удаления случайных шумов.
- Глобальное пороговое значение, используемое для бинаризации и построения итогового изображения—второе значение, используемое для дополнительной фильтрации промежуточного изображения.
- Доля максимального результата Оцу—значение алгоритма Оцу, которое используется в итоговой формуле, используемой для бинаризации.
- Минимальная разница, при которой процедура нормализации контраста считается успешной—минимальная разница значений контраста пикселя в исходном и обработанном изображениях для завершения процесса бинаризации. Если разница составляет меньше 130, операция повторяется.
- Половина ширины окна для измерения локальной статистики—размер участка, используемый для фильтрации на завершающем этапе бинаризации.
- Коэффициент снижения порога при отклонении—коэффициент нормализации пикселей, порог которых отличается от математического ожидания.
- Размер фрагментов для преобразования—размер фрагмента в пикселях, используемый для нормализации контраста.
- Количество фрагментов для преобразования—количество фрагментов, используемое для генерирования черно-белого изображения.