OneRPA
  • Контакты
  • RPA платформа OneRPA
    • Установка и использование
      • Функциональные характеристики
      • Установка и настройка
      • Жизненный цикл, поддержка, особенности эксплуатации
        • Требования к квалификации специалистов
      • Руководство пользователя
        • Конструктор программных роботов
        • Выполнение программных роботов
        • Логирование выполнения программных роботов и оповещение об ошибках при их выполнении
        • Устранение неисправностей
        • Техническая поддержка
          • Контактная информация службы технической поддержки
        • Совершенствование программного обеспечения
    • Конструктор роботов
    • Шаблоны этапов
      • SAP
        • Запись UI действий в SAP
      • Шаблоны этапов 1С
      • Шаблоны этапов Computer vision
        • Ждать рисунок
        • Page 1
        • Page 2
      • Шаблоны этапов FTP, HTTP, E-mail
        • Шаблоны E-mail
          • Отправить письмо
          • Получить письма
          • Сохранить вложения
        • Шаблоны FTP
          • Выгрузить файл на FTP
          • Загрузить файл с FTP
        • Шаблоны HTTP
          • Отправить HTTP запрос
      • Шаблоны этапов Mashine Learning
      • Шаблоны этапов MS Office
        • Excel
          • Вставить из буфера диапазон ячеек
          • Вставить формулу в диапазон ячеек
          • Выделить диапазон ячеек
          • Вырезать диапазон ячеек
          • Закрыть объект Excel
          • Заменить подстроку в выделенном диапазоне ячеек
          • Копировать диапазон ячеек
          • Копировать лист книги excel
          • Открыть файл excel
          • Очистить выделенный диапазон ячеек
          • Получить значение уровня группировки строки листа
          • Получить значение ячейки листа
          • Получить лист книги excel
          • Получить объект Excel
          • Сохранить лист в файл
          • Считать данные c Excel
          • Удалить диапазон ячеек
          • Установить значение ячейки листа
          • Установить значения ячеек диапазона
          • Установить значения ячеек исходного диапазона в заданный диапазон
          • Установить наименование листа
          • Установить уровень группировок строк листа
          • Установить формат ячеек диапазона
      • Шаблоны этапов OCR
        • Correct
          • Распознать документ (correct)
        • Tesseract
          • Распознать текст
          • Распознать текст по шаблону
      • Шаблоны этапов Web интерфейса
        • Действия
          • Ввод текста в Web элемент
          • Клик по web элементу
          • Получить свойство web элемента
          • Получить текст web элемента
        • Управление браузером
          • Инициализировать браузер
          • Перейти на URL
          • Закрыть chrome
        • Условия
          • Элемент найден
          • Элемент отображен
      • Шаблоны этапов Yandex
        • Yandex.Vision
          • Распознать текст Yandex Vision
        • Вызвать cloud function
      • Шаблоны этапов Интеграционных сервисов
        • DADATA
          • Организация по ИНН (DADATA)
      • Шаблоны этапов Windows
        • Буфер обмена
          • Записать в буфер обмена
          • Вставить текст из буфера
          • Прочитать буфер обмена
        • Окна
          • Активировать окно
          • Проверка наличия окна
          • Закрыть окно
        • Клавиатура
          • Печатать текст
          • Язык ввода
        • Ввод текста в элемент
        • Двойной клик по элементу
        • Запустить приложение
        • Клик по координатам
        • Клик по элементу
        • Пауза
        • Получить текст элемента
      • Шаблоны этапов программирования
        • Ветвления
          • Множественное условие
          • Условие
        • Переменные
          • Выражение
          • Переменная
        • Работа с таблицами
          • Добавить колонку таблицы
          • Добавить строку таблицы
          • Получить значение из таблицы
          • Получить значения строки таблицы
          • Получить количество строк таблицы
          • Создать описание колонок таблицы
          • Создать пустую таблицу
        • Циклы
          • Начало цикла
          • Начало цикла по коллекции
          • Конец цикла
        • Аннотация
        • Ожидание
      • Шаблоны этапов роботов
        • Запустить робота
      • Шаблоны этапов системных скриптов
        • Выполнить скрипт CMD
        • Выполнить скрипт JS
        • Выполнить скрипт power shell
        • Выполнить скрипт python
        • Выполнить скрипт WSH
      • Шаблоны этапов работы с файловой системой
        • Ждать файл
        • Записать текстовый файл
        • Скопировать файл
        • Текущий файл в каталоге
        • Удалить файл
        • Узнать количество файлов в каталоге
    • Оркестраторы
    • Логирование
Powered by GitBook
On this page

Was this helpful?

  1. RPA платформа OneRPA
  2. Шаблоны этапов
  3. Шаблоны этапов OCR
  4. Tesseract

Распознать текст по шаблону

PreviousРаспознать текстNextШаблоны этапов Web интерфейса

Last updated 3 years ago

Was this helpful?

Данный шаблон этапа для распознавания сканов множества однотипных документов с получением считанных структуры и данных из документов и возможностью дальнейшей обработки, в частности автоматического создания и записи в учетной программе (например 1с:бухгалтерия) документов. Основное преимущество этого шаблона в том, что создав 1 раз шаблон разметки для документа, вы можете распознать неограниченное количество сканов с аналогичной структурой. Соответствующее . Шаблон содержит следующие параметры:

  • Скан. Полный путь до файла сканированного документа. Этот параметр может задаваться динамически с предыдущего этапа, формирующего полный путь до файла. Например, шаблон этапа Файловая система - Текущий файл в каталоге.

  • Шаблон разметки. Для удобства формирования шаблона, нажмите кнопку "Заполнить шаблон". Появится отдельная форма. Выберите файл картинки сканированного документа. Скан откроется в верхней части формы. Далее в поле "Тип объекта" выберите тип документа в учетной программе, который нужно будет автоматически создать на основе распознанного скана. В нашем примере это Демо_РТУ. В нижней части формы есть вкладки Реквизиты и Табличные части. Заполним сначала вкладку Реквизиты. Сначала заполним реквизит "Контрагент". Для этого отметим на картинке прямоугольником точно те данные, которые хотим видеть внесенными для контрагента. Это может быть одно наименование. В нашем случае будет наименование и ИНН. Нажимаем кнопку "Перенести". В графе "Код значения" может быть прописан код для обработки значения реквизита особым образом. Но обычно это не требуется.

  • Якорь. Это текст, который всегда присутствует на документе и служащий для стопроцентного позиционирования скана, если документ плохо или криво отсканирован.

Вкладка "Табличные части". Обводим по очереди те реквизиты, которые мы хотим внести в документ. ВНИМАНИЕ! Первый реквизит будет ключевым, поэтому целесообразно выбирать не количество или сумму, а наименование или номенклатуру. выделение происходит аналогично как для реквизитов. Обводим прямоугольником и нажимаем кнопку "Перенести". Заполнив все реквизиты, обозначаем также конец таблицы - например слово ИТОГО - якорь табличной части.

После заполнения всех реквизитов, то есть когда весь шаблон для работы со сканом готов, нажимаем кнопку "Создать (тест)". Она позволяет посмотреть, как скан распознается и вносится в учетную программу. Если тестовое создание прошло успешно, в левом верхнем углу нажимаем кнопку "ОК". Шаблон обработки скана записан.

  • Структура данных распознанного документа. Исходящий параметр. Распознанный документ с распознанной структурой и в том формате, который мы выбрали. В примере формат excel. Распознанные данные могут использоваться для дальнешей обработки в работе робота.

видео с примером