1. Бумажный носитель помещается в сканер.
2. В программе отдаётся команда Сканировать.
Создаётся цифровая копия исходного документа в формате docx.
3. Программа распознавания текста анализирует структуру документа, выделяя на его страницах блоки текста, таблицы, картинки и т. п. Строки разбиваются на слова, а слова — на отдельные буквы. После этого программа сравнивает найденные символы с шаблонными изображениями букв и цифр, хранящимися в её памяти. Программа рассматривает различные варианты разделения строк на слова и слов на символы. В программу встроены словари, обеспечивающие более точный анализ и распознавание, а также проверку распознанного текста. Проанализировав огромное число возможных вариантов, программа принимает окончательное решение и выдает пользователю распознанный текст.
4. Распознанный текст переносится в окно текстового редактора, в котором пользователь может редактировать и форматировать распознанный текст.
Для перевода чисел из десятичной системы счисления в двоичную используют так называемый "алгоритм замещения", состоящий из следующей последовательности действий:
Делим десятичное число А на 2. Частное Q запоминаем для следующего шага, а остаток a записываем как младший бит двоичного числа. Если частное q не равно 0, принимаем его за новое делимое и повторяем процедуру, описанную в шаге 1. Каждый новый остаток (0 или 1) записывается в разряды двоичного числа в направлении от младшего бита к старшему. Алгоритм продолжается до тех пор, пока в результате выполнения шагов 1 и 2 не получится частное Q = 0 и остаток a = 1Пример:
35(в десятичной)
35/2=17 35-2*17=1
17/2=8 17-2*8=1
8/2=4 8-2*4=0
4/2=2 4-2*2=0
2/2=1 2-2*1=0
1/2=0 1
записываем число снизу вверх:100011
35=100011