Программа для распознавания текста: топ-7 лучших утилит

Microsoft OneNote — программа, которая у вас, возможно, уже есть

В состав Microsoft Office, начиная с версии 2007 и заканчивая текущей, 2013, присутствует программа для ведения заметок — OneNote. В ней также присутствуют функции распознавания текста. Для того, чтобы воспользоваться ею, просто вставьте отсканированное или любое другое изображение текста в заметку, кликните правой клавишей мыши по ней и воспользуйтесь контекстным меню. Отмечу, что по умолчанию для распознавания установлен английский язык.


Распознавание в Microsoft OneNote

Не могу сказать, что текст распознается идеально, но, насколько я могу судить, несколько лучше даже чем в CuneiForm. Плюс программы, как уже было сказано, в том, что с немалой вероятностью она уже установлена на вашем компьютере. Хотя, конечно, ее использование в случае необходимости работы с большим количеством отсканированных документов навряд ли будет удобным, скорее она подойдет для быстрого распознавания визиток.

ONLINEOCR.NET

– мощный и многофункциональный сервис OCR (Optical Character Recognition, то есть оптического распознавания символов), благодаря которому можно быстро распознать текст с картинки, PDF-файлов и многих других форматов. Возможности сервиса хорошие, но в пределах разумного – файл должен быть с разрешением, с которого можно будет произвести распознание. Сервис поддерживает 46 языков, в том числе русский, украинский.

Преобразованные документы выглядят в точности как оригинал — таблицы, столбцы и графики. OnlineOCR.net это бесплатный сервис распознавания текста в «гостевой режим» (без регистрации), что позволяет преобразовывать 15 изображений в час. Регистрация даст вам возможность конвертировать многостраничные PDF-документы и другие форматы.

Поддержка входных файлов (не больше 5 Мб) в формате PDF и изображений (JPG, BMP, TIFF, GIF) и выходные распознаются и преобразуются в Word, Excel и другие текстовые форматы. Для того, чтобы начать процесс распознания текста с изображения или PDF-файла, нужно проделать 3 шага:

  1. загрузить файл, нажав на кнопку Select file;
  2. выбрать язык, указать выходной файл (например, DOCX);
  3. нажать на кнопку Convert.

После можно отредактировать полученный текст прямо в окне браузера или сохранить себе на компьютер.

Преобразование графического файла

  1. Откройте страницу drive.google.com на компьютере.
  2. Нажмите на нужный файл правой кнопкой мыши.
  3. Выберите Открыть с помощью Google Документы.
  4. Графический файл будет преобразован в документ Google. При этом некоторые параметры форматирования могут не сохраниться.
    • Тип, начертание (полужирный, курсив) и размер шрифта, а также переносы строк обычно сохраняются.
    • Списки, таблицы, столбцы, обычные и концевые сноски, скорее всего, не сохранятся.

Поддерживаемые языки

  • Ачехский
  • Ачоли
  • Адангме
  • Африкаанс
  • Акан
  • Албанский
  • Алгонкинский
  • Амхарский
  • Древнегреческий
  • Арабский (современный стандартный)
  • Арауканский/мапуче
  • Армянский
  • Ассамский
  • Астурийский
  • Атабаскский
  • Аймара
  • Азербайджанский
  • Азербайджанский (дореформенная кириллица)
  • Балийский
  • Бамбара
  • Банту
  • Башкирский
  • Баскский
  • Батак
  • Белорусский
  • Бемба
  • Бенгальский
  • Бикольский
  • Бислама
  • Боснийский
  • Бретонский
  • Болгарский
  • Бирманский
  • Каталанский
  • Себуанский
  • Чеченский
  • Чероки
  • Китайский (мандаринский, Гонконг)
  • Китайский (упрощенный, мандаринский)
  • Китайский (традиционный, мандаринский)
  • Чоктавский
  • Чувашский
  • Кри
  • Крикский
  • Крымско-татарский
  • Хорватский
  • Чешский
  • Дакота
  • Датский
  • Дивехи
  • Дуала
  • Нидерландский
  • Дзонг-кэ
  • Эфик
  • Английский (США)
  • Английский (Великобритания)
  • Эсперанто
  • Эстонский
  • Эве
  • Фарерский
  • Фиджийский
  • Филиппинский
  • Финский
  • Фон
  • Французский (Канада)
  • Французский (Европа)
  • Фула
  • Га
  • Галисийский
  • Ганда
  • Гайо
  • Грузинский
  • Немецкий
  • Кирибати
  • Готский
  • Греческий
  • Гуарани
  • Гуджарати
  • Гаитянский креольский
  • Хауса
  • Гавайский
  • Иврит
  • Гереро
  • Хилигайнон Хинди
  • Венгерский
  • Ибанский
  • Исландский
  • Игбо
  • Илоканский
  • Индонезийский
  • Ирландский
  • Итальянский
  • Японский
  • Яванский
  • Кабильский
  • Качинский
  • Гренландский
  • Камба
  • Каннада
  • Канури
  • Каракалпакский
  • Казахский
  • Кхаси
  • Кхмерский
  • Кикуйю
  • Киньярванда
  • Киргизский
  • Коми
  • Конго
  • Корейский
  • Косяэ
  • Куаньяма
  • Лаосский
  • Латынь
  • Латышский
  • Лингала
  • Литовский
  • Нижненемецкий
  • Лози
  • Луба-катанга
  • Луо
  • Македонский
  • Мадурский
  • Малагасийский
  • Малайский
  • Малаялам
  • Мальтийский
  • Мандинго
  • Мэнский
  • Маори
  • Маратхи
  • Маршалльский
  • Менде
  • Среднеанглийский
  • Средневерхненемецкий
  • Минангкабау
  • Могаукский
  • Монго
  • Монгольский
  • Науатль
  • Навахо
  • Ндонга
  • Непальский
  • Ниуэ
  • Северный ндебеле
  • Северный сото
  • Норвежский (букмол)
  • Ньянджа
  • Ньянколе
  • Тонга (Ньяса)
  • Нзима
  • Окситанский
  • Оджибве
  • Древнеанглийский
  • Старофранцузский
  • Древневерхненемецкий
  • Древнескандинавский
  • Старопровансальский
  • Ория
  • Осетинский
  • Пампанга
  • Пангасинанский
  • Папьяменто
  • Пушту
  • Персидский
  • Польский
  • Португальский (Бразилия)
  • Португальский (Европа)
  • Панджаби (гурмукхи)
  • Кечуа
  • Румынский
  • Романшский
  • Цыганский
  • Рунди
  • Русский
  • Русский (дореформенный)
  • Якутский
  • Самоанский
  • Санго
  • Санскрит
  • Шотландский
  • Шотландский (гэльский)
  • Сербский (кириллица)
  • Сербский (латиница)
  • Шона
  • Сингальский
  • Словацкий
  • Словенский
  • Сонгай
  • Южный сото
  • Испанский (Европа)
  • Испанский (Латинская Америка)
  • Сунданский
  • Суахили
  • Свати
  • Шведский
  • Таитянский
  • Таджикский
  • Тамильский
  • Татарский
  • Телугу
  • Темне
  • Тайский
  • Тибетский
  • Тигринья
  • Тонганский
  • Тсонга
  • Тсвана
  • Турецкий
  • Туркменский
  • Удмуртский
  • Урду
  • Узбекский
  • Узбекский (дореформенная кириллица)
  • Венда
  • Вьетнамский
  • Водский
  • Валлийский
  • Фризский (западный диалект)
  • Волоф
  • Коса
  • Идиш
  • Йоруба
  • Сапотекский
  • Зулу

Принцип работы

Сейчас в интернете можно найти научную, справочную, учебную, методическую и прочую литературу. Книги и статьи, выпущенные в прошлом, оцифрованы и представляют собой фотографии, сканы в различных форматах.

Любой графический файл (растровый рисунок) состоит из точек. Оптическое распознавание букв основано на выделении точек, их анализе и преобразовании в текст. А процесс выглядит следующим образом:

  • Выделяются блоки, содержащие текст.
  • Приложение блок выстраивает в линии.
  • Линия делится на слова.
  • Слова делятся на символы.
  • Символ анализируется с шаблонами шрифтов.
  • Программное обеспечение перебирает множество вариантов.
  • В итоге распознавалка выдает текст, готовый к изменению в редакторе.

Все многообразие программного обеспечения делится на:

  • бесплатные программы;
  • платные программы;
  • онлайн-сервисы.

Особенности символов в титрах и вступительном и заключительном тексте

  • Одноцветные символы. Только очень небольшой процент имеет цветность, поэтому этот параметр не представляет большого интереса;
  • Символы жесткие. Они не меняют свой форму, размер или ориентацию от кадра к кадру. Опять же, процент символов, меняющих размер не так уж и высок, поэтому нас они тоже не интересуют;
  • У символов есть ограничение по размеру. Буквы не такие большие, как весь кадр, и меньше определенного количества пикселей, поскольку в противном случае они были бы нечитабельны для людей;
  • Символы неподвижны или движутся линейно. Стационарные символы не движутся, их положение остается фиксированным на нескольких последующих кадрах. Движущиеся символы постоянно двигаются и имеют постоянное направление перемещения: как правило, они перемещаются либо по горизонтали, либо по вертикали. Более того, большая часть движущегося текста перемещается справа налево или снизу вверх;
  • Символы контрастируют с фоном. Искусственный текст предназначен для чтения и, следовательно, должен быть различим с фоном. Но, как мы позже увидим, из-за узкой полосы пропускания телевизионного сигнала, этот пункт не сохраняется для всех контуров символов;
  • Одни и те же символы появляются в нескольких последовательных кадрах (временное отношение);
  • Символы часто появляются в кластерах (строках) на ограниченном расстоянии, выровненном по горизонтали (пространственное отношение), поскольку это естественный метод записи слов и предложений. Но это не обязательное условие, просто явный показатель. Время от времени на одной строке может появляться только один символ;
  • Качество контуров символов/границ падает из-за современных технологий телевидения и плат цифрового преобразователя. Символы часто смешиваются с фоном, особенно с левой стороны. Одноцветные символы больше не выглядят таковыми. Цвет очень мутный и иногда изменяется слегка в пространстве и времени, например, путем смешения с цветом окружающего фона. Даже неподвижный текст может перемещаться на несколько пикселей. Это типичные аналоговые старые теле- и видеозаписи.

Результаты эксперимента

  • Стационарный текст, неподвижная сцена;
  • Неподвижный текст, движущаяся сцена;
  • Движущийся текст, неподвижная сцена;
  • Перемещение текста, перемещение сцены.
  • max_split_distance = 30;
  • max_merge_distance = 30;
  • max_size = 70 пикселей;
  • min_size = 5 пикселей;
  • search_area = 20 пикселей;
  • dilation radius = 3 пикселей;
  • fill_faktor_threshold = 0.7 (раздел 4.2) и 0.3 (раздел 4.3), соответственно;
  • canny_threshold = 80;
  • min_ratio = 0 и max_ratio = 6.

отсюда

Таблица 1. Результаты сегментации
Тип видео Кадры Символы Из них содержится в области-кандидате Уменьшение Символов в кадре
Стационарный текст, стационарная сцена 400 137 131 96% 0,058 0,34
Стационарный текст, стационарная сцена 400 92 79 86% 0,028 0,23
Стационарный текст, движущаяся сцена 116 21 21 100% 0,035 0,18
Стационарный текст, движущаяся сцена 400 148 144 97% 0,037 0,36
Движущийся текст, стационарная сцена 139 264 264 100% 0,065 1,90
Движущийся текст, стационарная сцена 190 273 273 100% 0,112 1,44
Движущийся текст, движущаяся сцена 202 373 372 99,7% 0,130 1,85
Движущийся текст, движущаяся сцена 400 512 512 100% 0,090 1,28

Хорошие сервисы на бесплатной основе


Первый сервис — это Диск Гугл. Необходимо зарегистрироваться в браузере. Если пользователь имеет отношение к ведению блока на этом сервисе, ведению ютуб канала, то у него уже есть аккаунт.

Если для распознавания берётся текст в PDF, то система обработает только первые десять. Сохраняется работа в вордовском документе, блокноте, пдф-формате.

Второй сервис — i 2 OCR. Пользователю также придётся пройти регистрацию. Программа распознает следующие форматы:

  • PPM;
  • PBM;
  • GIF;
  • JPEG .

Сервис позволяет загружать документы до 10 МБ. Результат преобразовывается в текстовый файл формата DOC.

Третий сервис — OCR CONVERT. Пользователю предоставляются услуги по распознаванию файлов на бесплатной основе и без регистрации. Поддерживаются различные форматы изображения. Результат сохраняется в виде интернет-ссылки, которая имеет расширение TXT. Пользователь может скопировать результат и вставить в любой файл. На сервисе можно загружать одновременно пять документов, которые не превышают 5 МБ.

Четвёртый сервис — ONLINE OCR. Пользователю не нужно регистрироваться и платить деньги за работу программы. На сервисе можно распознать 15 изображений за час. Файлы принимаются разных форматов. Результат сохраняется в вордовском, текстовом формате, а также в таблице. Минус сервиса — постоянная капча во время работы. Для распознавания доступно 32 языка

Пятый сервис — OcrOnline. Разработчики рекомендуют, чтобы изображения были в высоком качестве, формата JPG. Также можно использовать и другие форматы. Минус сервиса — за одну неделю распознаётся только 5 страниц.

https://youtube.com/watch?v=GzCTPs-WcH8

FREE-OCR.COM

— это бесплатный онлайн инструмент для распознания текста с изображений и других файлов. Этот сервис можно использовать этот сервис для извлечения текста из любого изображения, которые вы загрузите. Услуга сервиса Free-OCR.com предоставляется бесплатно, регистрация не требуется. Просто загрузите файлы изображений. Free-OCR принимает либо JPG, GIF, TIFF, BMP или PDF (только первую страницу).

Для преобразования файла, потребуется выбрать данный файл, исходный язык, ввести капчу и нажать на кнопку Send file. После получаем в окне браузера распознанный текст. Тут, к сожалению нельзя скачать в виде документа Word.

Adobe Reader скачать


Популярный просмотрщик всех видов PDF-файлов с базовыми функциями работы с документацией. Позволяет просматривать, копировать, менять ориентацию или отправлять на печать документы. Для слабовидящих юзеров доступна опция масштабирования, увеличивающая размер шрифта до нужных параметров. Также можно воспользоваться функцией трёхмерного изображения и воспроизведения интегрированных в мультимедийный контент объектов. Доступен поиск в PDF картах, портфолио и файлах, а также комментирование файлов, присоединение электронных подписей и настройка плагинов для веб-навигаторов. Из минусов бесплатной версии отметим ограниченный только просмотром функционал.

Яндекс.Переводчик — преобразует картинку с немецким текстом в русский

Компания Яндекс продолжает усовершенствовать свои онлайн инструменты, в числе которых переводчик. На сегодняшний день он отлично справляется почти со 100 языками онлайн. Может преобразовать текст с любого сайта, который вы укажите. А также имеет отличное голосовое дополнение — Алису. Этот голосовой помощник в интернете уже знаком многим.

  1. Откройте его и нажмите на иконку с фотоаппаратом в главном окне;
  2. Можно не уточнять язык для перевода. Приложение само попытается определить язык после того, как вы наведёте камеру на картинку;
  3. Теперь предоставьте приложение фото, на котором содержится текст на иностранном языке.

Если у вас уже есть изображение на немецком, которую нужно перевести на русский, вы можете воспользоваться Яндекс.Переводчиком онлайн.

Для этого:

  1. Выберите вариант загрузки фото с компьютера. Или перетащите фото из папки на компьютере в окно браузера с открытым переводчиком;
  2. Нажимать для активации перевода ничего не нужно. Как только вы укажите картинку, сразу же начнётся её обработка. И через некоторое время вы увидите на экране результат.

Чтобы выбрать функцию переводчика с немецкого языка на русский по вашей фотографии в режиме онлайн, выберите вверху над кнопками для загрузки языковую пару. Нажав на один из языков, на экране отобразится список поддерживаемых. Нажмите на нужный, чтобы приложение отображало результаты согласно этим настройкам.

 

Как распознать текст из фото JPG, PNG, TIFF и других форматов

Вместо того, чтобы вручную перепечатывать текст с картинки или отсканированного документа, можно значительно сэкономить время, скачав приложение, которое распознает текст с фото или скана документа. Распознанный текст можно будет копировать и редактировать в удобном вам редакторе.

Для распознавания текста существует много различных сервисов, программ, и целых OCR-систем, которые можно найти в Интернете. Одним из простых и удобных способов является программа DocuFreezer. Это офлайн PDF-конвертер для Windows c возможностью сохранить ваши документы или изображения в универсальный формат PDF или TXT, а также популярные форматы изображений – JPEG, PNG, TIFF.

Краткое описание плагина Copyfish

С помощью этого плагина, можно в пару щелчков мыши скопировать текст с любой картинки, PDF и даже видео. Также это расширение может служить как переводчик. Есть конечно и другие плагины для перевода, но они не могут читать текст с картинки и видео.

Преимущества:

  1. Copyfish — бесплатный плагин;
  2. Для извлечения текста, не нужно пользоваться отдельным сервисом или программой;
  3. Сканировать можно не только изображения в Интернете, но и на компьютере;
  4. Для быстрой работы с плагином, предусмотрены горячие клавиши.

Работа с расширением

Установите расширений в браузер. В верхнем правом углу должен появиться значок Copyfish. Далее, кликните по этой иконке, а затем выделите с помощью мышки текст в рамочку.

Отпустив клавишу, Вы получите через несколько секунд оригинальный текст и его перевод, если функция перевода включена в настройках.

Клавиши:

  1. Redo OCR – выполнить повторное распознавание;
  2. Recapture — выполнить захват снова;
  3. Re-translate – выполнить перевод еще раз;
  4. Copy to clipboard – скопировать в буфер обмена.

Подобным образом можно считывать текст и с локальных файлов, которые находятся на компьютере, будь-то PDF, изображение или видео. Для этого нужно перетащить файл с ПК в окно браузера Chrome, а затем выполнить действия описанные выше. В Mozilla эта возможность пока недоступна.

Для перевода субтитров в видео, можно воспользоваться клавишей «Recapture», которая выполняет повторный захват. Также читайте, как переводить видео с английского языка на русский с помощью программы Virtual Audio Cable и блокнота Speech Pad.

Настройки расширения Copyfish

Кликните правой клавишей мыши по иконке в правом верхнем углу браузера, а затем выберите «Параметры». Настройки я разделил на три блока:

  1. Input Language (OCR Language): выбрать язык, который нужно перевести по умолчанию.
  2. Input Language Quickselect: можно назначить до трех языков для быстрого перевода.
  3. Translate to: выбрать язык, на который будет выполнен перевод.
  1. Show Text Overlay: показать наложение текста. Так можно понять, какие слова были распознаны, а какие нет.

Здесь можно видеть, что был распознан весь текст , кроме слова «coloured», в нем не была распознана буква «d».

  1. Translate after OCR: переводить текст после распознавания.
  2. Text Box Font Size: задать размер шрифта;
  3. Support popup dictionaries: поддержка всплывающих словарей.

Быстрые клавиши

  1. Open grabbing screen — открыть захват экрана CTR+SHIFT+O;
  2. Close panel – закрыть панель CTR+SHIFT+ X;
  3. Copy text – скопировать текст CTR+SHIFT+ С.

Можно воспользоваться и бесплатным сервисом для распознавания текста онлайн с картинки, PDF или видео.

Особенности OCR в DocuFreezer

Распознавание текста происходит автоматически, прямо во время групповой конвертации добавленных файлов. Ниже представлены некоторые особенности встроенной функции OCR в DocuFreezer.

Поддерживаемые входные типы файлов

Поддерживаемые выходные типы файлов

  • PDF
  • JPEG
  • PNG
  • TIFF
  • BMP
  • XLS
  • XLSX
  • DWG
  • DXF
  • PDF с возможностью поиска по тексту (Searchable PDF)
  • Простой текст (TEXT, TXT)

Поддерживаемые языки

Поддерживаемые виды документов

  • Английский
  • Немецкий
  • Иврит
  • Японский
  • Русский
  • Испанский
  • PDF-документы
  • практически любые растровые изображения: фотографии, картинки, сканы
  • чертежи Автокад
  • таблицы Excel

Как указано выше, на выходе вы получите простой текст TXT или PDF с возможностью поиска текста. Чтобы найти и выделить нужный текст в получившемся PDF-файле, достаточно открыть документ, нажать комбинацию клавиш Ctrl + F и ввести нужные слова или символы. Также текст внутри PDF-а можно будет выделять мышкой и копировать.


С этим читают