Как использовать OCR с MobiPDF на Android

Благодаря усовершенствованной функции OCR в MobiPDF вы сможете раскрыть весь потенциал отсканированных документов, оптимизировать рабочие процессы и повысить производительность. В этой статье мы подробно рассмотрим, как работает функция OCR в MobiPDF и как она может изменить ваш опыт работы с документами.

Для чего используется OCR?

OCR (Optical Character Recognition) - это технология распознавания текста, которая позволяет преобразовывать отсканированные файлы в PDF с возможностью поиска. Она также помогает преобразовать отсканированный документ в редактируемый документ офисного формата, сохраняя при этом целостность содержимого файла.

Как это работает?

Инструмент OCR переводит распознанные фигуры и узоры в машиночитаемый текст и создает невидимый текстовый слой. Это сохраняет внешний вид исходного файла, но позволяет пользователю искать, выделять, копировать и выбирать текст.

Совет: Убедитесь, что в вашем файле преобладает читаемый текст с прозрачным фоном.

Вот как сделать сканы доступными для поиска с помощью OCR

1. Откройте MobiPDF. Нажмите Сканировать в PDF.

annotely_image (21).png

2. Отсканируйте документ.

1000020264.jpg

3. После сканирования нажмите Сделать доступным для поиска. Эта функция должна быть всегда включена по умолчанию, если вы не отключили ее ранее.

annotely_image (23).png

4. Нажмите на кнопку Сохранить нажмите значок , и приложение начнет распознавать текст.

annotely_image (26).png

5. Сохраните файл.

annotely_image (27).png

6. Откроется новый сохраненный файл. Теперь он доступен для поиска. Нажмите Поиск в меню и введите ключевое слово.

annotely_image (30).png annotely_image (31).png

7. Нажмите В текст если вы хотите экспортировать информацию из PDF-файла в формат .txt.

annotely_image (24).png

8. Выберите Поделиться текстом, Копировать текстили Экспорт в TXT.

annotely_image (25).png

9. Теперь вы можете открыть файл с помощью MobiOffice.

1000019223.jpg

Сделайте существующий PDF-файл доступным для поиска:

1. Откройте PDF-файл с вашего устройства.

annotely_image (30).png

2. Нажмите на значок меню, а затем на Распознать текст.

annotely_image (27).png

3. Нажмите В текст если вы хотите экспортировать информацию из PDF-файла в формат .txt.

annotely_image (32).png

4. Выберите Поделиться текстом, Копировать текстили Экспорт в TXT.

annotely_image (28).png

5. Нажмите Сделать доступным для поиска.

annotely_image (33).png

6. Нажмите Поиск.

annotely_image (29).png

7. Теперь вы можете выполнить поиск по файлу, и все результаты будут выделены.

1000020276.jpg

Ограничения

Хотя OCR является мощным инструментом, не все документы подходят для OCR
обработке. Некоторые ограничения включают:

  • некоторые элементы могут быть недоступны для редактирования
  • трудности при обработке файлов со сложным фоном
  • может потребовать доработки/ретуширования человеком после конвертации
  • легко зависит от качества сканирования

Мы надеемся, что эта статья дала вам четкое представление о том, как функция OCR в MobiPDF может повысить эффективность работы с документами. Благодаря возможности преобразования документов в редактируемые файлы с возможностью поиска, MobiPDF поможет вам повысить эффективность и производительность.

Была ли эта статья полезной?

Пользователи, считающие этот материал полезным: 3 из 3