Сервис Google Docs научился распознавать текст на PDF-документах и изображениях, написанный на 34 языках, в том числе на русском. Об этом сообщается в официальном блоге Google.
Документы, которые необходимо распознать, можно загрузить в облачный сервис Google так же, как и обычные файлы. При этом пользователи должны будут пометить в специальном поле, что они хотят перевести эти документы из их нынешнего формата в формат Google Docs, а также указать, на каком языке он написан.
После этого текст будет автоматически распознан, а пользователям будет предоставлена возможность его дальнейшего редактирования с помощью Google Docs. Подробнее ознакомиться с интерфейсом загрузки документов в Google Docs можно здесь (требуется учетная запись Google).
Сервис оптического распознавания текста (OCR) был внедрен в Google Docs в июне 2010 года. Первоначально с его помощью можно было автоматически распознавать информацию на пяти языках: английском, французском, немецком, итальянском и испанском. Сервис является бесплатным.
В настоящее время на рынке представлено несколько программ, которые обеспечивают функции распознавания текста. Одним из наиболее популярных подобных решений является ABBYY FineReader.
Источник: Lenta.ru