КАК гугл распознаёт текст с картинки прямо в браузере?!?

pdf Google Docs OCR optical character recognition text recognition

Вот PDF'ка открытая в Google Docs, вроде картинка, а текст можно выделять и копировать в буфер обмена:

http://docs.google.com/viewer?a=v&q=cache:p_r-51YVOe4J:www.idi.ntnu.no/emner/dt8100/Essay2005/zagarrio.pdf+rapid+software+development&hl=en&pid=bl&srcid=ADGEESgBEfMm870Ydt_9gjvvxrvDC1VkFikyQT9AJeBfMzKd1lrxRP-WkJM4-OHRnuWQIJsP7SZHkBKVHTcNMj6w_PVHtscTWmwHilfNG_dmStA151SwBKaLsja92KpCDCl4NRc1pqre&sig=AHIEtbTC2D_sI2DQcx5ZAYArX-uSK96ZoA

Примечание:
Вот же (PNG Image, 701px × 992px, 45,61 KB):

http://docs.google.com/viewer?pid=bl&srcid=ADGEESgBEfMm870Ydt_9gjvvxrvDC1VkFikyQT9AJeBfMzKd1lrxRP-WkJM4-OHRnuWQIJsP7SZHkBKVHTcNMj6w_PVHtscTWmwHilfNG_dmStA151SwBKaLsja92KpCDCl4NRc1pqre&q=cache%3Ap_r-51YVOe4J%3Awww.idi.ntnu.no%2Femner%2Fdt8100%2FEssay2005%2Fzagarrio.pdf%20rapid%20software%20development&docid=05f1278e5eedb0be1149b9b71115dbc9&a=bi&pagenumber=2&w=701

Примечание:
При том, что никаких плагинов для PDF в моём Firefox'е не установлено.

Примечание:
AlesFallen: Кто где прописан? Откройте исходный код страницы видите тонну текста всеё PDF'ки? Введите в поиск текст например "Department of Computer and Information Science" или даже просто "Department" - ничего не найдёт.
Ответы:
Текст на картинках гугл не распознаёт. Pdf - это не картинка.
Посмотри внимательней... Там текст просто прописан на картинке... Выдели текст, щелкни правой кнопкой мыши и посмотри свойства и увидишь HTML-документ...
8Hs, а вы попробуйте rtf-файл посмотреть в исходном виде, там же тоже невозможно пользоваться полнотекстовым поиском. В pdf-формате текст - это тоже объект, и текст кодируется каким-нибудь образом. К сожалению, я в данный момент не могу дать ссылку на описание формата, но, если не ошибаюсь, такая документация есть в PDF SDK, который можно бесплатно скачать с сайта adobe.com


14 лет назад

RPI.su - самая большая русскоязычная база вопросов и ответов. Наш проект был реализован как продолжение популярного сервиса otvety.google.ru, который был закрыт и удален 30 апреля 2015 года. Мы решили воскресить полезный сервис Ответы Гугл, чтобы любой человек смог публично узнать ответ на свой вопрос у интернет сообщества.

Все вопросы, добавленные на сайт ответов Google, мы скопировали и сохранили здесь. Имена старых пользователей также отображены в том виде, в котором они существовали ранее. Только нужно заново пройти регистрацию, чтобы иметь возможность задавать вопросы, или отвечать другим.

Чтобы связаться с нами по любому вопросу О САЙТЕ (реклама, сотрудничество, отзыв о сервисе), пишите на почту [email protected]. Только все общие вопросы размещайте на сайте, на них ответ по почте не предоставляется.