Как узнать кодировку pdf документа? - есть ответ

IdeaHunter, 3318 просмотров

Есть проблема. При копировании текста из pdf в любой текстовый редактор (Open Office, gedit) получаются кракозябры. Пробовал менять кодировки на лету в gedit, но кракозябры остаются. Декодер с сайта студии Артемия Лебедева также не помог. Видимо кодировка какая-то больно экзотическая. Сам документ отображается вполне корректно - открывал и Adobe Readerом, и xpdf, и встроенным в Ubuntu просмотрщиком.

Пример докмента:
http://ufn.ru/ufn99/ufn99_5/Russian/r995b.pdf

Посоветуйте плз как решить эту проблемку

Ответы:

Артём Шегеда

самый правильный путь - отрендерить в пиксельный формат и распознать какой-нибудь OCR

Barmichev

Я заинтересовался вашим вопросом. Сначала казалось, что нужен шрифт (его не хватает - AdvnTimes), который встроен в pdf, но отсутствует на компьютере. Но нашёл вот, что: http://forum.ru-board.com/topic.cgi?forum=4&topic=3050&start=200

Мохито

для этого...ну чтоб открыть...нужен Акробат...прога такая...у меня у самой не открывает...мучаюсь все время)

Роман68

Часто такое бывает. Решение: программа Штирлиц отображает нормально.

Текст -> Переопределение шрифтов -> и "врукопашную" назначить символу нужную "букву". ;-)

Iceni Infix (http://www.iceni.com/ru/)

14 лет назад

RPI.su - самая большая русскоязычная база вопросов и ответов. Наш проект был реализован как продолжение популярного сервиса otvety.google.ru, который был закрыт и удален 30 апреля 2015 года. Мы решили воскресить полезный сервис Ответы Гугл, чтобы любой человек смог публично узнать ответ на свой вопрос у интернет сообщества.

Все вопросы, добавленные на сайт ответов Google, мы скопировали и сохранили здесь. Имена старых пользователей также отображены в том виде, в котором они существовали ранее. Только нужно заново пройти регистрацию, чтобы иметь возможность задавать вопросы, или отвечать другим.

Чтобы связаться с нами по любому вопросу О САЙТЕ (реклама, сотрудничество, отзыв о сервисе), пишите на почту [email protected]. Только все общие вопросы размещайте на сайте, на них ответ по почте не предоставляется.