Как отредактировать PDF-файл? | KV.by
Определённо, многим пользователям, так или иначе, приходится сталкиваться с файлами в формате PDF. Но как их редактировать? Давайте попробуем найти ответ на этот вопрос вместе.
PDF (Portable Document Format) был разработан фирмой Adobe Systems как формат представления в электронном виде полиграфической продукции, документации, презентаций — при этом, независимый от платформы (т.е. файл, созданный в этом формате, будет отображаться неизменно вне зависимости от операционной системы и программы, в которой его откроют).
В основном, формат PDF используют для распространения, а не для создания документации. И, несмотря на то, что программ для работы с этим типов файлов довольно много, большинство из них предназначены только для чтения PDF. И если с просмотром проблем не возникает, то вопрос о том, как отредактировать PDF-файл, для многих пользователей остаётся без ответа. В этой статье мы расскажем о редактировании PDF-файлов и о том, какие программы можно для этого использовать.
Программы для просмотра, которые использует большинство пользователей, не умеют изменять структуру или текст документа, добавлять или удалять изображения. Но порой возникает необходимость не только прочитать, но и изменить файл.
Итак, с помощью каких программ можно отредактировать PDF-файл? Благо, и такого софта достаточно; на свой вкус и для своих целей можно выбрать подходящую программу. В основном такие программы повторяют определённые возможности Adobe Acrobat Professional.
Adobe Acrobat Professional позволяет и создавать, и редактировать PDF-документы, конвертировать документы Microsoft Word в PDF и наоборот. Также программа позволяет использовать для создания PDF-файлов аудио, а также видеоконтент, совместимый с Adobe Flash Player.
Основными возможностями программы являются:
- Конвертирование и сканирование в формат PDF
- Сканирование и сохранение документов в формате PDF
- Преобразование HTML в PDF
- Преобразование сообщений электронной почты в PDF
- Экспорт PDF-файлов
- Редактирование PDF-файлов
- Комбинирование разных файлов и разного контента
Adobe Acrobat был и остаётся популярен среди людей, работающих с PDF-форматом. Программа удобна в тех случаях, когда надо использовать по максимуму возможности формата, однако в случае, когда в этом нет необходимости, имеет смысл рассмотреть альтернативные варианты, более быстрые и доступные.
В общем-то, большинство редакторов PDF похожи, и мы рассмотрим редактирование PDF-файла на примере одной из наиболее популярных и распространённых программ на сегодняшний день — это PDF XChange Viewer.
PDF XChange Viewer предназначается непосредственно для редактирования PDF-файлов. Эта бесплатная программа поддерживает возможность изменения текста, графики, добавления или удаления отдельных элементов документа. В программе отсутствуют функции шифрования документов, добавление цифровых подписей и т.д.
Каковы основные возможности программы и как ими пользоваться?
Удаление страниц из редактируемого PDF-файла и добавление страниц из другого PDF-файла.
Найти необходимую команду можно в меню «Документ».
Соответственно, для удаления выбираем графу «Удаление страниц», а для вставки — «Вставка страниц». Такие действия производятся аналогично.
Допустим, необходимо вставить несколько страниц из другого документа.
Выбираем соответствующую команду, далее, в открывшемся окне необходимо указать файл, выбрать страницы, которые вы хотите добавить, а так же расположение этих страниц в редактируемом файле.
Работа с текстом.
В документ можно добавлять текст в виде комментариев: сноски, примечания и т.д.
Это можно сделать в меню «Инструменты», выбрав графу «комментарии и пометки», или же с помощью соответствующих кнопок на панели инструментов. Можно задавать цвет, тип, размер шрифта, заключать текст в рамки, выбирать цвет фона надписи. Таким образом, можно отредактировать текст так, чтобы он смотрелся либо как изначальный, либо как самостоятельная пометка.
Кроме пометок, можно зачёркивать, подчёркивать, выделять цветом уже существующий текст (всё через то же меню «Инструменты»).
Помимо этого, в документ можно добавлять различные фигуры, линии, окружности, прямоугольники, многоугольники и т. д. Присутствуют такие инструменты как «Карандаш» и «Ластик».
Также имеется возможность вставлять в документ различные графические файлы и работать с ними.
Какими ещё программами можно воспользоваться для редактирования PDF?
Foxit PDF Editor
Коммерческая программа, которая предоставляет возможность просмотра текста с изменением шрифта и размера имеющихся картинок, умеет экспортировать PDF в текстовые файлы, HTML, Microsoft Office или в графические форматы. Также с помощью этой программы можно добавлять в документ свой текст, картинки и штампы. Есть поддержка распознавания отсканированного текста (OCR) и шифрования документов.
Infix PDF Editor
Довольно быстрая, простая и удобная программа (в обращении похожая на обычный текстовый редактор), с помощью которой можно также изменять содержание текста, его шрифт, размер и т.д. Программа имеет достаточно большие возможности работы с текстом, комментариями, закладками, колонтитулами, слоями и изображениями.
Удобно то, что программа не требует инсталляции и может запускаться и с переносных носителей.
Cool PDF Reader
Cool PDF Reader — небольшая бесплатная программка, которая умеет конвертировать PDF-файлы в BMP, JPG, GIF, PNG, WMF, EMF и EPS-форматы, извлекать текст из документов в формат TXT, а также показывать PDF в режиме слайд-шоу.
Помимо вышеприведённых программ, существуют различные веб-приложения для работы с PDF-файлами, что удобно для людей, которые не работают с этим форматом постоянно.
PDFescape
PDFescape — это полноценный онлайн-редактор PDF-документов. Его возможности позволяют добавлять в файл новые страницы, делить документы на несколько файлов, вставлять комментарии, аннотации, изображения и т.д. В общем, если под рукой нет подходящей программы, а надо срочно подправить документ, то вам — сюда.
ILovePDF
Этот ресурс подойдёт вам, если нужно быстро разделить один документ на несколько, или же наоборот — собрать несколько воедино.
PDF-to-Word Converter
Название говорит само за себя. PDF-to-Word Converter не является полноценным редактором. Этот сайт фирма Nitro PDF Software запустила для рекламы своего платного конвертера. Принцип работы сервиса такой: вам нужно загрузить свой PDF-файл и указать e-mail, куда вам через несколько минут вышлют готовый документ в формате DOC.
PDF to Flash Page Flip
И напоследок — довольно забавный сервис, который поможет вам легко создать из PDF-файла (а потом и скачать) виртуальную книгу, страницы которой будут переворачиваться.
Для этого на сайт нужно всего лишь загрузить свой файл, из которого сервис сгенерирует книгу, и задать подходящие опции.
Итак, вопреки мифу о том, что в PDF-файл сложно внести изменения, мы показали, что отредактировать его можно достаточно просто, даже не имея особых навыков.
Приведённый выше перечень программ и сервисов для работы с PDF-документами далеко не полный, и продолжать его можно очень долго. PDF-редакторы очень разнообразны, от продвинутых, возможности которых удовлетворят профессионалов, до элементарных, позволяющих легко выполнять простейшие манипуляции, и не требующих особой подготовки.
Absinthium
Знай свой мобильный | Телефонный блог №1 в Интернете
Знай свой мобильный | Телефонный блог №1 в Интернете — новости, обзоры, советы и технические советыПопулярное
Узнайте больше →
Лучшие безлимитные тарифные планы на 2023 год
Найдите самые лучшие безлимитные тарифные планы для вашего смартфона. Узнайте, какой перевозчик предлагает лучшие предложения, самые выгодные предложения и самые низкие цены…
Apple AirPods: полное руководство по покупке [2023]
В этом руководстве по покупке AirPods мы подробно расскажем все, что вам нужно знать об AirPods от Apple, включая все различные модели, их функции, что они делают и чем они все отличаются…
Apple Watch: полное руководство покупателя [2023]
Стоит ли покупать Apple Watch? Вот буквально все, что вам нужно знать об Apple Watch, включая их историю, все модели, характеристики и функции…
Восстановленные телефоны: руководство для покупателей (2023 г.
)Если вы хотите сэкономить немного денег и сделать планету солиднее, сократив отходы, покупка отремонтированных телефонов — отличный вариант. Вот все, что вам нужно знать…
Лучший безлимитный план Verizon? Давайте сравним и исследуем…
Какой лучший безлимитный тариф Verizon? На данный момент у вас есть довольно много вариантов — вот как они все сравниваются…
Apple iPhone: полное руководство по покупке [2023]
Думаете о покупке своего первого iPhone? Вот все, что вам нужно знать об iPhone от Apple, в одном месте…
ПОСЛЕДНИЕ
Цена Google Pixel Fold может быть его лучшей функцией — вот почему…
Сколько будет стоить Google Pixel Fold? Согласно утечкам, где-то от 1800 до 1300 долларов, но, вероятно, это будет ближе к последнему. Вот почему…
Google Pixel Fold: все, что вам нужно знать [ОБНОВЛЕНО]
Складной телефон Google — Google Pixel Fold — скоро выйдет, и вот все, что вам нужно знать!
Дата выхода Google Pixel Fold: скорее всего, июнь 2023 г.
Многочисленные отчеты и утечки утверждают, что Google работает над складным телефоном Pixel — Google Pixel Fold. Но возможен ли релиз в 2022 году? Давайте исследуем…
Прогнозы док-станции для зарядки динамика Google: как это будет работать?
Google готовит новую «док-станцию» к запуску вместе со своим планшетом Pixel, и она называется док-станцией Google Charging Speaker.
OnePlus Nord CE 3 Lite и OnePlus Nord Buds 2 ПОДТВЕРЖДЕНЫ: вот подробности…
Грядет следующий телефон OnePlus и TWS из серии Nord, OnePlus Nord CE 3 Lite и OnePlus Nord Buds 2. Вот все, что вам нужно знать!
Чего ожидать от Apple WWDC23: Apple Glasses, iOS 17, новые MacBook и многое другое!
Apple объявила, что в этом году Всемирная конференция разработчиков, известная как WWDC23, пройдет с 5 по 9 июня 2023 года.
Лучшая альтернатива Samsung Galaxy S23 Ultra [Руководство по 2023]
Вот краткий обзор некоторых из лучших альтернатив Samsung Galaxy S23 Ultra, которые вы можете купить прямо сейчас…
Спецификации VIVO X Fold 2 просочились в преддверии «неизбежной» даты выпуска
Ожидается, что VIVO X Fold 2 получит дату выпуска очень скоро, вот все, что вам нужно знать о спецификациях VIVO X Fold…
Oppo Find X6 Pro против Oppo Find X6: знали ли вы, что была непрофессиональная находка?
Oppo выпустила свои последние флагманы Oppo Find X6 Pro и Oppo Find X6. Вот наше сравнение этих телефонов, давайте проверим, какой из них лучше!
Дисплей OnePlus 11 имеет «проблемы» с яркостью — вот почему…
OnePlus 11 — отличный телефон, но его дисплей, хотя и достаточно приличный по большей части, имеет некоторые проблемы, когда речь идет об общих уровнях яркости…
Apple iPhone: полное руководство по покупке [2023]
Думаете о покупке своего первого iPhone? Вот все, что вам нужно знать об iPhone от Apple, в одном месте…
Цена планшета Google Pixel: может быть меньше 500 долларов? Потенциально…
Что касается цены на Google Pixel Tablet, сколько Google будет взимать за свой новый Android-планшет позже в этом году? Давайте исследуем…
iOS 16.5: что нового, дата выхода и многое другое!
Грядет iOS 16.5, и она приносит с собой обновления для Siri и Apple News.
Характеристики планшета Google Pixel: чего ожидать в 2023 году
Вот краткий обзор спецификаций Google Pixel Tablet (на основе информации от Google и утечек) в преддверии его официального запуска в конце этого года…
Google Pixel Tablet заменит Nest Hub — вот почему…
Google Pixel Tablet появится где-то в 2023 году, и когда это произойдет, он, вероятно, заменит продукты Google Nest Hub — вот как и почему…
Дата выпуска и характеристики планшета Google Pixel: все слухи на данный момент…
Поскольку дата выпуска запланирована на 2023 год, вокруг Google Pixel Tablet много ажиотажа. Вот все, что вам нужно знать…
Сравнение размеров телефонов OnePlus: их ВСЕ в одном месте…
Эта сравнительная таблица, показывающая размеры и размеры телефона OnePlus, послужит удобным руководством при принятии решения о том, какой из них выбрать …
Galaxy A54 против Galaxy M54: A или M? Какой выбрать?
Последние бюджетные смартфоны Samsung Galaxy A54 и Galaxy M54 соревнуются в этом сравнении. Давайте проверим, какой телефон Samsung среднего класса лучше?
6 лучших моделей iPhone, которые вы можете купить прямо сейчас — [2023]
Какой лучший iPhone вы можете купить прямо сейчас? Вот все лучшие варианты на 2022 год, включая последний флагман Apple и пару более дешевых вариантов…
Как отправлять зашифрованные факсы на iPhone: краткое руководство [2023]
Вот полное руководство о том, как отправлять зашифрованные факсы на iPhone, охватывающее все, что вам нужно знать о том, как начать…
Размеры телефонов Google Pixel: простая сравнительная таблица (ВСЕ МОДЕЛИ)
В этом посте я покажу вам простую сравнительную таблицу, показывающую все размеры телефонов Google Pixel. Они разные по характеристикам и размеру.
Преимущества цифровой факсимильной связи (с вашего телефона): пора переключаться…
Вот краткий обзор многих преимуществ цифровой факсимильной связи по сравнению с традиционными методами факсимильной связи. Если вы хотите сэкономить деньги и сделать факс более безопасным, читайте дальше…
Какой iPhone имеет 3 камеры? Вот список…
Сейчас iPhone от Apple выпускается разных форм и размеров, но только у некоторых избранных iPhone есть 3 камеры на задней панели …
Как удалить стандартные приложения Apple с Apple Watch
Благодаря watchOS 9.4 теперь вы можете удалять приложения Apple по умолчанию с Apple Watch и Apple Watch Ultra — ну, некоторые приложения. Вот как…
PDF-файл — Tableau
В этой статье описывается, как подключить Tableau к данным файла .pdf и настроить источник данных.
Примечание. Tableau не поддерживает языки с письмом справа налево (RTL). Если ваш PDF-файл содержит текст RTL, символы могут отображаться в Tableau в обратном порядке.
Установите соединение и отсканируйте документ на наличие таблиц
После того, как вы откроете Tableau, в разделе «Подключение» нажмите «Файл PDF».
Выберите файл, к которому вы хотите подключиться, и нажмите «Открыть».
В диалоговом окне «Сканировать PDF-файл» укажите страницы в файле, которые вы хотите, чтобы Tableau сканировал на наличие таблиц. Вы можете сканировать таблицы на всех страницах, только на одной странице или в диапазоне страниц.
Примечание: При сканировании первая страница файла считается страницей 1, как и в большинстве программ чтения PDF. При сканировании таблиц указывайте номер страницы, отображаемый программой чтения PDF, а не номер страницы, который может использоваться в самом документе, который может начинаться со страницы 1, а может и не начинаться.
Например, предположим, что вы хотите использовать «Таблицу 1» из изображения ниже. В программе чтения PDF отображается номер, а в файле .pdf отображается другой номер. Чтобы правильно отсканировать эту таблицу, укажите номер страницы, отображаемый программой чтения PDF. В этом примере вы указываете страницу 15.
На странице источника данных выполните следующие действия:
(Необязательно) Выберите имя источника данных по умолчанию в верхней части страницы, а затем введите уникальное имя источника данных для использования в Tableau. Например, используйте соглашение об именовании источников данных, которое поможет другим пользователям источника данных определить, к какому источнику данных подключаться. Имя по умолчанию генерируется автоматически на основе имени файла.
Если файл содержит одну таблицу, щелкните вкладку листа, чтобы начать анализ. В противном случае перетащите таблицу с левой панели на холст, а затем щелкните вкладку листа, чтобы начать анализ.
О таблицах в левой панели
Таблицы, указанные в файле .pdf, получают уникальные имена и отображаются на левой панели после сканирования. Например, вы можете увидеть такое имя таблицы, как «Страница 1, таблица 1». Первая часть имени таблицы указывает на страницу в файле .pdf, из которой взята таблица. Вторая часть имени таблицы указывает порядок, в котором таблица была идентифицирована. Если Tableau идентифицировал более одной таблицы на странице, вторая часть имени таблицы может указывать на одно из двух:
- Tableau обнаружил на странице другую уникальную таблицу или подтаблицу.
- Tableau по-другому интерпретировал таблицу на странице. Tableau может предоставить несколько интерпретаций таблицы в зависимости от того, как таблица представлена в вашем файле .pdf.
Пример источника данных PDF-файла
Вот пример источника данных PDF-файла:
Получите больше данных
Получите больше данных в свой источник данных, добавив дополнительные таблицы или подключившись к данным в другой базе данных.
Добавить данные из текущего файла:
С левой панели перетащите дополнительные таблицы на холст, чтобы объединить данные с помощью объединения или объединения. Дополнительные сведения см. в разделе «Объединение ваших данных» или «Объединение ваших данных».
Если страницы, которые были отсканированы на шаге 3 описанной выше процедуры, не отображают нужные таблицы на левой панели, щелкните стрелку раскрывающегося списка рядом с подключением к файлу PDF и выберите Повторное сканирование файла PDF. Этот параметр позволяет создать новое сканирование, чтобы можно было указать разные страницы в файле .pdf для сканирования таблиц.
Добавьте больше данных из другой базы данных: На левой панели щелкните Добавить рядом с Подключениями. Дополнительные сведения см. в разделе Объединение ваших данных.
Если нужного соединителя нет в списке на левой панели, выберите «Данные» > «Новый источник данных», чтобы добавить новый источник данных. Дополнительные сведения см. в разделе Смешивание данных.
Настройка параметров таблицы
Вы можете установить параметры таблицы. На холсте щелкните стрелку раскрывающегося списка таблицы и укажите, включают ли данные имена полей в первой строке. Если это так, эти имена станут именами полей в Tableau. Если имена полей не включены, Tableau генерирует их автоматически. Вы можете переименовать поля позже.
Используйте интерпретатор данных для очистки данных
Если Tableau обнаружит, что может помочь оптимизировать источник данных для анализа, вам будет предложено использовать интерпретатор данных. Интерпретатор данных может обнаруживать вложенные таблицы, которые вы можете использовать, и удалять уникальное форматирование, которое может вызвать проблемы в дальнейшем анализе. Дополнительные сведения см. в статье Очистка данных из Excel, CSV, PDF и Google Таблиц с помощью интерпретатора данных.
Объединение таблиц в ваших файлах .pdf
Вы можете объединять таблицы в вашем файле. Дополнительные сведения об объединении см. в разделе Объединение ваших данных.
При использовании поиска с подстановочными знаками для объединения таблиц результат ограничивается страницами, которые были отсканированы в исходном файле, к которому вы подключились. Предположим, у вас есть три файла: A.pdf, B.pdf и C.pdf. Первым файлом, к которому вы подключаетесь, является файл A, и вы ограничиваете сканирование таблиц страницей 1. Когда вы используете поиск с подстановочными знаками для объединения таблиц из файлов B и C, дополнительные таблицы, включенные в объединение, могут поступать только со страницы 1 B и страницы 1 из С.
Советы по работе с файлами .pdf
Следующие советы помогут вам работать с файлами .pdf в Tableau.
Используйте коннектор файлов PDF, чтобы идентифицировать только таблицы в файле . pdf.
Основная цель соединителя файла PDF — найти и идентифицировать таблицы в файле .pdf. Поэтому он игнорирует любую другую информацию в файле, которая не является частью таблицы, включая заголовки, подписи и сноски. Если связанные данные хранятся в одной из этих областей, например в заголовке таблицы, вы можете использовать Tableau, чтобы сначала экспортировать данные файла .pdf в файл .csv, вручную добавить данные, которые были сохранены в заголовке таблицы, а затем вместо этого подключитесь к файлу .csv. Дополнительные сведения см. в разделе Экспорт данных в CSV-файл.
Используйте стандартные таблицы.
В целом, Tableau лучше всего работает со стандартными таблицами, использующими табличный формат.
В идеале таблицы в файле . pdf имеют заголовки столбцов в одной строке и значения строк в одной строке, как показано в примере ниже.
Цвета и затенение, используемые внутри или вокруг таблиц, могут повлиять на идентификацию таблиц.
Таблицы с уникальным форматированием могут потребовать некоторой очистки или ручного редактирования вне Tableau. Уникальное форматирование может включать иерархические заголовки, имена заголовков, которые охватывают несколько строк, значения строк, которые охватывают несколько строк, заголовки углов и таблицы с накоплением, как показано в примерах, показанных ниже.
Примечание. Tableau не поддерживает подключения к файлам .pdf, созданным программным обеспечением для сканирования (оптического распознавания символов).
Проверить данные.
Убедитесь, что вы проверяете данные в таблицах, которые Tableau идентифицирует в вашем файле .pdf. Вы можете проверить данные, используя либо сетку данных, либо, если вы использовали интерпретатор данных, рабочую книгу результатов.
Избегайте таблиц, занимающих несколько страниц.
Если ваш файл .pdf содержит таблицу, которая охватывает несколько страниц, Tableau интерпретирует эту таблицу как несколько таблиц. Чтобы решить эту проблему, используйте объединение для объединения таблиц. Дополнительные сведения см. в разделе Объединение ваших данных.
Переименовать файлы .pdf, имена которых содержат символы Юникода.
После подключения к файлу . pdf, который содержит символы Юникода в имени файла, вы можете увидеть следующую ошибку.
Чтобы решить эту проблему, переименуйте файл, используя символы, отличные от Юникода, и снова подключитесь к файлу .pdf.
Не используйте защищенные паролем файлы .pdf.
После подключения к файлу .pdf и сканирования таблиц может появиться следующая ошибка.
Tableau показывает эту ошибку, когда ваш файл .pdf защищен паролем и не может получить доступ к его содержимому. Tableau не может поддерживать подключения к файлам .pdf, защищенным паролем.
Значения псевдонимов, интерпретируемые по-разному или неправильно.
В сетке данных вы можете заметить, что некоторые значения интерпретируются иначе, чем в файле .pdf. Эту интерпретацию можно исправить, используя псевдонимы для переименования определенных значений в поле.
Например, предположим, что вы видите следующую таблицу после подключения к файлу .pdf. Некоторые аббревиатуры штатов интерпретируются в нижнем регистре и выделены синим цветом.
Вы можете решить эту проблему, используя псевдонимы для замены сокращений в нижнем регистре на сокращения в верхнем регистре. Для этого щелкните стрелку раскрывающегося списка рядом с именем столбца и выберите Псевдонимы.
Разрешить заголовки столбцов, которые интерпретируются как значения таблицы.
В сетке данных вы также можете заметить, что некоторые заголовки столбцов в файле . pdf вместо этого интерпретируются как табличные значения. Это может произойти, если ваш файл .pdf содержит таблицы с уникальным форматированием или иерархическими заголовками. В этом сценарии сначала попробуйте интерпретатор данных. Если интерпретатор данных не устраняет проблему, попробуйте вручную переименовать столбцы в соответствующие имена и отфильтровать имена заголовков, которые обрабатываются как значения, с помощью фильтров источника данных.
Например, предположим, что вы видите следующую таблицу после подключения к файлу .pdf. Заголовки таблиц из файла .pdf интерпретируются как табличные значения, выделенные синим цветом.
Один из способов решения проблемы с заголовком — выполнить действия, аналогичные приведенным ниже:
Дважды щелкните имя столбца и переименуйте F1 в Year. Повторите этот шаг для F2–F4 для угля, газа и нефти.
Щелкните значок типа данных для столбца «Год» и измените его на числовой тип данных. Это приводит к тому, что нечисловые значения в этом столбце преобразуются в нулевые значения.
В правом верхнем углу страницы источника данных нажмите «Добавить», нажмите кнопку «Добавить» и выберите поле «Год».
В диалоговом окне «Фильтр» установите флажки «Нулевой» и «Исключить».
Строки в столбце «Год», содержащие нулевые значения, удаляются из сетки данных, что влияет на строки из других столбцов в таблице.
О файлах .ttde и .hhyper
Вы можете заметить файлы .ttde или .hhyper при перемещении по каталогу вашего компьютера. Когда вы создаете источник данных Tableau, который подключается к вашим данным, Tableau создает файл .ttde или .hhyper. Этот файл, также известный как теневой экстракт, используется для повышения скорости загрузки источника данных в Tableau Desktop. Хотя теневой экстракт содержит базовые данные и другую информацию, похожую на стандартный экстракт Tableau, теневой экстракт сохраняется в другом формате и не может использоваться для восстановления ваших данных.
См. также
- Настройка источников данных. Добавьте дополнительные данные в этот источник данных или подготовьте данные перед их анализом.
- Построение диаграмм и анализ данных — начните анализ данных.
О формате PDF (понимание и работа с документами PDF)
Программирование / PDF / О формате PDF (понимание и работа с документами PDF)
В этой теме
Документы в формате PDF сильно отличаются от обычных документов. Формат документа предназначен для одинакового представления документов независимо от платформы и программного обеспечения.
Этот формат в основном представляет собой полное описание плоского документа с фиксированным макетом, включая текст, шрифты, графику и всю другую информацию, необходимую для его отображения или печати.
Таким образом, он имеет несколько особенностей, которые необходимо учитывать при работе с PDF-документами.
Исходное положение
В отличие от растрового изображения, в котором исходное положение находится в верхнем левом углу, исходное положение PDF-документа (по умолчанию) находится в нижнем левом углу .
. Вы можете оставить значение по умолчанию или переместить исходную точку в любой из углов с помощью метода SetOrigin. Все последующие измерения будут выполняться относительно этого нового источника.
Единицы
В документах PDF все измеряется с помощью «Точки» . В мире PDF 1 пункт = 1/72 дюйма , это означает, что ширина страницы в 595 пунктов на самом деле составляет 595/72 = 8,27 дюйма, что является стандартной шириной для страницы формата DIN A4.
Для удобства GdPicture.NET предоставляет метод SetMeasurementUnit, который позволяет выбирать между точками, дюймами, миллиметрами и сантиметрами (точки являются единицей измерения по умолчанию). После вызова этого метода все последующие значения местоположения и размера будут возвращены в выбранных единицах измерения.
Разрешение
Только растровые изображения имеют разрешение , в документе PDF любой текст или векторная графика будут отображаться с желаемым разрешением устройства вывода (экрана или принтера). Для отображения разрешение зависит от уровня масштабирования рендеринга. Физический размер страницы не изменится, но в зависимости от уровня масштабирования количество пикселей, используемых для ее представления, будет варьироваться. Например, возьмем полную страницу формата А4, ее высота будет 8,27 дюйма, а ширина — 11,69 дюйма.дюймы.
При отображении на 100% разрешение составляет 96 точек на дюйм , поэтому, применяя известную формулу « дюймов = пикселей / разрешение », фактические пиксели, необходимые для отображения изображения, будут 1123 x 794 пикселей. При отображении в масштабе 150% разрешение составляет 144 DPI, поэтому размер экрана будет 1684 x 1191 пикселей и так далее.
Обратите внимание, что текущее разрешение экрана доступно через свойства HorizontalResolution и VerticalResolution объекта GdViewer.
Та же формула применяется, когда вы хотите преобразовать страницу PDF в растровое изображение (этот процесс называется растеризацией), потому что это то же самое, за исключением того, что вы будете выбирать выходное разрешение вместо работы с экраном или разрешение принтера.
Так что имейте в виду, что чем выше разрешение, тем больше будет результирующее изображение и тем больше будет требуемая память и системные ресурсы.
Границы
Документ PDF также содержит границы страниц, также известные как «поля». MediaBox используется для указания ширины и высоты страницы . Для среднего пользователя это, вероятно, равно фактическому размеру страницы.
MediaBox является обязательным и является самым большим блоком страницы в документе PDF. CropBox является необязательным и определяет область, до которой должно быть обрезано содержимое страницы , он используется для отображения и печати. Он может иметь тот же размер, что и MediaBox , , но если он меньше, то то, что находится за пределами границ CropBox , не будет видно.
Повороты
Наконец, страницы PDF могут иметь внутренний поворот по часовой стрелке на 90°, 180° или 270°. Когда такое вращение установлено, весь контент поворачивается во время отображения без изменения системы координат или его начала.
При повороте на 90° или 270° ширина и высота меняются местами, что может затруднить некоторые операции обработки.
Вот почему GdPicture.NET предоставляет метод NormalizePage, который устанавливает поворот страницы на 0, а также устанавливает CropBox аналогичен MediaBox, поэтому можно работать в простой обычной системе координат.
Зная это, становится легко нарисовать что-нибудь на странице PDF в заданном месте.
Но когда пользователь в интерактивном режиме выбирает область или место в средстве просмотра, которое отображает страницу, и цель состоит в том, чтобы нарисовать что-то именно в этом месте, вам нужно быть осторожным с координатами, которые вы получаете . Действительно, координаты области 90 259 в кадре просмотра сильно отличаются от того, что вы получили бы в системе координат документа 9.0260, и они также в разных единицах измерения (пиксели против дюймов).
GdPicture.NET предоставляет несколько методов для получения координат и размеров либо в системе координат средства просмотра (в пикселях), либо в системе координат документа (в дюймах).