Member 12055161 Ответов: 1

Как конвертировать pdf-файл в excel на C++?


Я хочу конвертировать Pdf-файл в Excel, это возможно на C#, но я хочу на C++.
Кто-нибудь может мне помочь??
Заранее спасибо.

Что я уже пробовал:

Я пытался конвертировать в c#, но вся моя другая работа находится на c++, поэтому я хочу, чтобы это тоже было на C++..

Richard MacCutchan

Насколько я знаю, нет библиотеки с открытым исходным кодом, которая позволяет читать PDF-файлы с языка C++. Единственный способ-написать весь код самостоятельно, основываясь на спецификациях Adobe; это не тривиальное упражнение.

Sergey Alexandrovich Kryukov

..хуже того, вся проблема означает, что главная ошибка уже совершена. Данные, которые могут нуждаться в какой-либо обработке, никогда не должны храниться в формате PDF. PDF-это как бумага: он предназначен для чтения людьми, вот и все; он не структурирован каким-либо семантически разумным образом. Когда он извлекается, он остается неструктурированным.
—СА

Richard MacCutchan

Ну кто же знал?

Sergey Alexandrovich Kryukov

В том-то и дело: с самого начала было ясно, что PDF - это тупик в обработке данных. Я уже сталкивался с этим в реальной жизни; это просто бизнес-антипаттерн. У нас был клиент, у которого была база данных, в частности, по электронным компонентам. И есть поставщики таких компонентов, производители или просто продавцы, а некоторые предоставляют информацию о том, что они предлагают, только в формате PDF. По крайней мере, два предприятия не смогли прийти к разумному соглашению о предоставлении данных каталога. Возможно, продавец поддерживает ту же базу данных, что и этот клиент, внутри компании. Кроме того, есть компании, пытающиеся паразитировать на человеческой глупости. Люди купили приложение для синтаксического анализа PDF, размещения данных в таблицах и так далее, более или менее близко, и этот клиент хотел интегрировать его, и так далее. Вопрос в том, хотят ли эти продавцы эффективно продавать или нет?
—СА

Mohibur Rashid

Я как раз собирался это сказать. Либо Вы читаете данные, которые вам не положено читать,либо вы подожгли своего инженера.

1 Ответов

Рейтинг:
2

Michael Haephrati

Это очень сложная задача. Во-первых, PDF и Excel различаются по характеру своих документов, но поскольку все, что помещено в PDF, может быть помещено в файл Excel, это выполнимо.
Начните с загрузки этот библиотека PDF с открытым исходным кодом.
Затем вы можете открыть PDF-файл и получить доступ к его элементам, таким как текст, шрифт, атрибуты текста, изображения и т. д.
Тогда проще всего было бы создать ASCII-файл, заканчивающийся на. csv. Такой файл будет плавно импортирован в Excel при первом его использовании, а затем вы сможете сохранить его как собственный файл Excel. Более сложной частью было бы создание собственного файла Excel.
Вы можете использовать этот платный продукт или бесплатный, например вот этот.
Вот простой пример создания вашего первого собственного файла Excel с помощью бесплатной библиотеки:

#include "xlsxwriter.h"
int main() {
    lxw_workbook  *workbook  = workbook_new("hello_world.xlsx");
    lxw_worksheet *worksheet = workbook_add_worksheet(workbook, NULL);
    worksheet_write_string(worksheet, 0, 0, "Hello", NULL);
    worksheet_write_number(worksheet, 1, 0, 123, NULL);
    workbook_close(workbook);
    return 0;
}