Member 12094227 Ответов: 2

Как преобразовать формат изображения в текстовый формат с помощью форм wndows c#.net


как новичок в нижеприведенной теме


Привет всем,

Iam пытается преобразовать страницу формата изображения PDF в текстовый формат из-за копирования текста.
Но я стараюсь ниже кода, который я пробовал. пожалуйста помогите мне кто нибудь

Что я уже пробовал:

 byte[] imageArray = System.IO.File.ReadAllBytes("d:\\Source.doc");
           string base64ImageRepresentation = Convert.ToBase64String(imageArray);
           string result = System.Text.Encoding.UTF8.GetString(imageArray);
using (StreamWriter writer = new StreamWriter("d:\\Target.txt", true))
           {
               writer.Write(base64ImageRepresentation);
               writer.Flush();
               writer.Close();
           }

Jochen Arndt

Пожалуйста, объясните подробно, чего вы хотите достичь.

У вас есть PDF - файл и вы хотите скопировать из него текст? Или это файл Word, как указано в расширении .doc?

В обоих случаях это не может быть сделано так, как вы пытались. Вам нужны функции, поддерживающие чтение файлов таких типов, которые обычно предоставляются библиотеками.

2 Ответов

Рейтинг:
2

Richard MacCutchan

Для начала Вы читаете файл .doc, который не является PDF. А во-вторых, вы не можете читать файл doc таким образом и ожидать, что он выйдет в виде текста. Вам нужно использовать Microsoft.Офис.Взаимодействие.Пространство имен Word ()[^] для интерпретации файлов MS Word.


Рейтинг:
0

debasish mishra

Пожалуйста, попробуйте использовать шаги, описанные ниже в этом примере.

Преобразование PDF в текст на языке C#[^]