senguptaamlan Ответов: 2

Копировать вставить с веб страницы в блокнот


Всем Привет,
Я думаю, что это очень простой вопрос, но я застрял с ним. Когда мы копируем текст с веб-страницы и вставляем его в блокнот, никакая HTML-разметка не вставляется, туда попадает только обычный текст. Как, блокнот обрабатывает его и удаляет разметку, но если мы вставим то же самое в любой редактор rich text, например Office Word, мы увидим, что разметка попадает туда (все ссылки форматирования и т. д. остаются нетронутыми).

Это будет ваша большая помощь, если кто - то прольет свет на это

2 Ответов

Рейтинг:
1

Guirec

Просто щелкните правой кнопкой мыши свою веб-страницу, затем просмотрите источник, наконец, скопируйте содержимое и вставьте его в блокнот.


senguptaamlan

Я думаю, что ты не понял моей проблемы, это моя вина. Я спрашивал, как блокнот удаляет разметку HTML, когда мы копируем контент с веб-страницы и вставляем его в блокнот.

Guirec

На самом деле он не удаляет html... но он использует "обычный текст" в буфере обмена, в то время как Word использует "форматированный текст"...
Если вы хотите удалить html-теги, вы можете сделать это в c#, используя регулярное выражение. Что-то вроде:


public static string RemoveTags(string html)
{
возвращение с регулярными выражениями.Заменить(HTML-код, "на<.*?&и GT;", строку.Пустой);
}

Рейтинг:
1

Gupta Abhishek

Guirec Le Bars, по-видимому, правильно объясняет разницу между тем, как word будет интерпретировать скопированные данные с веб-страницы, и блокнотом..

Вы не можете попасть в блокнот, копируя непосредственно, так как блокнот не может отображать форматированный текст в виде простого текстового файла...

И даже если вы скопируете вставку из источника представления, а затем скопируете содержимое в блокнот, он просто покажет теги и текст и не сможет визуализировать или сказать: "не могу их стилизовать или сказать, что не могу обеспечить форматирование"
По одной причине его просто обычный текст вы не можете получить богатый текстовый опыт в блокноте ..
Он копирует текст из html . В блокноте атрибуты или теги HTML будут игнорироваться, а файл Word может сделать их просто копировать из HTML-страницы в блокноте .txt файл будет игнорировать все теги хотя слово показывает "почти" точной укладки как в HTML-теги .. Почти потому, что есть несколько символов, которые он не поймет и может дать некоторую непоследовательность.


senguptaamlan

мои ожидания были немного больше....Я думал о том, какова внутренняя логика, которую Блокнот выполняет, когда мы выполняем операцию вставки.