Извлеките две разные строки из HTML файла и запишите их в текстовый файл с помощью языка Си#
Мне нужно извлечь строки, содержащие "заголовок" и "заголовок", из 500 HTML-файлов, хранящихся в папке.
Я попробовал код ниже, но когда я его выполняю, он говорит об ошибке в
streamwriter
.Что я уже пробовал:
foreach (string arg in Directory.GetFiles(@"C:\Users\htmlfiles") ) { string line; StreamReader file =new StreamReader(arg,Encoding.GetEncoding(1252)); StreamWriter file2 = new StreamWriter(@"C:\Users\outputfile.txt"); while ((line = file.ReadLine()) != null) { if (line.Contains("<TITLE>")) { file2.WriteLine(line); } if (line.Contains("<HEADER>")) { file2.WriteLine(line); } } file2.Close(); } }
F-ES Sitecore
Если ваш код выдает ошибку, всегда говорите, что это за сообщение об ошибке, оно существует не просто так.
Во-вторых, вы можете посмотреть на пакет HTML Agility Pack, чтобы сделать это за вас. Проблема с вашим кодом заключается в том, что он не будет работать, когда тег разделен по строкам
<название>
мой титул
</title>