C# Как удалить страницу, если ее больше двух htmltags?
У меня возникли проблемы с соскабливанием этого:
<td class="main txt"><a href="http://bors-nliv.svd.se/index.php/detail/index/4600">Afarak Group</a></td>
Я хотел бы отказаться от названия акции, в данном примере это: Afarak Group, но не смог понять, как после всех моих попыток и поисков. Но мне удалось избавиться от цен на акции с помощью этого кода:
private void button3_Click(object sender, EventArgs e) { List<string> aktier = new List<string>(); WebClient web = new WebClient(); String html = web.DownloadString("http://bors-nliv.svd.se/index.php/aktier/index/35244"); MatchCollection m1 = Regex.Matches(html, @"<td>\s*(.+?)s*</td>", RegexOptions.Singleline); foreach (Match m in m1) { if (m.Groups[1].Value != "3") if (m.Groups[1].Value != "Aktier") { string aktie = m.Groups[1].Value; aktier.Add(aktie); } } listBox2.DataSource = aktier; } }
Вот цена акции, которая имеет только эти два htmltags
<td>0,41</td>Но как я могу отказаться от названия акций страницы, когда она выглядит вот так?
<pre lang="HTML">
<td class="main txt"><td class="main txt"><a href="http://bors-nliv.svd.se/index.php/detail/index/4600">Afarak Group</a></td>это еще пара html-тегов.
Я пытался настроить спички на это
MatchCollection m1 = Regex.Matches(html, @"<a href"">\s*(.+?)s*</td>", RegexOptions.Singleline);
Но это все равно не работает. Что я упускаю?
Что я уже пробовал:
MatchCollection m1 = Regex.Matches(html, @"<a href"">\s*(.+?)s*</td>", RegexOptions.Singleline);