Pai809 Ответов: 1

C# как заменить ссылку href и src с помощью linq


всем привет,

Я скачал html-страницу и попытался заменить все значения href и scr на определенный домен, я попытался использовать для этого JQuery, но SEO индексирует исходный код в оригинальной ссылке href, что не очень хорошо для поисковой системы. Поэтому я должен сделать это в бэкэнде.

Мой вопрос заключается в том, что после загрузки html-страницы в виде строки, как я могу заменить все значения href и scr на мою доменную ссылку, я думал о том, чтобы сделать это с помощью Linq, любая идея будет полезна, спасибо.

Что я уже пробовал:

Я стараюсь
XDocument doc = XDocument.parse(html);
,это исключение, я думаю, что формат тегов не стандартизировать.

F-ES Sitecore

Как было предложено, используйте пакет agility pack или регулярное выражение. Если вы загуглите регулярное выражение для замены href, то найдете множество примеров. Не используйте xml, и вам действительно не нужен linq.

1 Ответов

Рейтинг:
0

Thomas Daniels

Вы не должны использовать синтаксические анализаторы XML для чтения/записи HTML, потому что допустимый HTML не обязательно является допустимым XML. Вместо этого используйте настоящий HTML-парсер, например пакет Html Agility Pack: Html Agility Pack | HAP[^]