Ответы на вопросы с тегом "webscraping"

Ответов: 1 Автор Vissa16

Как получить греческую букву с сайта во время веб-скребка с помощью Python?

Я пытаюсь научиться автоматизировать задачи с помощью python3. Прямо сейчас я пытаюсь открыть веб-сайт, получить с него элемент, а затем получить его текст на листе word в виде нового абзаца, используя модули requests, docx и bs4. Все это работает просто отлично, но сайт содержит некоторые ...

Читать ответы

Ответов: 1 Автор Filip Mrsovic

Как получить ссылки из топ-10 трендовых видео на youtube?

Я хочу удалить ссылки из топ-10 трендовых видео на youtube, но каждый раз, когда я запускаю свою программу, я получаю ссылки на материалы о youtube (реклама, авторские права, политика...).Что я уже пробовал: Это код, который я написал: импорт bs4 запросы на импорт рез=запрос.сделать("https...

Читать ответы

Ответов: 1 Автор HamzaMcBob

Прокрутка Selenium Python

Это дополнение к первой версии вопроса который я задал так как я все еще не могу его решить поэтому более подробная информация находится здесь Selenium scroll into view with a twist Python Мне удалось собрать атрибут ... но я понятия не имею, как его отредактировать, чтобы он работал так, к...

Читать ответы

Ответов: 1 Автор canard29

Webscraping веб-страница в C#

Привет, Я хочу интегрировать функцию этой страницы http://dniperu.online/buscador/buscardni_11ab.php в приложении на языке C#. При открытии страницы пользователь должен ввести 3 параметра: - Первая фамилия: Вискарра - Вторая фамилия: Корнехо - Имя(ы):Мартин Альберто Страница возвращает и...

Читать ответы

Ответов: 1 Автор eshan sharma

Я хочу прочитать 50 csv-файлов из папки. В каждом csv есть ссылки, которые я хочу открыть по одной ссылке и получить данные (Python 3.7).

Я хочу прочитать 50 CSV один за другим из пути к папке. В CSV-файле есть несколько ссылок во всех из них, я хочу открыть ссылку одну за другой и извлечь данные в текстовый файл для каждой ссылки должен быть создан новый текстовый файл. код работает, но не дает никаких выходных данных. вплот...

Читать ответы

Ответов: 1 Автор Member 14804837

Как получить исходный код страницы, как он есть в браузере, а не на странице просмотра с помощью selenium

Я знаю, что driver.getPageSource() получает вам веб-страницу в виде Html, но проблема, с которой я сталкиваюсь, заключается в том, что сайт, который я тестирую, помещает данные в скобки, например {{OriginDescription}}, возможно, используя какой-то js-фреймворк для получения данных? Во всяко...

Читать ответы

Ответов: 1 Автор Sunil KK

Как получить уведомление с помощью web scrapping - Python

Привет, Я хочу использовать python web scrapping с помощью selenium и хочу получить уведомление, когда дата изменения содержимого будет изменена. URL-АДРЕС : Система отчетности 2.9 - Европейское банковское управление[^] на этом веб-сайте еженедельно и ежемесячно обновляется контент, и неза...

Читать ответы

Ответов: 1 Автор Kaito Einstein

Попытка webscraping с Python, обзор

я изучаю веб-скребок , и я сделал этот код, чтобы очистить его от ChemSpider, но он медленный, как я могу его улучшить?from urllib.request import urlopen from bs4 import BeautifulSoup as soup search=input() def scrape_search(search): my_url="http://www.chemspider.com/Search.aspx?q="+st...

Читать ответы

Ответов: 1 Автор Member 13424161

Python webscraping, извлечение контента за пределами тегов span

- Привет! Я пытаюсь создать простой скрипт Python webscraping для извлечения содержимого за пределами тегов span. HTML, с которым я работаю, очень прост, в основном состоит из одного тега body и нескольких тегов span. <body> <span id="line2"></span>NUM=2039 <span id="li...

Читать ответы

Ответов: 1 Автор Sachin Makwana

Как извлечь url-адреса изображений с помощью пакета HTML agility Pack ?

Я с помощью HTML ловкость обновления, чтобы извлечь URL-адрес изображения от введенного веб-адреса. Я могу получать изображения, за исключением ... Paytm.com". В paytm.com, когда я вижу источник страницы, он отображает 5 тегов "img", где, как я получаю только 3. Может ли кто-нибудь сказать ...

Читать ответы

Ответов: 1 Автор JayyMehta

Извлечение текста из класса span из таблицы

Привет, у меня есть этот сайт, где я хочу, чтобы детали продукта были извлечены в моем листе excel. Я написала свое... Но я получаю ошибку в строке:If objdiv4.className = "Section" Then Итак, вот полный код:Что я уже пробовал:Sub onmyown() Dim ie As InternetExplorer Dim doc As HTMLDocumen...

Читать ответы

Ответов: 1 Автор pavithirakc

Как я могу динамически очищать данные с разных веб-сайтов на основе входных данных

I am trying to build a system, which when given an input, would return relevant specific information about it by scraping the web (For example: given a software name, output information about its releases). How to go about building a scraper for such a system? Что я уже пробовал:I have don...

Читать ответы

Ответов: 1 Автор JordyS

Как очистить веб-таблицу и отобразить ее в VB.NET заявление?

Я пытаюсь захватить таблицу данных с веб-страницы и отобразить ее в vb.NET применение. Проводя некоторые исследования, я обнаружил, что пакет HTML Agility Pack содержит функции, которые позволят легко соскабливать/извлекать данные с веб-страницы. Пакет не содержит никакой документации, и я,...

Читать ответы

Ответов: 1 Автор Member 13030368

Как проверить, присутствует ли строка на веб-странице в jsoup android.

Может ли кто-нибудь помочь мне, как проверить, присутствует ли строка на веб-странице, и выдать вывод?Что я уже пробовал:protected Void doInBackground(Void... params) { try { doc = Jsoup.connect(url).get(); linksOnPage = doc.select("h2.filmibeat-m...

Читать ответы

Ответов: 1 Автор Member 12620371

C# Как удалить страницу, если ее больше двух htmltags?

У меня возникли проблемы с соскабливанием этого: <td class="main txt"><a href="http://bors-nliv.svd.se/index.php/detail/index/4600">Afarak Group</a></td> Я хотел бы отказаться от названия акции, в данном примере это: Afarak Group, но не смог понять, как после всех м...

Читать ответы

Ответов: 1 Автор Kaito Einstein

Попытка webscraping с Python, обзор

я изучаю веб-скребок , и я сделал этот код, чтобы очистить его от ChemSpider, но он медленный, как я могу его улучшить?from urllib.request import urlopen from bs4 import BeautifulSoup as soup search=input() def scrape_search(search): my_url="http://www.chemspider.com/Search.aspx?q="+st...

Читать ответы

Ответов: 1 Автор Member 13424161

Python webscraping, извлечение контента за пределами тегов span

- Привет! Я пытаюсь создать простой скрипт Python webscraping для извлечения содержимого за пределами тегов span. HTML, с которым я работаю, очень прост, в основном состоит из одного тега body и нескольких тегов span. <body> <span id="line2"></span>NUM=2039 <span id="li...

Читать ответы