Member 13742637 Ответов: 1

Как импортировать идентификатор раздела В мои Google листы с помощью importxml?


Я хочу скопировать все компании, перечисленные на этой странице ([^])в Google Sheet, и мне нужно только содержание
<section id="data-container"> == $0.

поэтому я ищу совет , как правильно начать все сначала. Это мой первый раз, когда я использую HTML или XML. Спасибо

Что я уже пробовал:

Я перепробовал все виды комбинаций, используя

=IMPORTXML("https://www.inc.com/inc5000eu/list/2018", "//section/[@id='data-container']") ,
=IMPORTXML("https://www.inc.com/inc5000eu/list/2018", "//section/*[@id='data-container']"), 
=IMPORTXML("https://www.inc.com/inc5000eu/list/2018", "//section/data-container") and others

но ни один из них, кажется, не работает.
Я также опробовал функцию importHTML. Каждый "список", который я получаю, - это только часть строки меню сбоку. Есть 16 и пытается индекс 17 скажи мне н/А. Кроме того, на сайте нет доступной таблицы. Большинство учебников Youtube, которые я смотрел по этой теме, копируют таблицы и списки из Википедии, что намного проще и понятнее, чем эта таблица(или это список?). Если я должен предоставить больше информации о HTML-коде, пожалуйста, дайте мне знать

1 Ответов

Рейтинг:
2

Patrice T

Цитата:
Я хочу скопировать все компании, перечисленные на этой странице

Вам нужно ознакомиться с тем, что этот сайт рассматривает это копирование как грабеж, и они делают все возможное, чтобы помешать вам украсть их работу.
Ваш xml-импорт не будет работать, потому что эта страница не является файлом xml-данных.
Эта страница является html-страницей, но она также не содержит данных, это шаблон базы данных. Отобразите исходный код страницы, и вы увидите много кода, но никаких данных.
Они сделали все, что могли, чтобы сделать вашу жизнь несчастной.
Цитата:
поэтому я ищу совет, как начать все правильно.

Вы всегда можете вежливо попросить их, если они хотят дать вам базу данных, но я сомневаюсь, что они это сделают.