Здравствуйте, я пытаюсь получить доступ к определенному узлу из XML-файла в R.
Вот пример xml-страницы, к которой я обращаюсь и анализирую с помощью XML-пакета в R.
Я заинтересован в доступе к следующей информации.
&ЛТ;комментарий=""функции> и <комментарий="расположение субклеточном"&ГТ;,
Вот код, который я запускаю, но он извлекает первый узел комментария независимо от его атрибутов или типа (функция или субклеточное местоположение ). Как я могу конкретно извлечь функцию и субклеточную локализацию. Далее, Что делать, если в одном XML-файле есть несколько атрибутов функции. Как я могу указать номер (порядок) в них появляется.
Что я уже пробовал:
web <-"http://www.uniprot.org/uniprot/Q13651.xml" html <- getURL(web, followlocation = TRUE) doc = xmlInternalTreeParse(html,asText=T, useInternal = TRUE) top = xmlRoot(doc, skip = F) xmlSApply(top[[1]][["comment"]], xmlValue) text "Receptor for IL10; binds IL10 with a high affinity."