Ответы на вопросы с тегом "искра"

Ответов: 1 Автор Jackie Lloyd

Если я получаю доступ к данным через spark, могу ли я контролировать доступ к таблице базы данных на уровне столбцов с помощью impala

Не мог бы кто-нибудь помочь мне с этим запросом :). Мы используем Impala для запроса данных, а Sentry-для ограничения доступа к данным на уровне столбцов. Мы используем Spark для написания кода для запроса данных, хранящихся в файлах. Насколько я понимаю, роли Sentry не могут контролироват...

Читать ответы

Ответов: 1 Автор LearningSpark

Spark scala-подсчет четных чисел из файла

Всем Привет, Я новичок в мире больших данных.нужна помощь УРА, чтобы сделать его реальным.вот мой вопрос Я читаю данные из txt-файла(1,2,3,4,4,4,4) var file=sc.textFile("file:///home/cloudera/MyData/Lab1/numbers.txt") var number=файл.flatMap(line=>line.split(",")) var intNumbers=number.m...

Читать ответы

Ответов: 1 Автор Member 13760762

Почему вы получаете неправильный индекс при сохранении данных в формате libsvm с помощью saveaslibsvmfile

Я хочу сохранить данные в формате libsvm с помощью python. Поэтому я решил использовать pyspark, чтобы закончить эту задачу. Но данные, которые я сохранил, были не в формате libsvm. Вот мой код.from pyspark.mllib.util import MLUtils from pyspark.mllib.regression import LabeledPoint d = c.ma...

Читать ответы

Ответов: 1 Автор Smartguy3k

Выполнение команд на удаленном spark (EC2) с использованием локального интерфейса R(sparkr) зависает

Привет, Я пытаюсь запустить несколько команд spark с помощью SparkR (из локального R-GUI). Для настройки кластера spark на EC2 я использовал большинство команд из ( https://edgarsdatalab.com/2016/08/25/setup-a-spark-2-0-cluster-r-on-aws/) с небольшими изменениями для установки последних вер...

Читать ответы

Ответов: 1 Автор Emmanuel Portelli

Разделение набора данных для кросс-валидации fpgrowth в spark

Я пытаюсь реализовать алгоритм FPGrowth с использованием MLLIB Spark, но не знаю, как действовать дальше. Я видел несколько примеров, но не включаю перекрестную проверку, когда набор данных разделяется на обучение и тестирование. // Recommendation engine can be per league // "Ligue 1" // ...

Читать ответы

Ответов: 1 Автор LearningSpark

Spark scala-подсчет четных чисел из файла

Всем Привет, Я новичок в мире больших данных.нужна помощь УРА, чтобы сделать его реальным.вот мой вопрос Я читаю данные из txt-файла(1,2,3,4,4,4,4) var file=sc.textFile("file:///home/cloudera/MyData/Lab1/numbers.txt") var number=файл.flatMap(line=>line.split(",")) var intNumbers=number.m...

Читать ответы

Ответов: 1 Автор Member 13760762

Почему вы получаете неправильный индекс при сохранении данных в формате libsvm с помощью saveaslibsvmfile

Я хочу сохранить данные в формате libsvm с помощью python. Поэтому я решил использовать pyspark, чтобы закончить эту задачу. Но данные, которые я сохранил, были не в формате libsvm. Вот мой код.from pyspark.mllib.util import MLUtils from pyspark.mllib.regression import LabeledPoint d = c.ma...

Читать ответы

Ответов: 1 Автор Smartguy3k

Выполнение команд на удаленном spark (EC2) с использованием локального интерфейса R(sparkr) зависает

Привет, Я пытаюсь запустить несколько команд spark с помощью SparkR (из локального R-GUI). Для настройки кластера spark на EC2 я использовал большинство команд из ( https://edgarsdatalab.com/2016/08/25/setup-a-spark-2-0-cluster-r-on-aws/) с небольшими изменениями для установки последних вер...

Читать ответы

Ответов: 1 Автор Emmanuel Portelli

Разделение набора данных для кросс-валидации fpgrowth в spark

Я пытаюсь реализовать алгоритм FPGrowth с использованием MLLIB Spark, но не знаю, как действовать дальше. Я видел несколько примеров, но не включаю перекрестную проверку, когда набор данных разделяется на обучение и тестирование. // Recommendation engine can be per league // "Ligue 1" // ...

Читать ответы