Ответов: 1
Автор Jackie Lloyd
Не мог бы кто-нибудь помочь мне с этим запросом :).
Мы используем Impala для запроса данных, а Sentry-для ограничения доступа к данным на уровне столбцов.
Мы используем Spark для написания кода для запроса данных, хранящихся в файлах. Насколько я понимаю, роли Sentry не могут контролироват...
Читать ответы
Ответов: 1
Автор LearningSpark
Всем Привет,
Я новичок в мире больших данных.нужна помощь УРА, чтобы сделать его реальным.вот мой вопрос
Я читаю данные из txt-файла(1,2,3,4,4,4,4)
var file=sc.textFile("file:///home/cloudera/MyData/Lab1/numbers.txt")
var number=файл.flatMap(line=>line.split(","))
var intNumbers=number.m...
Читать ответы
Ответов: 1
Автор Fares hussein
Hi i have a DataSet of Track.class i want to merge all tracks that are within same interval of time for example 5 min .i.e any tracks start after a track that ends within 5 min before will be the same track.its look like fusion task.
my input :
+----------+--------------------------------...
Читать ответы
Ответов: 1
Автор Member 13760762
Я хочу сохранить данные в формате libsvm с помощью python. Поэтому я решил использовать pyspark, чтобы закончить эту задачу. Но данные, которые я сохранил, были не в формате libsvm. Вот мой код.from pyspark.mllib.util import MLUtils
from pyspark.mllib.regression import LabeledPoint
d = c.ma...
Читать ответы
Ответов: 1
Автор Smartguy3k
Привет,
Я пытаюсь запустить несколько команд spark с помощью SparkR (из локального R-GUI). Для настройки кластера spark на EC2 я использовал большинство команд из ( https://edgarsdatalab.com/2016/08/25/setup-a-spark-2-0-cluster-r-on-aws/) с небольшими изменениями для установки последних вер...
Читать ответы
Ответов: 1
Автор Emmanuel Portelli
Я пытаюсь реализовать алгоритм FPGrowth с использованием MLLIB Spark, но не знаю, как действовать дальше. Я видел несколько примеров, но не включаю перекрестную проверку, когда набор данных разделяется на обучение и тестирование. // Recommendation engine can be per league
// "Ligue 1"
// ...
Читать ответы
Ответов: 1
Автор LearningSpark
Всем Привет,
Я новичок в мире больших данных.нужна помощь УРА, чтобы сделать его реальным.вот мой вопрос
Я читаю данные из txt-файла(1,2,3,4,4,4,4)
var file=sc.textFile("file:///home/cloudera/MyData/Lab1/numbers.txt")
var number=файл.flatMap(line=>line.split(","))
var intNumbers=number.m...
Читать ответы
Ответов: 1
Автор Fares hussein
Hi i have a DataSet of Track.class i want to merge all tracks that are within same interval of time for example 5 min .i.e any tracks start after a track that ends within 5 min before will be the same track.its look like fusion task.
my input :
+----------+--------------------------------...
Читать ответы
Ответов: 1
Автор Member 13760762
Я хочу сохранить данные в формате libsvm с помощью python. Поэтому я решил использовать pyspark, чтобы закончить эту задачу. Но данные, которые я сохранил, были не в формате libsvm. Вот мой код.from pyspark.mllib.util import MLUtils
from pyspark.mllib.regression import LabeledPoint
d = c.ma...
Читать ответы
Ответов: 1
Автор Smartguy3k
Привет,
Я пытаюсь запустить несколько команд spark с помощью SparkR (из локального R-GUI). Для настройки кластера spark на EC2 я использовал большинство команд из ( https://edgarsdatalab.com/2016/08/25/setup-a-spark-2-0-cluster-r-on-aws/) с небольшими изменениями для установки последних вер...
Читать ответы
Ответов: 1
Автор Emmanuel Portelli
Я пытаюсь реализовать алгоритм FPGrowth с использованием MLLIB Spark, но не знаю, как действовать дальше. Я видел несколько примеров, но не включаю перекрестную проверку, когда набор данных разделяется на обучение и тестирование. // Recommendation engine can be per league
// "Ligue 1"
// ...
Читать ответы