Member 13860825 Ответов: 5

Мульти-линейной регрессии в Python statsmodels - инициализации фрейма данных


У меня возникли проблемы при запуске вышеупомянутой мультилинейной регрессии с использованием статистической модели.

Ниже приводится следующая вещь:

от sklearn.импорт наборов данных load_boston
импорт панд в качестве ПД
Бостон = load_boston()
набор данных = ПД.Таблицы данных(данные=Бостон.данных, столбцы=Бостон.feature_names)
набор данных['объект'] = Бостон.цель
печати(набора данных.глава())

Теперь его попросили сделать следующие вещи:

i) создайте фрейм данных с именем " X " таким образом, чтобы он включал все столбцы объектов, и отбросьте целевой столбец.
ii) назначьте столбцы "target" переменным Y
iii) выведите корреляционную матрицу для фрейма данных X. Используйте функцию '.corr()' для вычисления корреляционной матрицы
IV) из корреляционной матрицы запишите значение корреляции между 'Крим' и 'PTRATIO' и присвоить его переменной 'corr_value'
в) импортировать модель, как и статистика см
ви) инициализировать модель МНК с целью Г и таблицы данных х(функции)
vii) установите модель и распечатайте резюме
VIII вв.) из резюме доклада отмечают, вниз r-квадрат значение и присвоить его переменной 'r_square'

Может ли кто-нибудь pls помочь мне реализовать эти элементы.

Что я уже пробовал:

i) X = dataset.drop('target', axis = 1)
ii) Y = набор данных['target']
iii) X. Корр.()
iv) corr_value = <что-то>
v) импортируйте statsmodels.api как sm
vi) не в состоянии сделать
Vii) не в состоянии сделать

5 Ответов

Рейтинг:
2

Patrice T

Итак, вы не пытаетесь решить проблему самостоятельно, у вас нет вопросов, вы просто хотите, чтобы мы сделали вашу домашнюю работу.
Домашние задания-это упрощенные версии тех задач, которые вам придется решать в реальной жизни. цель это обучение и практикующий.

Цитата:
У меня возникли проблемы при запуске вышеупомянутой мультилинейной регрессии с использованием статистической модели.

Покажите свой код и объясните проблему, чтобы получить помощь.

Мы не делаем вашу домашнюю работу.
Домашнее задание не предназначено для проверки ваших навыков просить других людей выполнять вашу работу, оно предназначено для того, чтобы заставить вас думать и помочь вашему учителю проверить ваше понимание курсов, которые вы прошли, а также проблем, которые вы испытываете при их применении.
Любая ваша неудача поможет учителю выявить ваши слабости и наметить меры по исправлению положения.
Любая ваша неудача поможет вам узнать, что работает, а что нет, это называется "методом проб и ошибок".
Так что попробуйте, перечитайте свои уроки и приступайте к работе. Если вы застряли на конкретной проблеме, покажите свой код и объясните эту точную проблему, мы можем помочь.


Member 13895806

Это мой полный код, и я не могу определить, что должно быть сделано для corr_value. На последнем шаге я получаю ошибку "TypeError: требуется аргумент float, а не DataFrame". Любая идея будет очень полезна

от sklearn.импорт наборов данных load_boston
импорт панд в качестве ПД
Бостон = load_boston()
набор данных = ПД.Таблицы данных(данные=Бостон.данных, столбцы=Бостон.feature_names)
набор данных['объект'] = Бостон.цель
печати(набора данных.глава())

X = dataset.drop('target', axis = 1 )
Y = набор данных["цель"]

#Теперь фрейм данных X имеет только те функции, которые влияют на цель
#выведите корреляционную матрицу для фрейма данных X. Используйте функцию '.corr()' для вычисления #корреляционной матрицы
#из корреляционной матрицы запишите значение корреляции между 'CRIM' и #'PTRATIO' и назначьте его переменной 'corr_value'.
corr_value = X. corr()
печати(corr_value.глава())

импортируйте statsmodels.api как sm
statsModel = sm.OLS(Y, X)
fittedModel = statsModel.fit()
печати(fittedModel.резюме())

Результаты регрессии OLS
==============================================================================
Деп. переменная: целевой R-квадрат: 0.959
Модель: OLS Adj. R-квадрат: 0.958
Метод: наименьшие квадраты F-статистика: 891.1
Дата: Пн, 02 июля 2018 Prob (F-статистика): 0.00
Время: 22:36:03 Логарифмическая Вероятность: -1523.8
Количество наблюдений: 506 AIC: 3074.
Df Остатки: 493 Бик: 3129.
Модель Df: 13
Тип ковариации: nonrobust
==============================================================================
coef std err t P>|t| [0.025 0.975]
------------------------------------------------------------------------------
Крим -0.0916 0.034 -2.675 0.008 -0.159 -0.024
ЗН 0.0487 3.379 0.014 0.001 0.020 0.077
Инд -0.0038 0.064 -0.059 0.953 -0.130 0.123
Час 2.8564 0.904 3.160 0.002 1.080 4.633
NOx в -2.8808 3.359 -0.858 0.392 -9.481 3.720
РМ 5.9252 0.309 19.168 0.000 5.318 6.533
Возраст -0.0072 0.014 -0.523 0.601 -0.034 0.020
Дис -0.9680 0.196 -4.947 0.000 -1.352 -0.584
Рад 0,1704 0,067 2,554 0,011 0,039 0,302
Налог -0.0094 0.004 -2.393 0.017 -0.017 -0.002
PTRATIO -0.3924 0.110 -3.571 0.000 -0.608 -0.177
Б 0.0150 5.561 0.003 0.000 0.010 0.020
LSTAT -0.4170 0.051 -8.214 0.000 -0.517 -0.317
==============================================================================
Омнибус: 204.050 Дурбин-Уотсон: 0.999
Prob(Omnibus): 0.000 Jarque-Bera (JB): 1372.527
Перекос: 1.609 Prob(JB): 9.11 e-299
Эксцесс: 10.399 Конд. № 8.50 е+03
==============================================================================

Предупреждения:
[1] стандартные ошибки предполагают, что ковариационная матрица ошибок задана правильно.
[2] номер условия большой, 8.5 e+03. Это может указывать на то, что существуют
сильная мультиколлинеарность или другие численные задачи.


r_squared = fittedModel.rsquared
###Конечный код(приблизительно 1 строка)
с открытым("output.txt", "w") в виде text_file:
текстовый файл.напишите("corr= %f\n"

Patrice T

Воспользуйся Улучшить вопрос чтобы обновить ваш вопрос.
Чтобы каждый мог обратить внимание на эту информацию.

Рейтинг:
2

Member 14001839

corr_value=набор['Крим'].СОГГ(набора данных['PTRATIO'])


Рейтинг:
2

Member 14061447

Заменять-
с открытым("output.txt", "w") в виде text_file:
текстовый файл.напишите("corr= %f\n

с-
с открытым("output.txt", "w") в виде text_file:
текстовый файл.напишите("corr= %s\n


Рейтинг:
1

Member 14066557

from sklearn.datasets import load_boston
import pandas as pd
boston = load_boston()
dataset = pd.DataFrame(data=boston.data, columns=boston.feature_names)
dataset['target'] = boston.target
print(dataset.head())

X = dataset.drop('target', axis = 1 )
Y = dataset["target"]

print(X.corr())
corr_value=dataset['CRIM'].corr(dataset['PTRATIO'])


import statsmodels.api as sm
X = sm.add_constant(X)
statsModel = sm.OLS(Y, X).fit()
print(statsModel.summary())

r_squared = statsModel.rsquared
###End code(approx 1 line)
with open("output.txt", "w") as text_file:
text_file.write("corr= %f\n",....


Рейтинг:
0

Member 14638582

from sklearn.datasets import load_boston
import pandas as pd
boston = load_boston()
dataset = pd.DataFrame(data=boston.data, columns=boston.feature_names)
dataset['target'] = boston.target
print(dataset.head())

###Start code here
X = dataset.drop('target',axis=1)
Y = dataset['target']
###End code(approx 2 lines)

###Start code here
print(X.corr())
                   #print correlation matrix for X
corr_value = dataset['CRIM'].corr(dataset['PTRATIO'])

###Start code here
import statsmodels.api as sm
X = sm.add_constant(X)
statsModel = sm.OLS(Y, X).fit()
print(statsModel.summary())
###End code(approx 4 lines)

###Start code here
r_squared =  statsModel.rsquared
###End code(approx 1 line)
with open("output.txt", "w") as text_file:
    text_file.write("corr= %f\n" % corr_value)
    text_file.write("rsquared= %f\n" % r_squared)


Richard Deeming

Необъяснимый дамп кода-это не решение проблемы.

И вы никому не помогаете, делая за них домашнее задание - особенно когда они должны были сдать свой ответ в прошлом году!

Dave Kreskowiak

Выполнение чьей-то домашней работы для них совсем не помогает им.