MMPSS24 в Python statsmodels - линейная регрессия OLS
У меня возникли проблемы при запуске вышеупомянутой мультилинейной регрессии с использованием статистической модели.
Ниже приводится следующая вещь:
от sklearn.импорт наборов данных load_boston
импорт панд в качестве ПД
Бостон = load_boston()
набор данных = ПД.Таблицы данных(данные=Бостон.данных, столбцы=Бостон.feature_names)
набор данных['объект'] = Бостон.цель
печати(набора данных.глава())
Теперь его попросили сделать следующие вещи:
- Из приведенных выше выходных данных вы можете увидеть различные атрибуты набора данных.
- Столбец "цель" имеет зависимые значения(цены на жилье), а остальные столбцы являются независимыми значениями, влияющими на целевые значения
- Давайте найдем связь между "ценой жилья" и "средним количеством комнат в доме", используя статистическую модель
- Присвоить переменной X значения столбца "RM"(среднее количество комнат в одном жилом помещении)
- аналогично назначьте значения столбца "цель"(цена жилья) переменной Y
- пример кода: values = data_frame['attribute_name']
- импорт statsmodel.api как sm
- инициализируйте модель OLS, передав цель(Y) и атрибут(X).Присвойте модель переменной 'statsModel'
- установите модель и назначьте ее переменной 'fittedModel, убедитесь, что вы добавили постоянный член на вход X'
- пример кода для инициализации: sm.OLS(target, attribute)
- распечатайте сводку fittedModel с помощью функции summary()
- из сводного отчета запишите значение R-squared и назначьте его переменной 'r_squared' в нижеприведенной ячейке
Может ли кто-нибудь pls помочь мне реализовать эти элементы.
Что я уже пробовал:
i) X = dataset.drop('target', axis = 1)
ii) Y = набор данных['target']
iii) X. Корр.()
iv) corr_value = <что-то>
v) импортируйте statsmodels.api как sm
Оставшееся не в состоянии сделать..