Создание самообучающегося словаря настроений
Привет любителям питона,
Я планирую создать самообучающийся словарь сентиментального слова с их меткой сентимента.
Я могу идентифицировать слова настроения с помощью тегов POS, но не могу обозначить эти слова как положительные, отрицательные или нейтральные.
Например: "еда не была хорошей" - это предложение, и я извлек "нехорошо" из предложения как слово настроения, используя тег POS. Теперь я хочу обозначить это как отрицательное и добавить его в свой новый словарь для дальнейшего использования.
я предпочитаю делать этот проект/задачу, не используя какой-либо заранее определенный словарь/банк слов/любой заранее определенный пакет анализа настроений.
Я ищу ваши взгляды, чтобы знать, как обозначить его без использования какого-либо предопределенного словаря или с предопределенным словарем
Что я уже пробовал:
В настоящее время я изучил встраивание слов, пропустив для этого n-граммовую модель. Я также использовал заранее определенный словарь для обучения модели с помощью некоторой контролируемой модели обучения, такой как Xgboost, KNN, наивный байесовский классификатор. Я использовал некоторую неконтролируемую модель, такую как k-mean, чтобы предсказать метку с помощью слов.
Все еще не в состоянии получить результаты.
Если вы знаете какой-либо другой способ или какой-то вход для применения с любой из вышеперечисленных моделей, чтобы обозначить слово как положительное, отрицательное или нейтральное, то, пожалуйста, предложите.
Заранее благодарю вас за ваше время и вклад...