• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Научно-учебная группа «Randan – группа анализа социологических данных»

Публикации
Статья
Поиск многомерной связи категориальных признаков: сравнение CHAID, логлинейного анализа и множественного анализа соответствий

Жучкова С. В., Ротмистров А. Н.

Мониторинг общественного мнения: Экономические и социальные перемены. 2019. № 2. С. 32-53.

Мы занимаемся обоснованием и демонстрацией преимуществ методов поиска взаимодействий в социологии. Взаимодействие — это сочетание значений признаков, детерминирующих интересующее социолога явление. Несмотря на существование специальных методов поиска взаимодействий, большинство социологов-практиков редко к ним прибегает, упрощая таким образом представления о социальной реальности в своих моделях.

Использование классических моделей, ориентированных на линейную связь и не учитывающих взаимодействия, ведёт к потере большой доли информации о сложных и комплексных социальных явлениях — полученные результаты интерпретируются некорректно, а выводы, не лежащие на поверхности, и вовсе остаются вне поля зрения исследователей.

В рамках вторичного анализа данных мы рассматриваем и комплексно характеризуем познавательные объяснительные и прогностические возможности двух широких классов методов, позволяющих обнаруживать взаимодействия: логарифмически линейных моделей и моделей деревьев решений — они универсальны, просты и доступны.

Предлагаемые нами методы подходят для более глубокого анализа номинальных и порядковых переменных, столь распространённых в социальных науках, и для построения высокоточных объяснительных и прогностических моделей, т.е. таких, точность которых сможет превзойти точность «метода подбрасывания монетки», точность модального прогноза и т.п., а потому, мы надеемся, заинтересуют специалистов в области социальных наук и смежных дисциплин.

На семинаре научного коллектива прошёл мастер-класс по работе в пакете plotly в среде Python

Участник научного коллектива Бойченко Антон провёл мастер-класс по работе с интерактивными графиками в модуле plotly express.

Нужна ли лемматизация перед text mining англоязычных текстов?

На семинаре научного коллектива прошло обсуждение необходимости лемматизации исходного текста перед применением тематического моделирования.

Русский рэп через тематическое моделирование. О чем читает русскоговорящая хип-хоп сцена?

Антон Бойченко и Светлана Жучкова поделились результатами своего исследования с интернет-изданием «Системный Блокъ».

Прогноз частичных неответов с помощью наивного байесовского классификатора и логистической регрессии: сравнение результатов

В рамках дистанционного семинара аспирантка НИУ ВШЭ Александрова Марина рассказала о применении машинного обучения к прогнозированию неответов (пропусков) на данных исследований ESS.