• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Научно-учебная группа «Randan – группа анализа социологических данных»

Публикации
Статья
Поиск многомерной связи категориальных признаков: сравнение CHAID, логлинейного анализа и множественного анализа соответствий

Жучкова С. В., Ротмистров А. Н.

Мониторинг общественного мнения: Экономические и социальные перемены. 2019. № 2. С. 32-53.

В настоящий момент деятельность научно-учебной группы Randan посвящена трём направлениям. Мы занимаемся обоснованием и демонстрацией преимуществ использования эффектов взаимодействия в социологии, изучаем проблему пропусков в данных и пути её решения, рассматриваем возможности и ограничения использования методов интеллектуального анализа текстов в социальных науках.

Все три направления работы научного коллектива объединены одной целью – усовершенствованием методологического инструментария социального исследователя и расширением спектра исследовательских задач, к которым можно обратиться в социальных науках.

Использование эффектов взаимодействия позволяет моделировать сложные и комплексные явления, работая в том числе с номинальными и порядковыми переменными, которые столь распространены в социальных науках. 

Пропущенные значения – одна из главных проблем при работе с любыми количественными данными. Они способны значительно ухудшать качество получаемых моделей и препятствовать использованию переменных в анализе. При этом с ростом объёма данных в современных исследованиях проблема пропусков становится только острее.

Третье направление – применение методов интеллектуального анализа текстов – открывает новые возможности для социального исследователя, связанные с использованием текстовых данных, в том числе в объёмах, не подвластных для традиционного анализа. 

На семинаре научного коллектива прошёл мастер-класс по работе в пакете plotly в среде Python

Участник научного коллектива Бойченко Антон провёл мастер-класс по работе с интерактивными графиками в модуле plotly express.

Нужна ли лемматизация перед text mining англоязычных текстов?

На семинаре научного коллектива прошло обсуждение необходимости лемматизации исходного текста перед применением тематического моделирования.

Русский рэп через тематическое моделирование. О чем читает русскоговорящая хип-хоп сцена?

Антон Бойченко и Светлана Жучкова поделились результатами своего исследования с интернет-изданием «Системный Блокъ».

Прогноз частичных неответов с помощью наивного байесовского классификатора и логистической регрессии: сравнение результатов

В рамках дистанционного семинара аспирантка НИУ ВШЭ Александрова Марина рассказала о применении машинного обучения к прогнозированию неответов (пропусков) на данных исследований ESS.