Светлана Жучкова выступила с докладом о воможностях дискретизации для получения эффектов взаимодействия
Светлана Жучкова выступила с докладом на тему: "Сравнение методов дискретизации интервальных переменных для получения эффектов взаимодействия"
На регулярном семинаре НУГ, прошедшим 30-ого октября, Светлана Жучкова представила лаконичное продолжение развиваемой НУГом темы: исследование данных о российском кинематографе на примере Кинопоиска. Светлана задалась вопросом о дискретизации изначально интервальной переменной — года выпуска ленты, который предполагалось включить модель в качестве одного из предикторов (и, что наиболее важно, для включения переменной в расчёт эффектов). Рассматривалось и сравнилось два способа дискретизации: классический, помощью деления на корень из N, и с помощью алгоритма CHAID. Модели показали себя сравнительно одинаково: с R2 = 0,599 и R2 = 0,600, соответственно. Чтобы стабилизировать результаты, Светлана сравнила результаты Bootstrap-инга двух моделей: первая показала себя как более стабильная с точки зрения небольшого диапазона разброса значений скорректированного R2 для модели, но несколького меньшего среднего значения скорректированного коэффициента детерминации; с другой стороны, дискретизация путём метода CHAID демонстрирует меньшую стабильность, но несколько более высокие значения скорректированного R2.
Света получила много вопросов и ответила на них, состоялась насыщенная предметная дискуссия. Надеемся, что исследования, начатые в рамках Научно-учебной группы, получат достойное продолжение!
Расширенные тезисы выступления Светланы прикрепляем к новости.
Жучкова (PDF, 193 Кб)