Коллеги рассказали о новых результатах в исследованиях эффектов взаимодействия
Алексей Николаевич Ротмистров и Светлана Жучкова представили свой доклад о роли эффектов взаимодействия в устранении смещения регрессионных коэффициентов. Исследование, о котором было рассказано, посвящено применению метода индикаторной переменной к категориальным данным, содержащим пропущенные значения, в сравнении с анализом полных наблюдений.
Метод индикаторной переменной предполагает создание в пару каждой исходной переменной, в которой встречаются пропуски, новой бинарной, или индикаторной, переменной, в отличие от анализа полных наблюдений, в ходе которого наблюдения с пропусками удаляются. Это позволяет анализировать все наблюдения и, гипотетически, не искажать результаты, что и было проверено в ходе исследования с помощью статистического эксперимента.
В ходе эксперимента, выполненного на основе 2000 наблюдений, выяснилось, что выбор определённых правил для внесения неслучайных пропусков в совокупности с параметрами распределения имеющихся переменных могут также определять результаты применения выбранных методов обработки пропусков. Так, например, при выборе другого правила для внесения неслучайных пропусков в эксперименте была обнаружена следующая закономерность: если пропуски вносятся в те категории переменной, среднее значение зависимой переменной в которых по своему знаку отличается от среднего по прочим категориям, то это приводит к значимому смещению коэффициента при континуальном предикторе. Однако если в модели присутствуют эффекты взаимодействия, то никакого смещения не происходит.
Коллеги, выступавшие с докладом, задались вопросом – почему? Каким образом эффекты взаимодействия нивелируют смещения, вызванные неслучайными пропусками?
Ответы на эти вопросы можно найти в прикреплённом документе.
Жучкова_С_Ротмистров_А_смещения (DOCX, 173 Кб)
Метод индикаторной переменной предполагает создание в пару каждой исходной переменной, в которой встречаются пропуски, новой бинарной, или индикаторной, переменной, в отличие от анализа полных наблюдений, перед которым пропуски удаляются. Это позволяет анализировать все наблюдения и, гипотетически, не искажать результаты, что и было проверено в ходе исследования с помощью статистического эксперимента.