Участники научно-учебной группы выступили на открытом семинаре ЛЭСИ
Руководитель научно-учебной группы Алексей Ротмистров и участница НУГ Воробьева Марья выступили с докладом на семинаре лаборатории экономико-социологических исследований (ЛЭСИ).
Доклад был посвящён рефлексии об использовании веб-скрапинга в социологическом исследовании. Над данным направлением участники НУГ работают на протяжении последних нескольких месяцев: за это время им удалось провести четыре исследования с использованием веб-скрапинга, данные по которым вскоре станут основой для развития темы использования методов поиска взаимодействий на больших данных. Результаты одного из таких исследований были представлены на семинаре ЛЭСИ.
Во время доклада обсуждались возможности и ограничения веб-скрапинга, выявленные в процессе проведения исследования по поиску связей между характеристиками кинофильма и его популярностью у зрителя – этой темой занималась участница НУГ Воробьева Марья. На семинаре Маша рассказала о результатах проведенного исследования. Так, по мнению Маши, использование метода веб-скрапинга на эмпирическом примере помогло выделить следующие ранее не обозначенные в литературе ограничения: это высокая доля пропущенных значений и ограничение операционализации теоретических концептов исследования. Проблема пропущенных значений, в частности, не позволила использовать в анализе одну из собранных переменных и вынудила исследовательницу прибегнуть к методу попарного удаления наблюдений с пропусками про построении регрессионной модели. В качестве уникальных возможностей веб-скрапинга были выделены возможность собирать практически всю генеральную совокупность исследования, а также качество математических моделей, построенных на данных, которые были собраны с помощью такого метода: а построенной Машей регрессионной модели коэффициент качества R2 был равен 0.749. Другим преимуществом веб-скрапинга, как и других нереактивных методов сбора данных, выступает сбор информации в естественном виде, то есть в том, в котором эта информация была произведена изучаемыми субъектами. Важной при работе с веб-скрапингом также представляется широкая опора на теоретические концепции, которая не только помогает определить эмпирическую базу, сайт для извлечения информации, но и частично решить проблему ограниченной операционализации.
По завершении выступления руководитель НУГ Алексей Ротмистров ответил на вопросы аудитории, а также сделал выводы по работе с веб-скрапингом и дальнейшему развитию метода, подчеркнув возможность применения эффектов взаимодействия при анализе собранных данных.
Доклад был встречен с большим интересом. Обсуждение темы с коллегами из ЛЭСИ позволило выделить некоторые противоречивые моменты исследования, а также улучшить теоретическую рамку эмпирической части работы. В частности, была отмечена противоречивость постановки проблемы исследования и итоговых выводов: насколько собранные из интернета данные с большим количеством пропущенных значений лучше неоткликов респондентов в опросах? Было также отмечено, что стоит обратить внимание на возможное систематическое смещение пропущенных значений и его смысл. В связи с этим было предложено сделать проблему исследования содержательной, то есть обосновать необходимость изучения сферы кино. Для этого коллеги из ЛЭСИ порекомендовали использовать новые теоретические подходы, такие как рассмотрение рынков с неопределённостью качестве блага, теоретические подходы экономики символического обмена, а также предложили включить в модель новые переменные, которые могли бы характеризовать качество фильма и другие возможные предикторы популярности: бюджет фильма, режиссёры, актёры, феномен «word-of-mouth».