Семинар "Переменные и источники данных" для "Политического атласа современного мира 2.0"
19 апреля на ФСН в рамках совместного проекта «Политический атлас современного мира 2.0» консорциума НИУ ВШЭ и МГИМО-Университета состоялся третий научно-методологический семинар, посвященный обсуждению баз данных, используемых в проекте. В семинаре участвовали А. Мельвиль (ВШЭ), В. Каберник (МГИМО), Д. Стукал (ВШЭ), Е. Седашов (ВШЭ), М. Миронюк (ВШЭ), Д. Карасев (ИМИ МГИМО), В. Беленков (ВШЭ), А. Земцов (ВШЭ).
В своем вводном вступлении Андрей Мельвиль описал историю и логику формирования этих баз данных и их эволюцию, а также сформулировал ряд пока нерешенных теоретико-методологических и содержательных проблем, включая дилемму "усложнения" / "упрощения" используемых переменны, а также вопросы, относящиеся к некоторым режимным особенностям современных государств.
Михаил Миронюк представил информацию об основных переменных и их источниках. Были обсуждены вопросы, относящиеся к выбору и наполнению тематических блоков "Мощь и влияние", "Государство и государственность", "Угрозы", "Качество жизни" и "Режимные особенности".
Иной подход был представлен Виталием Каберником, который исходит из необходимости более радикального переосмысления подходов к использованию переменных и временных рядов в интересах описания современных государств. Такое переосмысление предполагает уточнение общей целевой рамки проекта в части задач, стоящих перед исследователями Консорциума. Решение различных поставленных задач – описательных, прогностических и др. – требует использования различных подходов, и едва ли возможно императивно установить среди них единственно верный и/или универсально применимый.
По сравнению с предшествовавшими итерациями проекта радикально изменились возможности по работе с данными. Если ранее ограничение числа переменных, используемых в описании государств и их места в мире, было обусловлено трудоемкостью сбора, верификации и обработки значительного количества данных, то сегодня мы сталкиваемся, напротив, с проблемами избыточности данными. Использование современных алгоритмов и средств автоматизации позволило сравнительно легко увеличить количество рассматриваемых переменных почти на два порядка. Если в предшествующих исследованиях оперировать приходилось 50-60 переменными, то сегодня мы уже имеем массив данных, оперирующий временными рядами, охватывающими три десятилетия, по нескольким тысячам переменных. Более того, показано, что при необходимости объем данных может быть существенно увеличен.
Первичный анализ доступного массива данных выявил многочисленные проблемы их целостности и непрерывности. Выявлены «покинутые» серии данных, нарушения временных рядов, подтасовки и неафишируемые изменения методологии подсчета с ретроактивной корректировкой архивных серий, что само по себе осложняет работу. Обозначены системные проблемы определения правопреемственности государств, изменения их статуса в рассматриваемый исторический период и т.п.
Использованный ранее подход простого «назначения» некоторого набора переменных для описания государств по различным измерениям уязвим. Обоснование выбора использованных переменных инерционно и не учитывает возможностей по работе с более широкими массивами, а также ведет к загрублению получаемых результатов. В свою очередь, это загрубление может создавать проблемы в интерпретации комплексных параметров.
В то же время, многообразие данных предоставляет возможности для формирования более точных описаний, а также создания агрегированной базы знаний, которая может быть востребована в параллельных исследованиях. Но с практической точки зрения не выявляется очевидного, интуитивно понятного метода работы с этим многообразием. Таким образом, перед командой проекта встают задачи поиска новых подходов к работе с данными, причем такая задача, вероятно, в мире решается впервые.
Дискуссии и поиск новых подходов для решения задач проекта продолжаются.
Мельвиль Андрей Юрьевич
Факультет социальных наук: Декан
Миронюк Михаил Григорьевич
Факультет социальных наук: Первый заместитель декана
Стукал Денис Константинович
Факультет социальных наук: заместитель декана