Перспективы репозиториев данных в политической науке и международных отношениях: от инструментальных решений хранения статистической информации к созданию экосистем (“Data-driven IR”)
29 января 2025 года состоялся научно-практический семинар, посвященный инновационным решениям по поддержанию и управлению репозиториями данных в области политических наук и международных отношений. Мероприятие собрало специалистов в области политических наук, международных отношений и информационных технологий.
Семинар открылся докладом Виталия Владимировича Каберника "Архитектура хранения и обработки базы данных проекта «Политический Атлас Современного Мира 2.0»". Докладчик представил обзор типичных проблем, с которыми сталкиваются исследователи при работе с данными, и предложил комплексные решения, разработанные в рамках проекта консорциума НИУ ВШЭ – МГИМО «Политический Атлас»
Центральное место в обсуждении заняли две инновационные платформы: TARDIS (Transcoding alternative R to database interconnect service/server) и «Мыслящий тростник: система семантического анализа». TARDIS обеспечивает возможности интеграции комплексной системы управления базами данных (СУБД) с инструментарием количественного анализа, что позволяет проводить разведочный дескриптивный и объяснительный анализ в едином пользовательском интерфейсе, минуя этапы предварительной подготовки статистических данных и написания программного кода статистической модели. "Мыслящий тростник" дополняет TARDIS возможностями семантического анализа и генерации текстов. Участники семинара ознакомились с примерами генерации аналитических справок и описательных текстов на основе статистических данных. Система способна работать с локальной языковой моделью, но требует значительных вычислительных ресурсов для обучения.
В заключительной части семинара Артем Михайлович Мальцев представил доклад "Перспективы академических репозиториев баз данных: state-of-the-art", в котором были проанализированы текущие мировые тенденции в области хранения и обработки научных данных.
Семинар завершился общей дискуссией в ходе, которого участники обсудили актуальные потребности отечественного научного сообщества в области работы с данными, возможности интеграции представленных систем с геоинформационными платформами, возможности создания полноценной альтернативы зарубежным репозиториям данных, таким как Harvard Dataverse. Участники семинара отметили высокий потенциал представленных разработок и необходимость их дальнейшего развития для создания полноценной отечественной инфраструктуры научных данных в области социальных наук.