• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Эксперты и представители академической науки поспорили о Больших данных

24 июня прошла встреча, посвящённая вопросу о том, что такое Большие данные (Big Data), и чем новые данные могут быть полезны для науки. Организатором встречи стал журнал Webscience.ru, и в мероприятии приняли участие Василий Гатов, Медиалаборатория РИА Новости, Иван Климов, доцент НИУ ВШЭ, Павел Лебедев, директор по исследованиям компании Wobot, Сергей Чернов, PhD, заместитель директора по данным Центра изучения интернета и общества РЭШ, Анджей Аршавский, директор Лаборатории цифрового общества, Константин Терёшин, исследователь Имхонет, магистрант МВШСЭН, Станислав Моисеев, магистрант НИУ ВШЭ, специалист ФОМ. Модераторы дискуссии - Алексей Андреев, главный редактор Websciene.ru и Полина Колозариди, аспирант НИУ ВШЭ.

24 июня прошла встреча, посвящённая вопросу о том, что такое Большие данные (Big Data), и чем новые данные могут быть полезны для науки. Организатором встречи стал журнал Webscience.ru, и в мероприятии приняли участие Василий Гатов, Медиалаборатория РИА Новости, Иван Климов, доцент НИУ ВШЭ, Павел Лебедев, директор по исследованиям компании Wobot, Сергей Чернов, PhD, заместитель директора по данным Центра изучения интернета и общества РЭШ, Анджей Аршавский, директор Лаборатории цифрового общества, Константин Терёшин, исследователь Имхонет, магистрант МВШСЭН, Станислав Моисеев, магистрант НИУ ВШЭ, специалист ФОМ. Модераторы дискуссии - Алексей Андреев, главный редактор Websciene.ru и Полина Колозариди, аспирант НИУ ВШЭ.

 

Словосочетание “Большие данные” достаточно известно и нередко возникает в связи с разговором о будущем сбора и обработки информации. Но сам термин остаётся аморфным, он несколько по-разному трактуется социологами и математиками, и уж совсем неожиданную значимость иногда приобретает в экспертной среде. Дискуссию об этом явлении начал главный редактор Webscience.ru Алексей Андреев. Он усомнился в том, что понятие “Большие данные” имеет какое-то содержание, а не оказывается на поверку маркетинговым трюком или мифом.

Сергей Чернов предложил определить, чем Большие данные отличаются от других разновидностей данных, кроме размера, превосходящего Большие базы данных, уже давно существующих и не представляющих для математиков ничего особенного. ”Раньше базами данных пользовались столько людей, а теперь неожиданно стали пользоваться на порядок больше. Теперь таблицы сами заполняются, они порядок больше, но заполняются не пойми чем. То есть, получается, что новизны нет”.

Существует другая точка зрения, в частности, Анджей Аршавский объяснил, что “классическое определение, которое принято большинством людей в этой отрасли на данный момент, включает три V: Volume, Velocity, Variety (объём, скорость, разнообразие данных).” Таким образом, для математиков Большие данные действительно связаны именно с размером таблиц и параметрами их заполнения. Это, однако, не может объяснить ажиотажа, который возникает в экспертной среде вокруг темы Больших данных.

Есть версия, что главное - это политическое значение, и Большие данные важнее сегодня как тема, существующая на границе научного и экспертного полей. При этом сами исследовательские вопросы к новым данным пока не очень развиты, а по мнению Полины Колозариди и вовсе “застряли на уровне XVII века в постановке вопроса”, поскольку научный интерес пока не так развит, как общественно-политический.

Василий Гатов предположил, что изменилась сама последовательность работы с исследованием: “Традиционная наука базируется на изучении случившегося. А большие данные позволяют на математическом основании строить проекцию, в силу того, что анализируют огромные массивы имевших место фактов, интераций, связей и так далее”. Такие материалы могут быть интересны уже не только для учёных, но и для журналистов, политиков, экономистов и просто интересующихся людей.

Но почему для академического мира новые типы данных могут представлять интерес? Доцент НИУ ВШЭ Иван Климов рассказал, что для социологов они могут быть полезны по двум причинам. “[Первая]. Исследователи к порождению этих данных не имеет отношения. То есть, я не задаю вопрос человеку, и он мне не отвечает. Вот, я у тебя спрашиваю: какой ваш пол? Он смотрит мне в глаза и говорит: паркетный. Я обязан, значит, записать: мужчина, женщина, другое, не удалось…

Второе основание, что количество признаков, которые я могу потом анализировать, не зависит от моего исследовательского запроса”. При этом Иван Климов объяснил, что есть и немало проблем, в частности, вопрос о валидности данных, полученных с помощью разных технологий и методологические сложности, которые возникают из-за разницы между языками науки о данных и гуманитарными дисциплинами.

Но наука отчасти отвечает и на внешний запрос: данные накапливаются, и они пригодны для анализа. Поэтому практики, в частности, Павел Лебедев считает, что использовать новые типы данных сегодня - это примерно то же самое, что пользоваться калькулятором, полвека назад, и обсуждение таких вопросов очень отстаёт от прикладной деятельности.

Станислав Моисеев отметил, что именно в теме Больших данных возникает поле для сотрудничества между разными сферами науки, представителями бизнеса и государства. Судя по прошедшему Круглому столу и подобным мероприятиям, вопрос действительно вызывает интерес у разных групп людей, но сами по себе данные, большие и малые, концептуализируются по-разному. Поэтому для постановки вопросов полезно объединение разных научных полей и участие внешних экспертов, а ответы и определения в каждой сфере возникают уже самостоятельно.

Подробнее о дискуссии