Мария Родионова рассказала о перспективах анализа сетей цитирования и формального анализа текстов
В рамках семинара НУГ Мария Родионова подняла в своем докладе проблему анализа сетей цитирования и содержания классических научных текстов. Мария обратила внимание на то, что материалами для текстового анализа зачастую становятся мета-данные статей, но классические социологические тексты остаются без исследовательского внимания. В докладе была предложена модель формального текстового анализа классических текстов.
На прошедшем семинаре НУГ Мария Родионова рассказала о перспективах текстового анализа классических социологических работ.
Мария отметила, что большинство количественных исследований научного дискурса в социальных и гуманитарных дисциплинах осуществляется в рамках их самих. Подобные исследования с развитием предметной области STS, области Digital Humanities и подходящих для этого методов анализа данных вряд ли могут удивить. Наряду с этим, большинство подобных исследований так или иначе затрагивает лишь ряд возможных опций: анализ предметных областей и выявление в них теорий-драйверов, находящихся к определенному времени на фронтире всей предметной области; анализ научных журналов и взаимосвязей между ними, анализ взаимосвязей конкретных авторов, университетов, исследовательских центров и их влияния друг на друга посредством цитат.
Я стремлюсь показать, что исследования непосредственно текстов авторов пользуются значительно меньшей популярностью: в лучшем случае, исследователи анализируют аннотации статей или ограничиваются лишь их названиями или списками ключевых слов.
Мария же предложила обратиться к самому содержанию классических текстов и в качестве стартовых точек отобрать тексты, написанные ранее, чем развилась междисциплинарность. Целью ее исследования выступит анализ объемных текстов классической социологии и философии, а в качестве методов решения поставленных для достижения цели задач - подсчет частоты встречаемости слова в тексте и сравнение частот употребления слова, а также построение сетей ко-встречаемости слов, визуализация сетей и классификация текстов в зависимости от совпадения частного словаря текста с общим словарем социологии и философии.
Пилотным примером для формального текстового анализа стала работа Э. Дюркгейма "Разделение общественного труда". Для загрузки текста в R использовался пакет pdftools. Первая выделенная проблема состояла в высокой частотности слов, появляющихся в колонтитулах на каждой странице (слова, входящие в название работы, и названия глав). Тем не менее, в ходе анализа были получены 18 содержательных словосочетаний (состоящих из 2-ух букв) и 20 содержательных сочетаний (состоящих из 3-ех букв), наиболее часто встречающихся в тексте работы Э.Дюркгейма.
С более полным содержанием исследования можно ознакомиться в прикреплённом документе.
Родионова_М_классические_тексты (PDF, 1.07 Мб)