• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Методы автоматического извлечения оценочной лексики для заданной предметной области

23 мая на семинаре научно-учебной группы с докладом "Методы автоматического извлечения оценочной лексики для заданной предметной области" выступил Илья Черверкин, аспирант ВМК МГУ им. Ломоносова. В выступлении были представлены результаты работы по изучению методов анализа тональности текстов.

23 мая на семинаре научно-учебной группы с докладом "Методы автоматического извлечения оценочной лексики для заданной предметной области" выступил Илья Черверкин, аспирант ВМК МГУ им. Ломоносова. В выступлении были представлены результаты работы по изучению методов анализа тональности текстов.
Интернет сегодня содержит огромное количество информации, включающей оценочный компонент. Мнения и оценки пользователей Интернета обладают огромным потенциалом и ценностью для многих заинтересованных групп, в т.ч  для производителей и продавцов различных товаров и услуг, а также для лиц, принимающих решения, в т.ч. в государственном масштабе. Однако ввиду постоянно возрастающего объема данных, ручная обработка становится чрезвычайно трудоемкой. Одним из стремительно развивающихся направлений в анализе неструктурированной информации является анализ мнений (sentiment analysis). Исследовательские интересы докладчика сосредоточены на одном из элементов анализа мнений, а именно - классификации тектов по тональности. Сегодня существует два основных подхода к решению данной задачи - агрегация оценочных выражений и формирование правил их агрегирования, а также использование единого глобального классификатора. Автор специализируется на первом подходе. В частности, целями его работы является автоматизированное построение словаря оценочных слов для заданной предметной области, выявление специфических черт оценочной лексики, построение модели оценочных слов, а также проверка переносимости модели на различные предметные области. В ходе семинара были подробно описаны задачи и промежуточные результаты, полученные в ходе достижения каждой из целей исследования. Для использования и тестирования разработанного инструментария были использованы отзывы пользователей в четырех областях, а именно отзывы о: фильмах, книгах, цифровых камерах и мобильных телефонах. Более подробно познакомиться с результатами исследования можно в презентации.