- Вестник НГУ. Серия: Лингвистика и межкультурная коммуникация
- Архив
- 2019
- Том 17. Выпуск 1
- Прикладная и компьютерная лингвистика
Использование мер семантической близости для распознавания кореференции в русском языке
Материал поступил в редколлегию 08.09.2018
АннотацияСтатья посвящена описанию серии экспериментов по исследованию роли семантической информации в разрешении кореферентных связей для русского языка, ее использованию в системах автоматического анализа текстов и оценке результатов их работы. Целью первого этапа экспериментов было определить, какие метрики семантической близости между референциальными выражениями больше соответствуют кореферентным связям между ними. Подсчет метрик производился на материале русской Википедии и тезауруса RuThes. На втором этапе была разработана система автоматического распознавания кореферентности, использующая метрики семантической близости в качестве признаков для машинного обучения, и оценено качество ее работы. Результаты проведенных экспериментов позволяют установить метрики семантической близости, подходящие для использования в системах разрешения кореферентности, а также демонстрируют повышение качества работы подобных систем при использовании семантической информации.
Ключевые слова
автоматическая обработка естественного языка, распознавание кореферентности, метрики семантической близости, машинное обучение, русский язык
Выходные данные: Азеркович И.Л. Использование мер семантической близости для распознавания кореференции в русском языке. Вестник НГУ. Серия: Лингвистика и межкультурная коммуникация. 17, 1.