Частотное поведение прилагательных цвета в русских поэтических текстах

Материал поступил в редколлегию 20.09.2018
Аннотация
Лингвистические корпусы и компьютерные технологии дают возможность осуществлять исследования и получать результаты на больших текстовых массивах, что прежде, до появления этих средств, было недостижимо. Настоящая статья описывает некоторые количественные данные использования прилагательных, обозначающих цвета, в русских поэтических текстах. Произведено сравнение частотности базовых прилагательных цвета (белый, черный, красный, зеленый, желтый, синий, голубой, коричневый, оранжевый, розовый, фиолетовый) в текстах четырех корпусов НКРЯ – основного, газетного, устного и поэтического. Сравнение осуществлялось двумя способами: в каждом корпусе относительные частоты (ipm) каждого из перечисленных выше прилагательных, а также определялась ipm всех прилагательных, имеющих тег «цвет» семантической разметки НКРЯ. Оба способа определения показали, что в текстах поэтического корпуса частотность прилагательных цвета значительно выше, чем в текстах трех других корпусов (основном, газетном и устном). Установлено также, что убывание значений частоты прилагательных цвета в текстах всех четырех корпусов в значительной степени коррелирует с эволюционно-исторической схемой Берлина – Кэя. Помимо этого, проведено исследование частоты встречаемости прилагательных цвета в поисковой системе государственного Эрмитажа (массив аннотаций к произведениям искусства), где нам пришлось ограничиться абсолютным числом текстов, содержащих то или иное прилагательное цвета, поскольку данная поисковая система не содержит лингвистических характеристик. Корреляция полученных данных со схемой Берлина – Кэя выражена в данном случае намного слабее, чем в корпусах НКРЯ. В статье детально описана методика извлечения прилагательных цвета из авторских подкорпусов поэтического корпуса НКРЯ и создания списков этих прилагательных средствами менеджера Sketch Engine из текстов авторов, отсутствующих в поэтическом корпусе НКРЯ. На основе анализа 180 лемм прилагательных цвета, извлеченных из текстов тридцати шести авторов, произведена категоризация прилагательных цвета. Для анализа и категоризации привлечены также и данные поисковой системы Эрмитажа. Приведены также количественные данные о представленности (репрезентации) выделенных категорий прилагательных в исследованных текстах. В ходе исследования выявлены некоторые недостатки семантической разметки в НКРЯ. Таким образом, мы выявили некоторые закономерности частотного поведения прилагательных цвета в русском языке и предложили один из возможных вариантов их классификации.

Ключевые слова
прилагательные цвета, теория базовых цветовых терминов Берлина – Кея, Национальный корпус русского языка, поэтический корпус, семантическая разметка

Выходные данные: Захаров В.П., Масевич А.Ц. Частотное поведение прилагательных цвета в русских поэтических текстах. Вестник НГУ. Серия: Лингвистика и межкультурная коммуникация. 17, 1.