Творчество Константина Паустовского традиционно ассоциируется с виртуозным владением пейзажной лирикой. В его прозе природа предстает не просто статичным фоном, а выступает в роли полноправного и одушевленного субъекта повествования. Чтение его рассказов и повестей неизменно транслирует читателю эстетическое удовольствие и чувство душевного подъема. Мне стало любопытно исследовать, с помощью каких именно лексических инструментов писатель достигает такого глубокого эмоционального воздействия.
Для анализа я использовал полное собрание сочинений Паустовского, выпущенное издательством «Художественная литература» в 1981 году. Все тексты девяти томов были конвертированы в формат .txt и консолидированы в единый массив данных при помощи Python. Чтобы обеспечить чистоту лингвистического эксперимента, я исключил восьмой и девятый тома, где собраны письма и драматургические произведения.
В центре моего исследования оказалось то, как автор оперирует определенными природными категориями. Я решил детально изучить использование слова «облака» как одного из фундаментальных элементов пейзажа. Целью было математически подтвердить или опровергнуть гипотезу: являются ли облака у Паустовского лишь метеорологическим объектом или они наделены сложными художественными свойствами.
На подготовительном этапе корпус текстов был сегментирован на отдельные предложения. Я провел процедуру очистки от лишней пунктуации и установил ценз по длине — не менее 20 символов на одну синтаксическую единицу.
sentences = re.split(r'[.!?…]+', text)
sentences = [s.strip() for s in sentences if len(s.strip()) > 20]
В результате обработки массива объемом более 8,8 миллионов знаков было выделено 108 090 предложений.
Затем я инициировал поиск по ключевым леммам, чтобы отобрать все контексты, содержащие слова «облако», «небо», «туча» и их производные, и произвел их количественный подсчет.
target_keywords = ['облако', 'небо', 'туча', 'облачко', 'облака', 'небес', 'тучи']
target_forms = set(target_keywords)
morph = pymorphy3.MorphAnalyzer()
for lemma in ['облако', 'небо', 'туча']:
parsed = morph.parse(lemma)[0]
for form in parsed.lexeme:
target_forms.add(form.word.lower())
Выяснилось, что из всего корпуса лишь 2282 предложения (около 2,1%) посвящены описанию небесной сферы. Далее я классифицировал эти фрагменты, разделяя случаи использования строгой метеорологической терминологии и употребление специфических метафорических маркеров.
meteorological_terms = {
'тип_облака': ['кучевые', 'кучевое', 'кучевая', 'кучевых', 'кучевыми', 'кучевым',
'слоистые', 'слоистое', 'слоистая', 'слоистых', 'слоистыми',
'перистые', 'перистое', 'перистая', 'перистых', 'перистыми',
'перья', 'перо', 'тяжелослоистые', 'тяжелослоистое', 'тяжелослоистая'],
artistic_metaphors = {
'Реаморфизм_Города': ['города', 'город', 'средневековые', 'крепостными', 'башнями', 'соборами',
'базиликами', 'арками', 'триумфальными', 'башни', 'древними'],
'Реаморфизм_Корабли': ['армады', 'парус', 'паруса', 'корабли', 'днищами', 'ядра', 'пушек',
'несущихся', 'старинному', 'бронзовых'],
'Реаморфизм_Вата_Ткани': ['вата', 'ваты', 'ватой', 'ватные', 'рваную', 'грязную', 'жгут',
'пряди', 'пряжа', 'шелка', 'сырца', 'туманные', 'тюлевую', 'мглу',
'пух', 'наковальню'],
'Натурморфизм_Дым_Пар': ['дым', 'дыма', 'дымом', 'низкому', 'загадочен', 'тонкий',
'курились', 'дымились', 'пар', 'бриллиантовый']
Полученное распределение наглядно подтверждает тезис о восприятии природы как активного персонажа, а не статичного ландшафта.
Итоги классификации (2282 предложения):
Распределение по типам:
Метафорические — 1096 (48.0%)
Нейтральные — 963 (42.2%)
Смешанные — 156 (6.8%)
Метеорологические — 67 (2.9%)
Общий объем проанализированных дескрипций: 2282
Строго научные описания: 67 (2.9%)
Чистые художественные метафоры: 1096 (48.0%)
Симбиотические описания: 156 (6.8%)
Контексты без явных маркеров: 963 (42.2%)

Как внимательный читатель, я замечал, что Паустовский часто синтезирует образы природы с упоминанием живописцев и техник изобразительного искусства. Я решил исследовать феномен интермедиальности в его прозе. Мною был составлен глоссарий, включающий фамилии знаменитых художников, названия полотен, терминологию («мольберт», «пейзаж», «кисть»), а также колоративную лексику и глаголы световых эффектов («мерцать», «вспыхивать»).
Статистические параметры выборки:
Обработано знаков: 8 867 522
Общее количество предложений: 108 090
Всего абзацев: 44 549
Упоминания художников: 2017
Упоминания картин: 770
Термины живописи: 11 299
Глаголы светового спектра: 1263
Предложения «небо/облака»: 2282
Контексты, объединяющие облака и живопись: 688
Корреляция: 30.1%
Анализ абзацев С упоминанием облаков:
Глаголы света: 0.43 на 1000 знаков
Прилагательные цвета: 1.10 на 1000 знаков
Искусствоведческие термины: 1.85 на 1000 знаков
Суммарная визуальная плотность: 3.38
Анализ абзацев БЕЗ упоминания облаков:
Глаголы света: 0.14 на 1000 знаков
Прилагательные цвета: 0.42 на 1000 знаков
Искусствоведческие термины: 1.19 на 1000 знаков
Суммарная визуальная плотность: 1.74
СРАВНИТЕЛЬНЫЙ ПОКАЗАТЕЛЬ (дифференциация):
Глаголы света: +0.29
Прилагательные цвета: +0.67
Терминологический аппарат: +0.67
Итоговый индекс визуальности: +1.63

Любопытно, что алгоритм вывел на первое место Сальвадора Дали. Вероятно, это статистическая погрешность, вызванная частым употреблением слова «дали» в значении пространственной протяженности пейзажа. Однако позиции Эдуарда Мане, Исаака Левитана и Ореста Кипренского не вызывают сомнений. Столь высокая концентрация отсылок к мастерам кисти подчеркивает исключительную художественную эрудицию Паустовского.
Данные показывают, что 30,1% описаний облаков содержат маркеры живописи. В литературоведении это называется интермедиальностью — структурным взаимодействием языков разных видов искусств в рамках одного произведения. Около 10% всех предложений в корпусе включают искусствоведческие термины (всего 11 299 случаев). Это служит количественным доказательством того, что Паустовского справедливо именуют «художником слова».
Чтобы понять природу того светлого чувства, которое оставляет проза автора, я провел сентимент-анализ концепта «облако». Используя модель rubert-base-cased-sentiment, я сформировал словари позитивных («безмятежность», «чистота», «покой») и негативных сем («тревога», «угроза», «мрачный»).
sentiment_results = []
for sentence in target_sentences:
sentiment = analyze_sentiment_lexicon(sentence)
sentiment_results.append({
'sentence': sentence[:200],
'sentiment': sentiment
})
all_sentiments = [r['sentiment'] for r in sentiment_results]
Результаты распределились следующим образом:
Общее количество проанализированных контекстов: 2282
Эмоциональная палитра:
Позитивная (Positive) — 124 (5.4%)
Негативная (Negative) — 67 (2.9%)
Нейтральная (Neutral) — 2087 (91.5%)
Смешанная (Mixed) — 4 (0.2%)

Стоит отметить наличие негативных коннотаций, которые преимущественно встречаются в военной прозе. Хотя Паустовский не был комбатантом, его опыт работы фронтовым корреспондентом ТАСС в 1941 году наложил отпечаток на стиль: «обугленные ракиты протягивали к дождливому небу черные исполинские руки». Тем не менее, общая тенденция очевидна: позитивный настрой превалирует над негативным почти вдвое.
Для Паустовского облака — это неисчерпаемый ресурс творческой рефлексии. Мой анализ подтверждает, что автор обращается к пейзажу не ради декоративного заполнения пауз, а для трансляции настроения, глубокого символизма и интермедиальных аллюзий. Профессиональный лексикон живописи — органичная часть его авторского стиля. Паустовский не просто описывает облака, он «пишет» их словами, используя весь арсенал живописных средств. В вопросах эмоциональной окраски преобладает нейтрально-натуралистичный тон, где писатель выступает в роли чуткого наблюдателя, фиксирующего красоту мира во всем ее многообразии.


