Python раскрывает тайну Паустовского: зачем писателю были нужны облака?

Творчество Константина Паустовского традиционно ассоциируется с виртуозным владением пейзажной лирикой. В его прозе природа предстает не просто статичным фоном, а выступает в роли полноправного и одушевленного субъекта повествования. Чтение его рассказов и повестей неизменно транслирует читателю эстетическое удовольствие и чувство душевного подъема. Мне стало любопытно исследовать, с помощью каких именно лексических инструментов писатель достигает такого глубокого эмоционального воздействия.

Для анализа я использовал полное собрание сочинений Паустовского, выпущенное издательством «Художественная литература» в 1981 году. Все тексты девяти томов были конвертированы в формат .txt и консолидированы в единый массив данных при помощи Python. Чтобы обеспечить чистоту лингвистического эксперимента, я исключил восьмой и девятый тома, где собраны письма и драматургические произведения.

В центре моего исследования оказалось то, как автор оперирует определенными природными категориями. Я решил детально изучить использование слова «облака» как одного из фундаментальных элементов пейзажа. Целью было математически подтвердить или опровергнуть гипотезу: являются ли облака у Паустовского лишь метеорологическим объектом или они наделены сложными художественными свойствами.

На подготовительном этапе корпус текстов был сегментирован на отдельные предложения. Я провел процедуру очистки от лишней пунктуации и установил ценз по длине — не менее 20 символов на одну синтаксическую единицу.

sentences = re.split(r'[.!?…]+', text)
sentences = [s.strip() for s in sentences if len(s.strip()) > 20]

В результате обработки массива объемом более 8,8 миллионов знаков было выделено 108 090 предложений.

Затем я инициировал поиск по ключевым леммам, чтобы отобрать все контексты, содержащие слова «облако», «небо», «туча» и их производные, и произвел их количественный подсчет.

target_keywords = ['облако', 'небо', 'туча', 'облачко', 'облака', 'небес', 'тучи']
target_forms = set(target_keywords)
morph = pymorphy3.MorphAnalyzer()
for lemma in ['облако', 'небо', 'туча']:
    parsed = morph.parse(lemma)[0]
    for form in parsed.lexeme:
        target_forms.add(form.word.lower())

Выяснилось, что из всего корпуса лишь 2282 предложения (около 2,1%) посвящены описанию небесной сферы. Далее я классифицировал эти фрагменты, разделяя случаи использования строгой метеорологической терминологии и употребление специфических метафорических маркеров.

meteorological_terms = {
    'тип_облака': ['кучевые', 'кучевое', 'кучевая', 'кучевых', 'кучевыми', 'кучевым',
                   'слоистые', 'слоистое', 'слоистая', 'слоистых', 'слоистыми',
                   'перистые', 'перистое', 'перистая', 'перистых', 'перистыми',
                   'перья', 'перо', 'тяжелослоистые', 'тяжелослоистое', 'тяжелослоистая'],
artistic_metaphors = {
    'Реаморфизм_Города': ['города', 'город', 'средневековые', 'крепостными', 'башнями', 'соборами',
                          'базиликами', 'арками', 'триумфальными', 'башни', 'древними'],
    'Реаморфизм_Корабли': ['армады', 'парус', 'паруса', 'корабли', 'днищами', 'ядра', 'пушек',
                           'несущихся', 'старинному', 'бронзовых'],
    'Реаморфизм_Вата_Ткани': ['вата', 'ваты', 'ватой', 'ватные', 'рваную', 'грязную', 'жгут',
                              'пряди', 'пряжа', 'шелка', 'сырца', 'туманные', 'тюлевую', 'мглу',
                              'пух', 'наковальню'],
    'Натурморфизм_Дым_Пар': ['дым', 'дыма', 'дымом', 'низкому', 'загадочен', 'тонкий',
                             'курились', 'дымились', 'пар', 'бриллиантовый']

Полученное распределение наглядно подтверждает тезис о восприятии природы как активного персонажа, а не статичного ландшафта.

Итоги классификации (2282 предложения):

Распределение по типам:

  Метафорические   — 1096 (48.0%)

  Нейтральные      — 963 (42.2%)

  Смешанные        — 156 (6.8%)

  Метеорологические — 67 (2.9%)

Общий объем проанализированных дескрипций: 2282

Строго научные описания: 67 (2.9%)

Чистые художественные метафоры: 1096 (48.0%)

Симбиотические описания: 156 (6.8%)

Контексты без явных маркеров: 963 (42.2%)

Плотность текста с облаками и без
Плотность упоминания облаков в массиве текстов

Как внимательный читатель, я замечал, что Паустовский часто синтезирует образы природы с упоминанием живописцев и техник изобразительного искусства. Я решил исследовать феномен интермедиальности в его прозе. Мною был составлен глоссарий, включающий фамилии знаменитых художников, названия полотен, терминологию («мольберт», «пейзаж», «кисть»), а также колоративную лексику и глаголы световых эффектов («мерцать», «вспыхивать»).

Статистические параметры выборки:

Обработано знаков: 8 867 522

Общее количество предложений: 108 090

Всего абзацев: 44 549

Упоминания художников: 2017

Упоминания картин: 770

Термины живописи: 11 299

Глаголы светового спектра: 1263

Предложения «небо/облака»: 2282

Контексты, объединяющие облака и живопись: 688

Корреляция: 30.1%

Анализ абзацев С упоминанием облаков:

  Глаголы света: 0.43 на 1000 знаков

  Прилагательные цвета: 1.10 на 1000 знаков

  Искусствоведческие термины: 1.85 на 1000 знаков

  Суммарная визуальная плотность: 3.38

Анализ абзацев БЕЗ упоминания облаков:

  Глаголы света: 0.14 на 1000 знаков

  Прилагательные цвета: 0.42 на 1000 знаков

  Искусствоведческие термины: 1.19 на 1000 знаков

  Суммарная визуальная плотность: 1.74

СРАВНИТЕЛЬНЫЙ ПОКАЗАТЕЛЬ (дифференциация):

  Глаголы света: +0.29

  Прилагательные цвета: +0.67

  Терминологический аппарат: +0.67

  Итоговый индекс визуальности: +1.63

Художники  в текстах Паустовского
Наиболее упоминаемые персоналии мира искусства

Любопытно, что алгоритм вывел на первое место Сальвадора Дали. Вероятно, это статистическая погрешность, вызванная частым употреблением слова «дали» в значении пространственной протяженности пейзажа. Однако позиции Эдуарда Мане, Исаака Левитана и Ореста Кипренского не вызывают сомнений. Столь высокая концентрация отсылок к мастерам кисти подчеркивает исключительную художественную эрудицию Паустовского.

Данные показывают, что 30,1% описаний облаков содержат маркеры живописи. В литературоведении это называется интермедиальностью — структурным взаимодействием языков разных видов искусств в рамках одного произведения. Около 10% всех предложений в корпусе включают искусствоведческие термины (всего 11 299 случаев). Это служит количественным доказательством того, что Паустовского справедливо именуют «художником слова».

Чтобы понять природу того светлого чувства, которое оставляет проза автора, я провел сентимент-анализ концепта «облако». Используя модель rubert-base-cased-sentiment, я сформировал словари позитивных («безмятежность», «чистота», «покой») и негативных сем («тревога», «угроза», «мрачный»).

sentiment_results = []
for sentence in target_sentences:
    sentiment = analyze_sentiment_lexicon(sentence)
    sentiment_results.append({
        'sentence': sentence[:200],
        'sentiment': sentiment
    })
 all_sentiments = [r['sentiment'] for r in sentiment_results]

Результаты распределились следующим образом:

Общее количество проанализированных контекстов: 2282

Эмоциональная палитра:

  Позитивная (Positive)  — 124 (5.4%)

  Негативная (Negative)  — 67 (2.9%)

  Нейтральная (Neutral)  — 2087 (91.5%)

  Смешанная (Mixed)      — 4 (0.2%)

Тональность неба и облаков
Тональность описаний небесной сферы

Стоит отметить наличие негативных коннотаций, которые преимущественно встречаются в военной прозе. Хотя Паустовский не был комбатантом, его опыт работы фронтовым корреспондентом ТАСС в 1941 году наложил отпечаток на стиль: «обугленные ракиты протягивали к дождливому небу черные исполинские руки». Тем не менее, общая тенденция очевидна: позитивный настрой превалирует над негативным почти вдвое.

Для Паустовского облака — это неисчерпаемый ресурс творческой рефлексии. Мой анализ подтверждает, что автор обращается к пейзажу не ради декоративного заполнения пауз, а для трансляции настроения, глубокого символизма и интермедиальных аллюзий. Профессиональный лексикон живописи — органичная часть его авторского стиля. Паустовский не просто описывает облака, он «пишет» их словами, используя весь арсенал живописных средств. В вопросах эмоциональной окраски преобладает нейтрально-натуралистичный тон, где писатель выступает в роли чуткого наблюдателя, фиксирующего красоту мира во всем ее многообразии.

 

Источник

Читайте также