Анализ любовной лирики Марины Цветаевой методами Python

Мне нравится еще, что Вы при мне
Спокойно обнимаете другую,
Не прочите мне в адовом огне
Гореть за то, что я не Вас целую.

Эти строки, ставшие хрестоматийными благодаря культовой новогодней киноленте, — пронзительное признание Марины Цветаевой в чувствах к мужу собственной сестры. Как свидетельствует Анастасия Цветаева, между поэтессой и Маврикием Минцем действительно существовала глубокая духовная близость. Столь филигранно облечь горечь и любовь в форму отрицания под силу лишь творцу с редкой душевной организацией. Мне стало любопытно проанализировать поэтику Цветаевой методами Data Science: какие лингвистические инструменты она задействовала, чтобы передать саму суть любовного переживания?

Для работы я использовал полное собрание сочинений поэтессы (издательство «Эксмо», 2006 год), сконвертировав тексты в единый массив объемом 707 487 символов. Задача заключалась не в банальном подсчете частотности слова «любовь», а в исследовании эпитетов и лексического окружения, раскрывающих, как именно Цветаева репрезентировала это чувство.

Используя библиотеку SpaCy, я проанализировал атрибут token.children, выявляя определения вокруг ключевого понятия. После очистки от служебных частей речи и классификации морфологических зависимостей, я применил контекстное окно в 4 слова в обе стороны, чтобы точнее выделить атрибутивные конструкции.

def analyze_epithets(text):
    doc = nlp(text)
    results = {'adj_full': [], 'adj_short': [], 'noun': [], 
               'participle': [], 'other': []}
    complexes = []
    
    for token in doc:
        if token.lemma_.lower() == 'любовь':
           children = list(token.children)
           window_start = max(0, token.i - 4)
           window_end = min(len(doc), token.i + 5)
           window_tokens = [doc[i] for i in range(window_start, window_end) 
                           if i != token.i]
           potential_epithets = []

Результаты исследования:

Всего обнаружено эпитетных связей: 281

Существительные: 179 (63,7%)

Полные прилагательные: 81 (28,8%)

Причастия: 10 (3,6%)

Краткие прилагательные: 8 (2,8%)

Выяснилось, что в поэтическом корпусе Цветаевой любовь чаще всего характеризуется через существительные (метафорическое отождествление), что нетипично для русской поэтической традиции, тяготеющей к описательным прилагательным. Цветаева не просто описывает чувство — она приравнивает его к иным онтологическим сущностям.

Любовь — это плоть и кровь.

Цвет, собственной кровью полит.

Вы думаете, любовь —

Беседовать через столик?

М. Цветаева “Поэма конца”, 1924 г.

Семантический разбор показал и другую особенность: наиболее частотной леммой-атрибутом стало слово «третий». Мотив «треугольника» встречается в тексте 7 раз, подчеркивая, что любовь у поэтессы никогда не является герметичным союзом двоих — в нее неизбежно вмешивается «третий»: судьба, время или сама поэзия.

Узнаю тебя, гад,
Как тебя ни зови:
В море — ткань, в горе — взгляд, —
Вечный третий в любви!

М.Цветаева, «Наяда», 1928 г.

Далее я исследовал синтаксическую позицию слова «любовь». Существует гипотеза, что семантически значимые единицы стремятся к «сильным позициям» — началу или концу фразы. Мой анализ опроверг эту теорию для корпуса Цветаевой.

def analyze_position(doc, target_word='любовь'):
    position_data = []
    
    for sent in doc.sents:
        love_tokens = [t for t in sent if t.lemma_.lower() == target_word]
        
        if love_tokens:
            sent_len = len(sent)
            for token in love_tokens:
                token_idx = token.i - sent.start
                rel_pos = token_idx / sent_len if sent_len > 0 else 0
                
                position_data.append({
                    'sentence_len': sent_len,
                    'relative_position': rel_pos
                })
    
    return pd.DataFrame(position_data)

Результаты позиционного анализа:

Всего предложений с искомым словом: 191

Средняя относительная позиция: 0,473 (где 0,0 — начало, 1,0 — конец)

Распределение:

Начало (0,0–0,2): 50 (26,2%)

Середина (0,2–0,8): 108 (56,5%)

Конец (0,8–1,0): 33 (17,3%)

Цифры подтверждают: любовь для Цветаевой — не декларативный лозунг, а органичная, сложносоставная часть поэтического высказывания.

Позиция слова "любовь" в предложении у Цветаевой
Позиция слова «любовь» в предложении у Цветаевой

Кроме того, средняя длина предложений со словом «любовь» составила 21 токен, тогда как средний показатель по всему корпусу — 15,3. Это доказывает, что для Цветаевой любовь — явление масштабное, требующее развернутого синтаксического пространства, а не лаконичных афоризмов.

all_sent_lengths = [len(sent) for sent in doc.sents]
avg_len_all = sum(all_sent_lengths) / len(all_sent_lengths)

sentences_with_love = [len(sent) for sent in doc.sents 
                       if any(t.lemma_.lower() == 'любовь' for t in sent)]
avg_len_love = sum(sentences_with_love) / len(sentences_with_love)
Распределение длины предложений со словом "любовь" у Цветаевой
Распределение длины предложений со словом «любовь» у Цветаевой

Лежат они, написанные наспех,
Тяжёлые от горечи и нег.
Между любовью и любовью распят
Мой миг, мой час, мой день, мой год, мой век.

М. Цветаева, 1915 г.

Анализ подтвердил: жизнь и творчество Цветаевой были неразрывным сплетением боли и высокого чувства. Поэтесса обладала редким даром интегрировать любовь в саму структуру своего поэтического языка, избегая банальностей и до конца сохраняя верность собственной экзистенциальной правде.

 

Источник

Читайте также