Мне нравится еще, что Вы при мне
Спокойно обнимаете другую,
Не прочите мне в адовом огне
Гореть за то, что я не Вас целую.
Эти строки, ставшие хрестоматийными благодаря культовой новогодней киноленте, — пронзительное признание Марины Цветаевой в чувствах к мужу собственной сестры. Как свидетельствует Анастасия Цветаева, между поэтессой и Маврикием Минцем действительно существовала глубокая духовная близость. Столь филигранно облечь горечь и любовь в форму отрицания под силу лишь творцу с редкой душевной организацией. Мне стало любопытно проанализировать поэтику Цветаевой методами Data Science: какие лингвистические инструменты она задействовала, чтобы передать саму суть любовного переживания?
Для работы я использовал полное собрание сочинений поэтессы (издательство «Эксмо», 2006 год), сконвертировав тексты в единый массив объемом 707 487 символов. Задача заключалась не в банальном подсчете частотности слова «любовь», а в исследовании эпитетов и лексического окружения, раскрывающих, как именно Цветаева репрезентировала это чувство.
Используя библиотеку SpaCy, я проанализировал атрибут token.children, выявляя определения вокруг ключевого понятия. После очистки от служебных частей речи и классификации морфологических зависимостей, я применил контекстное окно в 4 слова в обе стороны, чтобы точнее выделить атрибутивные конструкции.
def analyze_epithets(text):
doc = nlp(text)
results = {'adj_full': [], 'adj_short': [], 'noun': [],
'participle': [], 'other': []}
complexes = []
for token in doc:
if token.lemma_.lower() == 'любовь':
children = list(token.children)
window_start = max(0, token.i - 4)
window_end = min(len(doc), token.i + 5)
window_tokens = [doc[i] for i in range(window_start, window_end)
if i != token.i]
potential_epithets = []
Результаты исследования:
Всего обнаружено эпитетных связей: 281
Существительные: 179 (63,7%)
Полные прилагательные: 81 (28,8%)
Причастия: 10 (3,6%)
Краткие прилагательные: 8 (2,8%)
Выяснилось, что в поэтическом корпусе Цветаевой любовь чаще всего характеризуется через существительные (метафорическое отождествление), что нетипично для русской поэтической традиции, тяготеющей к описательным прилагательным. Цветаева не просто описывает чувство — она приравнивает его к иным онтологическим сущностям.
Любовь — это плоть и кровь.
Цвет, собственной кровью полит.
Вы думаете, любовь —
Беседовать через столик?
М. Цветаева “Поэма конца”, 1924 г.
Семантический разбор показал и другую особенность: наиболее частотной леммой-атрибутом стало слово «третий». Мотив «треугольника» встречается в тексте 7 раз, подчеркивая, что любовь у поэтессы никогда не является герметичным союзом двоих — в нее неизбежно вмешивается «третий»: судьба, время или сама поэзия.
Узнаю тебя, гад,
Как тебя ни зови:
В море — ткань, в горе — взгляд, —
Вечный третий в любви!М.Цветаева, «Наяда», 1928 г.
Далее я исследовал синтаксическую позицию слова «любовь». Существует гипотеза, что семантически значимые единицы стремятся к «сильным позициям» — началу или концу фразы. Мой анализ опроверг эту теорию для корпуса Цветаевой.
def analyze_position(doc, target_word='любовь'):
position_data = []
for sent in doc.sents:
love_tokens = [t for t in sent if t.lemma_.lower() == target_word]
if love_tokens:
sent_len = len(sent)
for token in love_tokens:
token_idx = token.i - sent.start
rel_pos = token_idx / sent_len if sent_len > 0 else 0
position_data.append({
'sentence_len': sent_len,
'relative_position': rel_pos
})
return pd.DataFrame(position_data)
Результаты позиционного анализа:
Всего предложений с искомым словом: 191
Средняя относительная позиция: 0,473 (где 0,0 — начало, 1,0 — конец)
Распределение:
Начало (0,0–0,2): 50 (26,2%)
Середина (0,2–0,8): 108 (56,5%)
Конец (0,8–1,0): 33 (17,3%)
Цифры подтверждают: любовь для Цветаевой — не декларативный лозунг, а органичная, сложносоставная часть поэтического высказывания.

Кроме того, средняя длина предложений со словом «любовь» составила 21 токен, тогда как средний показатель по всему корпусу — 15,3. Это доказывает, что для Цветаевой любовь — явление масштабное, требующее развернутого синтаксического пространства, а не лаконичных афоризмов.
all_sent_lengths = [len(sent) for sent in doc.sents]
avg_len_all = sum(all_sent_lengths) / len(all_sent_lengths)
sentences_with_love = [len(sent) for sent in doc.sents
if any(t.lemma_.lower() == 'любовь' for t in sent)]
avg_len_love = sum(sentences_with_love) / len(sentences_with_love)

Лежат они, написанные наспех,
Тяжёлые от горечи и нег.
Между любовью и любовью распят
Мой миг, мой час, мой день, мой год, мой век.М. Цветаева, 1915 г.
Анализ подтвердил: жизнь и творчество Цветаевой были неразрывным сплетением боли и высокого чувства. Поэтесса обладала редким даром интегрировать любовь в саму структуру своего поэтического языка, избегая банальностей и до конца сохраняя верность собственной экзистенциальной правде.


