ПРАВОВОЕ УВЕДОМЛЕНИЕ. Настоящее исследование носит академический характер и не содержит пропаганды или положительной оценки деятельности лиц с особыми правовыми статусами. Ряд упоминаемых артистов включён в реестр иностранных агентов Министерства юстиции РФ (ФЗ-255 от 14.07.2022) либо связан с организациями, признанными экстремистскими (ФЗ-114 от 25.07.2002). Все такие упоминания сопровождаются указанием статуса. Цель работы — изучение лингвистических характеристик текстов методами машинного обучения.
ИССЛЕДОВАНИЕ / ТЕКСТОВЫЙ АНАЛИЗ / 2026

21 российских музыкантов уехали в 2022 году. Мы посмотрели, что изменилось в их текстах.

0
АРТИСТ
0
ТРЕКОВ
2022–2026
ПЕРИОД

Пятая волна

В феврале 2022 года из России начали уезжать музыканты. Не гастрольным туром. Насовсем.

Некоторые уехали без объяснений. Другие высказались прямо. Несколько месяцев спустя большинство из них оказались в реестре иностранных агентов Минюста.

Угадывать по интервью неудобно. Мы посчитали.

50артистов в выборке
29с данными на Genius (не менее 10 треков в каждом периоде)
21прошли в итоговый анализ: сбалансированная выборка

N = min(треков «до», треков «после») самых новых по дате выпуска. Иначе «до» охватывало бы 15 лет карьеры, а «после» только три.

Данные: только тексты с Genius, которые сами артисты или фанаты туда загрузили. Не все треки представлены, не все с точными датами. Это не полная дискография — архив того, что попало в публичный доступ.

Методы

Три инструмента. Читать необязательно: данные работают без этого. Но если интересно, как именно мы считали:

Компьютер идёт по тексту слово за словом и сверяется со списком: это слово обычно звучит позитивно или негативно?

«Любовь»: плюс, «война»: минус, «дождь»: ноль. Итог: индекс от −1 до +1. У рэпа и рока он почти всегда немного ниже нуля. Это жанровая норма, не тревожный сигнал.

Слабое место: «Не рад, что ты ушёл» для словаря читается как плюс, потому что «рад» в списке позитивных. Отрицание он не видит.

(1 − 1) / 2 = +0,000

Попробуйте изменить знак любого слова. Индекс пересчитается.

Алгоритм сам находит «кучи» слов, которые часто появляются вместе, без заданных нами категорий «протест» или «ностальгия».

Представьте архив из тысячи писем без конвертов. В одной куче постоянно встречаются «дом», «мама», «снег»; в другой «деньги», «бит», «улица». LDA делает то же статистически.

Дом и время
дом
любовь
день
снег
Личное
хочу
тобой
свет
нужно
Деньги
кэш
бит
улица
кровь

Мы не искали «патриотизм» или «протест». Машина нашла статистические кластеры. Названия тем мы придумали сами.

Словарь не понимает контекста. Нейросеть понимает чуть лучше. Модель читает не отдельное слово, а фрагмент фразы.

ФРАЗА
«Не рад, что ты ушёл»
СЛОВАРЬ ВИДИТ
«рад» → +1 → ложный плюс
НЕЙРОСЕТЬ ВИДИТ
«не рад» → скорее негативно

Обучали модель на отзывах и постах, а не на песнях. Поэтому используем её как «второе мнение» рядом со словарём.

У Земфиры (иноагент) на Genius 199 треков до переезда и 14 после. Если сравнить всё «до» со всем «после», вы сравниваете 25 лет карьеры с двумя годами. Это не ответ на вопрос про эмиграцию.

Наше правило: берём N = min(треков до, треков после), только самые новые по дате.

До отъезда · 199 треков
После отъезда · 14 треков

Сравнение всей карьеры с тремя годами эмиграции не отвечает на вопрос про переезд.

Дело ведётся на 21 человека

ИНОСТРАННЫЙ АГЕНТ
Noize MC
Иван Алексеев
Уехал: МАР 2022
🇱🇹 Литва
Треков: 40 до / 40 после
+0,003n.s.
ИНОСТРАННЫЙ АГЕНТ
Oxxxymiron
Мирон Федоров
Уехал: ФЕВ 2022
🇬🇧 Великобритания
Треков: 38 до / 38 после
−0,004n.s.
Лу / Louna
Лусинэ Геворкян
Уехал: МАР 2022
🇮🇱 Израиль
Треков: 56 до / 56 после
+0,009n.s.
ИНОСТРАННЫЙ АГЕНТ
Монеточка
Елизавета Гырдымова
Уехал: ФЕВ 2022
🇱🇹 Литва
Треков: 30 до / 30 после
−0,004n.s.
IC3PEAK
Анастасия Креслина
Уехал: МАР 2022
🇬🇧 Великобритания
Треков: 22 до / 22 после
+0,028n.s.
ИНОСТРАННЫЙ АГЕНТ
FACE
Иван Дремин
Уехал: ЯНВ 2022
🇬🇷 Греция
Треков: 26 до / 26 после
−0,015n.s.
ИНОСТРАННЫЙ АГЕНТ
Земфира
Земфира Рамазанова
Уехал: МАР 2022
🇫🇷 Франция
Треков: 13 до / 13 после
+0,038n.s.
ИНОСТРАННЫЙ АГЕНТ
Би-2
Александр Уман
Уехал: ФЕВ 2022
🇮🇱 Израиль
Треков: 33 до / 33 после
+0,010n.s.
Арсений Морозов
Уехал: МАР 2022
🇬🇪 Грузия
Треков: 60 до / 60 после
+0,021*
Айгель
Айгель Гайсина
Уехал: СЕН 2022
🇹🇷 Турция
Треков: 25 до / 25 после
−0,022n.s.
ИНОСТРАННЫЙ АГЕНТ
Моргенштерн
Алишер Валеев
Уехал: НОЯ 2021
🇦🇪 ОАЭ
Треков: 43 до / 43 после
−0,003n.s.
СБПЧ
Кирилл Иванов
Уехал: МАР 2022
🇬🇪 Грузия
Треков: 27 до / 27 после
+0,005n.s.
Гречка
Анастасия Иванова
Уехал: МАР 2022
🇬🇪 Грузия
Треков: 86 до / 86 после
−0,003n.s.
ИНОСТРАННЫЙ АГЕНТ
Борис Гребенщиков
Борис Борисович Гребенщиков
Уехал: МАР 2022
🇬🇧 Великобритания
Треков: 51 до / 51 после
−0,008*
ИНОСТРАННЫЙ АГЕНТ
Максим Покровский
Уехал: МАР 2022
🇺🇸 США
Треков: 44 до / 44 после
−0,008*
Максим Леонидов
Уехал: МАЙ 2022
🇮🇱 Израиль
Треков: 64 до / 64 после
+0,008n.s.
АлоэВера
Вера Мусаелян
Уехал: МАР 2022
🇩🇪 Германия
Треков: 36 до / 36 после
+0,000n.s.
ИНОСТРАННЫЙ АГЕНТ
Вася Обломов
Василий Гончаров
Уехал: СЕН 2022
🇺🇸 США
Треков: 44 до / 44 после
+0,006n.s.
Ploho
Виктор Ужаков
Уехал: МАР 2022
🇷🇸 Сербия
Треков: 8 до / 8 после
−0,009n.s.
Kate NV
Катерина Шилоносова
Уехал: МАР 2022
🇷🇸 Сербия
Треков: 1 до / 1 после
−0,231n.s.
Ushko
Дарья Короткова
Уехал: МАР 2022
🇦🇲 Армения
Треков: 52 до / 52 после
−0,002*
+ /  — направление Δ тональности* — p < 0,05 (значимо)n.s. — не значимо

Что говорят числа

Тональность в обоих периодах «в минусе»

Тексты и до, и после отъезда слегка «в минусе».

Средний индекс тональности по корпусу: минус несколько тысячных на слово. Не признак депрессии. Рэп, рок и инди тяготеют к напряжению в текстах по умолчанию. Словарь фиксирует «война», «боль», «ненависть» чаще, чем «радость» и «счастье».

После отъезда средняя тональность почти не изменилась.

В среднем по 21 артисту сдвига нет

Статистический тест не находит значимой разницы: p = 0,53 (словарь), p = 0,76 (нейросеть). Cohen's d около нуля.

Это не значит «точно ничего не изменилось». Данных просто не хватает, чтобы утверждать обратное.

Если изменение и есть, оно меньше жанрового шума.

Но у отдельных людей разброс

Среднее по корпусу ровное. Картина по артистам нет.

У четверых из 21 словарный метод фиксирует значимый сдвиг. У четверых других то же показала нейросеть.

У Бориса Гребенщикова (иноагент) и Максима Покровского (иноагент) тональность сдвинулась к негативу. У Арсения Морозова к позитиву.

Один и тот же переезд у разных людей означал разное.

загрузка…
ЗАКЛЮЧЕНИЕ ПО ДЕЛУ / ТОНАЛЬНОСТЬ
МЕТОД
ДО
ПОСЛЕ
D
P-VALUE
Словарный список
−0,0071
−0,0053
+0,047
0,532 n.s.
Нейросеть ruBERT
−0,1547
−0,1510
+0,010
0,757 n.s.
n.s. — разница не достигает статистической значимости (p > 0,05)
d — размер эффекта; d < 0,2 считается малым
-0,02-0,010+0,01+0,02Kate NVАйгельFACE *PlohoБорис Гребенщиков *Максим Покровский *Монеточка *Oxxxymiron *ГречкаМоргенштерн *UshkoАлоэВераNoize MC *СБПЧВася Обломов *Максим ЛеонидовЛу / LounaБи-2 *Арсений МорозовIC3PEAKЗемфира *
● — без особого статуса◆ — иностранный агентКрупнее = p < 0,05

О чём стали петь иначе

Тональность почти не сдвинулась. Темы изменились.

Статистический тест на распределение доминирующих тем между «до» и «после» показывает значимое различие: p ≈ 0,008. Это устойчивее, чем разница в «настроении».

Алгоритм нашёл 10 повторяющихся словесных кластеров. Мы назвали каждый по самым характерным словам, насколько это возможно при таком жанровом разнообразии.

Что изменилось

-0,04-0,020+0,02+0,04Диалог и близость+4,1%Улица и политика+2,2%Любовь и желание+1,7%Семья и люди+0,3%Мир и конец+0,3%Повседневность-0,0%Рэп-стиль-1,0%Тупик-1,0%Слово и тело-2,7%Деньги и жизнь-3,7%

Доля каждой темы: среднее по всем трекам периода. Названия тем наша интерпретация топ-слов, не машинная маркировка. Наведите для деталей.

χ²-тест: p ≈ 0,008

Структура текстов

ДОПОСЛЕДиалог и близос…ПовседневностьЛюбовь и желаниеМир и конецРэп-стильТупикУлица и политикаДеньги и жизньСемья и людиСлово и тело

Доля треков, где тема была доминирующей. Наведите для выделения.

После отъезда в текстах становится меньше тем, связанных со временем и деньгами. Растут кластеры с более прямолинейными обращениями и личными историями.

Интерпретация осторожная: тематический сдвиг устойчивый, но в разных жанрах он значит разное.

Тональность по годам

График использует все треки корпуса, не только сбалансированные, чтобы показать тренд во времени. Год по дате выпуска, а не по дате переезда.

— ДО 2022— ПОСЛЕ 2022Полоска = ±1 SEM

Календарное деление (до/с 2022) используется только для визуализации тренда. Статистические тесты использовали индивидуальные даты релокации каждого артиста.

Итого

01.

Тексты российских музыкантов и до, и после 2022 года в среднем «в минусе» по тональности. Это жанровая норма, не следствие эмиграции.

02.

На сбалансированной выборке общего сдвига тональности нет. Словарный метод: p = 0,53; нейросеть: p = 0,76. Размер эффекта около нуля.

03.

У части артистов личный сдвиг есть, причём в разные стороны. Четыре из 21 показали значимое изменение по словарю, ещё четыре по нейросети. У одних к негативу, у других к позитиву.

04.

Тематический состав текстов меняется значимее, чем «настроение». χ²-тест: p ≈ 0,008. После отъезда одни словесные кластеры редеют, другие растут.

05.

Разделение на «с особым статусом» и «без» не даёт устойчивого группового различия в тональности (p > 0,7 в обеих группах). Траектории внутри групп расходятся.

06.

Переезд не сделал тексты единообразно мрачнее. По этим данным он связан скорее со сменой того, о чём пишут, чем с универсальным потемнением.

Ограничения исследования

Данные: только публичные тексты с Genius. Часть треков не загружена или загружена без дат. Это не полные дискографии.

Метод 1 не обрабатывает мат, жаргон и отрицания корректно. Метод 3 обучен на отзывах, не на художественных текстах. Оба приближения.

Размер корпуса небольшой: 21 артист, ~1 600 треков. Статистические выводы работают для этой выборки, а не для «всей российской музыки».

Имена артистов с официальным статусом «иностранный агент» употребляются в исследовательских целях с указанием их правового статуса в соответствии с законодательством Российской Федерации. Работа носит академический и информационный характер.


Методология подробно: METHODOLOGY_LEXICAL.md / METHODOLOGY_TOPIC_MODELING.md / METHODOLOGY_TRANSFORMERS.md

Данные и код: github.com/SlartyG/A-Study-of-Music-in-Exile

Автор: Веселов Александр