Как один трюк 200-летней давности управляет музыкой, фотографиями и Wi-Fi

16 минут назад

Запустите свой плейлист и включите любую композицию.

Эта песня звучит в ваших наушниках благодаря одной фундаментальной идее. Той самой, за которую французского математика в 1807 году подняли на смех в Парижской академии наук. Лаплас выразил поддержку, но Лагранж был непреклонен: «Это невозможно».

Автором идеи был Жан-Батист Жозеф Фурье. Его гипотеза казалась настолько элементарной, что современники отказались в неё верить.

Сегодня эта концепция стоит за обработкой каждого снимка в вашем смартфоне. Она управляет пакетами Wi-Fi, телефонными звонками, форматами JPEG и MP3. Она лежит в основе МРТ-сканирования, команд для голосовых помощников и каждого кадра в стриминговых сервисах.

Концепция, кажущаяся подозрительно простой

Фурье постулировал следующее:

Любой сигнал — вне зависимости от его сложности — можно разложить на совокупность простых синусоид.

Мелодия скрипки, промышленный шум, голос близкого человека в трубке, радиоволна роутера или цифровой снимок кота. Что угодно.

Возьмите произвольный сигнал → разделите его на набор синусоид (каждая со своей частотой, амплитудой и фазой) → получите исчерпывающее описание. Причем этот процесс обратим и не влечет за собой потерю данных.

Произвольный сигнал = sin(f₁) × a₁ + sin(f₂) × a₂ + sin(f₃) × a₃ + ... где f — частота, a — амплитуда

В этом заключается вся суть. И именно это Лагранж счел «невозможным».

Это сопоставимо с утверждением: «Любое изысканное блюдо — от борща до тирамису — можно представить как перечень ингредиентов в строгих пропорциях». Ваш ответ был бы: «Разве это не очевидно?»

Однако в начале XIX века это было далеко не очевидно. Ведь из этой простой парадигмы вытекают следствия, которые трансформировали наш мир.

MP3: избавление от акустического балласта

1991 год, Институт интегральных схем Общества Фраунгофера. Группа инженеров ищет решение: звук CD-качества требует потока в 1,4 Мбит/с, в то время как интернет-соединение едва достигает 56 Кбит/с. Как передать аудио?

Решение подсказал Фурье.

Берем аудиосигнал → раскладываем его на спектр частот (используя FFT, быстрое преобразование Фурье) → анализируем результат → удаляем всё, что не воспринимается человеческим ухом.

# Упрощенная логика процесса:
frequencies = fft(audio_signal)
for f in frequencies:
if f.frequency > 20000:     # порог восприятия выше 20 кГц
f.amplitude = 0
if f.is_masked_by(louder_neighbor):  # эффект психоакустической маскировки
f.amplitude = 0          # тихий звук подавляется более громким соседом
if f.amplitude < threshold:  # ниже порога слышимости
f.amplitude = 0
compressed = encode(remaining_frequencies)
Сжатие с 1.4 Мбит/с до 128 Кбит/с. В 11 раз эффективнее.
При этом разница для слушателя практически неуловима.

Благодаря Жан-Батисту мы понимаем, из каких частот строится звук, а благодаря психоакустике — какие частоты мозг игнорирует. Убираем лишнее и получаем MP3.

Каждый раз, когда вы слушаете музыку, алгоритмы Фурье разбирают её на составляющие, отсекают ненужное, а плеер мгновенно восстанавливает картину. И всё это происходит за доли секунды.

JPEG: волны в мире пикселей

1992 год. Иная задача, другие специалисты, но тот же математический прием.

Цифровое фото — это двумерный сигнал. Интенсивность пикселей меняется в двух плоскостях, образуя своеобразную «волну».

Алгоритм JPEG дробит изображение на сегменты 8×8 пикселей и применяет к ним DCT (дискретное косинусное преобразование). Это близкий родственник метода Фурье, оптимизированный для работы с дискретными данными.

Блок 8×8 пикселей ↓

DCT: разложение на «визуальные гармоники» ↓ Низкие частоты = общие контуры и плавные переходы Высокие частоты = мелкая текстура, резкие грани, шум ↓ Удаление высоких частот (человеческий глаз их почти не фиксирует) ↓ Сжатый файл, объем которого в 10–20 раз меньше исходного

Характерные «квадраты» на сильно сжатых картинках — это те самые блоки 8×8, лишенные высокочастотных деталей. Вы буквально видите скелет преобразования Фурье.

Когда вы пересылаете фото в мессенджере, Фурье переводит картинку на язык частот, кодек убирает невидимое глазу, а устройство получателя собирает всё обратно.

Wi-Fi: созидательная сила Фурье

Ваш роутер прямо сейчас транслирует данные на частоте 5 ГГц. Казалось бы, один канал — одна несущая. Но через него одновременно летят запросы к поисковикам, видео из соцсетей и данные умного дома.

Как это реализовано? Посредством OFDM — мультиплексирования с ортогональным частотным разделением.

OFDM дробит поток данных на множество параллельных цепочек и кодирует каждую на собственной подчастоте. Эти сотни частот подобраны так, чтобы не создавать помех друг другу. В математике это называется ортогональностью (привет от ортогональных синусоид Фурье).

Один канал Wi-Fi шириной 80 МГц: [подч.1][подч.2][подч.3]...[подч.234] ↓ ↓ ↓ ↓ данные данные данные ... данные

Весь спектр передается ПАРАЛЛЕЛЬНО. Приемник разделяет поток с помощью... FFT.

Ваш смартфон выполняет обратное преобразование Фурье (IFFT), выделяя из сложного радиоэфира сотни чистых потоков информации. Каждый пакет данных — это триумф математики Фурье.

Современный Wi-Fi 6 задействует сложнейшие схемы модуляции, где чип миллионы раз в секунду вычисляет FFT. 4G, 5G, цифровое ТВ и спутниковая связь — весь современный телеком стоит на фундаменте идеи, которую когда-то сочли нереализуемой.

Shazam: узнавание по «отпечаткам пальцев»

Вы подносите телефон к источнику звука, и через мгновение приложение называет трек. Механизм работы прост и гениален:

1. Запись короткого фрагмента аудио
2. FFT → построение спектрограммы (визуализация частот во времени)
3. Выделение доминирующих пиков → создание уникальных «отпечатков»
4. Поиск совпадений в гигантской базе данных
5. Идентификация трека

Второй этап — это чистый Фурье. Без него невозможно получить спектрограмму и выделить уникальные маркеры мелодии. И это работает даже в шумном помещении, поскольку Фурье-анализ позволяет отделить стабильные пики музыки от хаотичного фонового шума.

МРТ: Фурье в диагностике организма

Пожалуй, это одно из самых впечатляющих применений метода.

МРТ-аппарат создает мощное магнитное поле, заставляя атомы водорода в теле резонировать. Датчики фиксируют испускаемые ими радиоволны.

Но вот в чем секрет: сканер не фотографирует ваши органы напрямую. Он собирает данные о пространственных частотах в так называемое «k-пространство». По сути, это частотный образ вашего тела.

Чтобы превратить этот массив цифр в понятный снимок мозга или позвоночника, компьютер выполняет обратное преобразование Фурье. Ваш диагноз буквально вычисляется по формуле 1807 года.

Резонанс протонов → радиосигнал → k-пространство (частотный спектр) ↓ Обратное преобразование Фурье ↓ Визуализация внутреннего органа

Без Фурье МРТ просто не существовало бы как метода. Другого способа интерпретировать эти данные нет.

Грандиозный масштаб

Задумайтесь, как часто в эту самую секунду где-то в мире выполняется алгоритм быстрого преобразования Фурье (FFT):

Музыкальный стриминг: более полумиллиарда пользователей. Каждое устройство декодирует поток через обратное FFT.
Фотография: ежедневно создается около 1,4 миллиарда снимков. Каждое сохранение в JPEG — это миллиарды операций DCT.
Связь: свыше 15 миллиардов устройств в сети. Каждое из них непрерывно модулирует и демодулирует сигналы через FFT.
Видеоконтент: каждый кадр в TikTok или на YouTube сжимается с использованием частотного разложения.

По самым скромным подсчетам, каждую секунду на планете совершаются квадриллионы (10¹⁵) преобразований Фурье.

Всё это — наследие одного человека и одной догадки двухсотлетней давности.

FFT: алгоритм, изменивший правила игры

Математически разложить сигнал — задача трудоемкая. Прямое вычисление требует колоссальных ресурсов (O(n²)). Для обработки сигнала в миллион отсчетов потребовался бы триллион операций.

Революция случилась в 1965 году, когда Кули и Тьюки представили алгоритм Fast Fourier Transform (FFT). Сложность упала до O(n log n). Для того же миллиона точек теперь нужно всего 20 миллионов операций — в 50 000 раз меньше.

FFT заслуженно считается одним из важнейших алгоритмов в истории человечества, наряду с методом Дейкстры или PageRank.

# Компактная рекурсивная реализация FFT:
import numpy as np
def fft(x):
n = len(x)
if n == 1:
return x
even = fft(x[0::2])
odd = fft(x[1::2])
T = [np.exp(-2j  np.pi  k / n) * odd[k] for k in range(n // 2)]
return [even[k] + T[k] for k in range(n // 2)] + \
[even[k] - T[k] for k in range(n // 2)]
Эти 12 строк кода запускаются квадриллионы раз в секунду.

Почему это универсально?

В чем секрет такой всеобъемлющей применимости? Почему одна формула подходит и для медицины, и для видеоигр, и для исследования космоса?

Ответ прост: сама физика нашего мира волновая. Звук — это волны давления. Свет и радио — электромагнитные колебания. Движение планет, ритм сердца, вибрации атомов — всё это периодические процессы.

Фурье открыл универсальный язык физики. Мы не «навязываем» Фурье звуку — звук уже состоит из этих гармоник. Фурье лишь дал нам «очки», позволяющие увидеть эту структуру.

Ирония истории

Лагранж, заблокировавший публикацию Фурье в 1807 году, совершил одну из самых громких ошибок в истории науки. Работа увидела свет лишь спустя 15 лет, в 1822-м.

Сам Фурье вел жизнь, достойную приключенческого романа: участвовал в революциях, дважды сидел в тюрьме, был губернатором и исследовал Египет вместе с Наполеоном. Математика была для него скорее страстным увлечением в перерывах между государственными делами.

Он ушел из жизни в 1830 году, не дождавшись практического воплощения своих трудов. JPEG, Wi-Fi и МРТ появились спустя полтора столетия.

Трудно представить, что бы он почувствовал, узнав, что мир буквально пронизан вычислениями по его формуле, которую великие умы когда-то назвали «невозможной».

Хотя, скорее всего, он бы просто улыбнулся, зная, что истина всегда находит путь к свету.

Источник

Как один трюк 200-летней давности управляет музыкой, фотографиями и Wi-Fi

Концепция, кажущаяся подозрительно простой

MP3: избавление от акустического балласта

Сжатие с 1.4 Мбит/с до 128 Кбит/с. В 11 раз эффективнее.

`При этом разница для слушателя практически неуловима.`

JPEG: волны в мире пикселей

Wi-Fi: созидательная сила Фурье

Shazam: узнавание по «отпечаткам пальцев»

МРТ: Фурье в диагностике организма

Грандиозный масштаб

FFT: алгоритм, изменивший правила игры

`Эти 12 строк кода запускаются квадриллионы раз в секунду.`

Почему это универсально?

Ирония истории

Читайте также

Паблик ВКонтакте

Последние посты