Продолжение серии статей, в которой мы разбираемся с тем, как упорядоченная пара двух чисел способна служить моделью для различных числовых систем, как привычных, так и весьма экзотических. Первая и вторая части были посвящены построению привычных кольца целых и поля рациональных чисел, вернее тому, как эти числовые системы можно моделировать упорядоченными парами элементов из более примитивных систем.
В этой части мы рассмотрим общие принципы построения числовых систем, как модулей над другими системами, перейдём от пар к матрицам и немного пофилософствуем над такими вопросами: «Что такое числовая система?», «Почему матрицы так хорошо подходят для сочинения новых чисел?»
Гауссовы числа
Начнём мы с того, что построим «из камней и палок» модель достаточно полезной числовой системы: кольца гауссовых чисел. Это комплексные числа с целыми вещественной и мнимой частями, подчиняющиеся стандартной комплексной арифметике. Они широко используются в теории чисел, при решении диофантовых уравнений, в теории колец и в геометрии, в которой удобно описывают регулярные решётки. Некоторым аспектам использования гауссовых чисел я, в своё время, посвятил пару статей на SE7ENе: Рисуем по клеточкам и Про углы и тригонометрию.
Комплексные числа, как правило, сразу определяются, как пара значений: вещественное и мнимое. Сейчас мы без особой необходимости не будем использовать «подозрительную» мнимую единицу, а явно запишем, что гауссовым числом является пара нормальных целых чисел:
Целые числа настоящими камнями и палками моделировать неудобно, так что вместо этого, для создания некоторого визуального образа можно использовать расположение на бесконечной дорожке, поделённой на клеточки, двух различных объектов, например, Димы и Маши, либо бесконечную регулярную квадратную решётку с выделенным нулевым узлом.
Обратите внимание на то, что я намеренно не делаю акцент на привычном геометрическом смысле комплексных чисел и представлении о комплексной плоскости. На этом этапе конструирования всё это будет лишь отвлекать от нашего занятия. Мы обязательно вернёмся к привычным геометрическим образам, но тогда, когда они дадут что-то принципиально новое для понимания чисел.
Сложение и умножение
Для начала, определим сложение, как полагается, покомпонентно:
Тут нет никакой разницы с моделью целых чисел, кроме того, что все пары уникальны, и эквивалентность для этих пар тривиальна:
По этой причине, нейтральным элементом для сложения будет единственный нулевой элемент , состоящий из нейтральных элементов кольца целых чисел.
Мы не скрываем, что моделируем известные нам комплексные числа, поэтому сразу же воспользуемся правилом для их перемножения. Как «придумать их с нуля» мы поймём несколько позже, когда разберёмся с представлениями и расширениями алгебраических структур, а пока вспомним, что
и перепишем это правило с помощью пар:
Давайте сравним это правило умножения комплексных пар с умножением в модели целых чисел:
Смотрите, как похоже! Это, конечно же, неслучайно, но что это значит мы обсудим несколько позднее.
Отношение порядка
Определить линейный порядок для гауссовых чисел можно. Например, можно ввести лексикографический порядок, то есть, сравнивать первые элементы, а если они равны, переходить к сравнению вторых. А можно, как-нибудь соединить все гауссовы числа, начиная с нуля по спирали или по какой-нибудь ещё линии, один раз проходящей по каждой точке решётки, и считать, бóльшим число, имеющее больший порядковый номер при таком перечислении. Однако никакой способ упорядочивания комплексных чисел не будет согласован с операцией сложения и умножения. Это полезно доказать.
В арифметике упорядоченных множеств должны выполняться следующие утверждения:
Из условия (2) следует, что
и получим:
у нас положительно, то согласно утверждению (3)
, что приводит к противоречивому выводу:
выполняться не могут. Так что в этой модели мы обойдёмся без отношения порядка.
В завершение конструирования можно определить операцию сопряжения, не имеющую аналогов в целых числах:
В этой части не было особых трудностей, поскольку гауссовы числа чрезвычайно близки по своей структуре к простому прямому произведению двух колец целых чисел и не отягощены никакими отношениями эквивалентности. Единственное, что выдаёт в них комплексную природу, это специфическое правило умножения.
Что такое число?
Но до сих пор, определяемые нами арифметические операции и отношения были искусственными. Они появлялись не из самой модели, а вводились «снаружи» — из логики хорошо известной нам числовой системы, которую мы моделируем. Действуя таким образом, ничего существенно нового построить не получится, и все наши модели будут не полезнее знаменитого троллейбуса, построенного из хлебной буханки.
У читателя должны были возникнуть естественные вопросы: А почему то или иное произведения для пар должно быть именно такими? А какие вообще числовые системы можно определить таким образом? Какие из этих моделей будут иметь смысл или возможное применение?
Первым делом, пора определиться с тем, что такое числа. Не будем тут толковатьпро «абстракции» и «идею» количества, а сразу сурово скажем, что числами будем считать объекты любой природы, для которых можно корректно и замкнуто определить сложение и умножение, причём так, чтобы для них выполнялись сочетательный и распределительный законы (ассоциативность и дистрибутивность). Замкнутость означает, что сумма и произведение двух чисел всегда является числом.
Это подход алгебраиста: его интересуют не объекты, как таковые, а доступные действия над ними и свойства этих действий. Своей кульминации такой подход достиг в середине XX века, с появлением теории категорий, в которой объектами стали целые математические теории, а изучению подлежат не они, а свойства возможных действий над ними (функторов), превращающих их в другие объекты-теории.
Говоря о числах в аглебре, мы не пытаемся понять их природу или ответить на вопрос: что же это такое? Вместо этого, мы выясняем, какие действия возможно производить с тем, что можно назвать этим словом, и в зависимости от набора этих действий и их свойств, распознаëм ту или иную числовую систему.
Например, натуральные числа с операциями и образуют структуру, которая называется полукольцом. Целые числа уже мощнее, в них появляются ноль и отрицательные числа, позволяющие «отменять» сложение, так что мы говорим о кольце целых чисел. Рациональные числа добавляют к этому «отмену» уиножения — деление, превращаясь в поле. Вещественные числа делают это поле полным, добавляя в него все пределы сходящихся последовательностей, а комплексные числа алгебраически замыкают его. Эта «числовая башня» хорошо известна. Параллельно с ней развиваются и используются конечные модулярные арифметики и кольца многочленов, нашедшие отражение в привычной нам позиционной записи чисел, а также всякая экзотика: дуальные, гиперболические, p-адические числа и им подобная нечисть.
А что именно и как именно мы «складываем» или «умножаем», нам совершенно неважно. Скажем, в так называемом тропическом кольце, роль умножения выполняет сложение, а сумма двух элементов вычисляется, как минимальное среди них. Однако эти две операции прекрасно подходят на роль сложения и умножения, так что мы работаем с такой системой, как с кольцом.
Далее термины «числовая система» и «арифметика» я буду использовать как синонимы, обобщающие полукольца, кольца, и поля, а их элементы продолжу называть «числами».
Арифметики можно моделировать, обнаруживая вокруг нас объекты и явления с соответствующими операциями, но ни одна такая модель не будет является главной или как-то отражать «природу» числа. Они могут быть более или менее интуитивно понятными, в различной степени практически полезными, и явно или неявно структурированными.
Ключевое свойство арифметики
Цель этих заметок: показать на ряде примеров, из какой логики строятся осмысленные арифметики и их модели, и надо сказать, до сих пор этой логики мы не касались, а занимались «зоологией» — описали парочку знакомых «экземпляров» арифметик и перечислили их особенности (классы эквивалентности, отношение порядка, корректность и согласованность арифметических операций и т. д.). Пора от «зоологии» перейти к математике!
Если внимательно присмотреться к моделям целых и гауссовых числовых систем, то в них легко разглядеть векторную природу. Во-первых, пары чисел образуют некоторое пространство с координатами — натуральными или целыми числами. Во-вторых, сумма и разность пар вычисляется покомпонентно, точно также как и в векторной алгебре. Отличие от векторов состоит в выбранном нами способе перемножения пар, которое не соответствует какой-либо из привычных векторных операций (скалярному произведению, векторному, смешанному и др.). Причём именно то, каким будет произведение, и диктует особые свойства наших моделей.
Такие конструкции, подобные векторным пространствам над числовыми полями, можно строить и над более примитивными структурами, абелевыми группами, кольцами и так далее. В случае колец, они называются модулями (этим словом в математике что только не обозначают!).
Таким образом, забавляясь с камнями и палками, мы строили двумерные модули над натуральными и целыми числами, а задавая специфические операции умножения и отношение эквивалентности, мы наделяли эти модули свойствами конкретной арифметики.
Теперь отвлечёмся от конкретики и рассмотрим двумерный модуль над некоторой арифметикой , на котором мы хотим построить новую арифметику. Оставим сложение векторным, то есть, покомпонентным, и зададимся вопросом: каким образом можно определить какое-либо корректное умножение для пары?
Исходя из нашего определения числа, умножение двух пар должно всегда возвращать корректную пару, и для него обязаны выполняться сочетательный и распределительный законы. Кроме того, определение должно быть корректным для арифметики , к которым принадлежат элементы пары. Например, определяя умножение для пары натуральных чисел, нельзя использовать вычитание, а только сложение и умножение.
Это достаточно жёсткие ограничения, которые существенно ограничивают нашу фантазию, но мы гарантированно выполним их, если будем рассматривать только линейные комбинации элементов пар.
Линейность в математике имеет чёткое определение: оператор или функция линейна, если выполняется следующее отношение:
для любых чисел и аргументов , для которых определены умножение на число и сложение. В нашем случае, все эти числа и аргументы должны принадлежать арифметике .
Вот простой и интуитивно понятный пример: в линейных системах сумма всегда равна произведению . Это прямое следствие дистрибутивности умножения (распределительного закона) выглядит банальностью, но только потому что все арифметики с которыми мы имеем дело, линейны, и нам не приходится задумываться об этом. Если искусственно определить умножение каким-либо нелинейным образом, то сохранение дистрибутивности станет существенно нетривиальной проблемой.
Таким образом, мы можем смело записать произведение двух пар элементов арифметики 𝔸 в самом общем виде, как линейную комбинацию их элементов, и получить такую «колбасу»:
в которой все индексированные коэффициенты тоже принадлежат .
Линейными комбинациями, операторами и преобразованиями занимается старая добрая линейная алгебра, из которой родом и векторы, и скалярные произведения (обобщение линейных комбинаций) и матрицы, как удобный универсальный способ записи линейных операторов и преобразований пространства. Так, что все первокурсники мира, имеющие хоть какое-то отношение к точным или инженерным наукам, изучают линейную алгебру, как lingua franca математики.
Давайте перепишем общий вид произведения, в форме линейного преобразования, то есть, матрицы:
Здесь, в духе абстрактной алгебры, умножение чисел рассматривается как действие одного числа на другое. Все числа и операции в этом выражении определены для арифметики 𝔸, а все векторные и матричные операции — стандартные.
Пока кажется, что стало сложнее, абстрактнее и непонятнее. Ничего удивительного, это же самый что ни на есть общий вид для возможной операции умножения над парами. Главное, что благодаря использованию матриц мы избавились от«магических» видов умножения, сведя всё к линейным комбинациям и операциями над натуральными числами.
Давайте посмотрим, как в матричном виде выглядит умножение для наших моделей.
Целые числа:
гауссовы числа:
А вот так всё выглядит гораздо лучше! Более того, мы можем и вовсе отказаться от векторов, перейдя исключительно на матричную модель наших чисел.
Вспомним, что для умножения во всех числовых системах выполняется сочетательный закон: . Если мы запишем это правило в модели целых чисел, как для пар, так и для матриц, то получим следующие эквивалентные соотношения:
Это жонглирование скобками говорит нам о важной вещи: пары и матрицы ведут себя относительно умножения одинаково. Действительно, при перемножении этих матриц правильные комбинации оказываются на правильных местах в матрице:
Но если первая строчка выглядит искусственно, то вторая вытекает из стандартного матричного умножения. Теперь, если мы примем, что матрицы складываются покомпонентно, то получается, что эта эквивалентность сохраняется и относительно сложения. Так что можно написать, что для модели целых чисел
Выходит, один только правильный выбор матрицы, задающей модель числовой системы, полностью определяет всю арифметику, без необходимости введения каких-то искусственных правил.
Тоже самое относится и к модели гауссовых чисел. Если мы перейдём от пар к матрицам:
то используя только стандартные матричные операции, мы получим действующую модель комплексной арифметики со сложением и умножением и всеми их свойствами. Например, сопряжению в этом представлении соответствует транспонирование матрицы.
Давайте ещё раз подчеркнём, в чём состоит двойственность подходов в построении моделей.
Матричные модели алгебраических структур (групп, колец, полей) называются их представлениями. Построением и исследованием таких моделей занимается целый раздел математики: теория представлений.
Оба описанных выше подхода практически важны и широко используются. Составление пар (прямое произведение) это базовый инструмент абстракции, то есть, создания новых объектов на основе существующих или хорошо известных. Комплексные числа, рациональные дроби, дуальные числа, кватернионы, наконец, сами вектора и матрицы, все они строятся на базе прямого произведения.
С другой стороны, многие математические структуры невозможно осмысленно описать иначе, чем через представления, например, группы и алгебры Ли, топологические группы, алгебраические системы, описывающие квантовые операторы и так далее.
Что скрывается под матрицами
Но пока мы, кажется, поменяли шило на мыло. Если в моделях построенных на парах мы брали «с потолка» операцию умножения, то в представлениях нам придётся откуда-то взять подходящую «магическую» матрицу. Однако, представления это не просто альтернативный способ построения алгебраических систем. Матрицы позволяют дать осмысленную интерпретацию элементам наших пар.
Вернёмся к самому общему виду произведения:
Линейность даёт нам возможность разделить громоздкую матрицу на две части:
А вот это уже интересно! Матрицы коэффициентов, которые полностью характеризуют нашу числовую систему, независимы от конкретных элементов в парах, и они способны разделить информацию, касающуюся каждого элемента пары по отдельности. Давайте взглянем как эта декомпозиция работает в наших двух моделях.
Целые числа:
гауссовы числа:
Единичная матрица имеет совершенно очевидный смысл — это олицетворение «обычной» единицы, то есть, нейтрального элемента для умножения. Тот элемент, который умножается на эту матрицу, отвечает за «ванильную» (натуральную или вещественную) часть числа, а второй добавляет изюминку и, собственно, отвечает за добавление функционала, которого не было в начальной алгебраической структуре. Давайте выясним что представляют собой эти «изюминки».
Что отличает целые числа от натуральных? В натуральных числах нет числа , имеющего важное мультипликативное свойство: при возведении в квадрат оно даёт единицу, но само при этом отлично от единицы. А добавив этот новый элемент, мы можем получить и ноль, и отрицательные числа.
В матричном представлении целых чисел добавка представляет собой матрицу, которая не равна и не пропорциональна единичной, но при умножении её саму на себя, она превращается в единичную матрицу:
Из этого мы можем заключить, что эта матрица, действительно, представляет элемент . В сумме с единичной матрицей она, как полагается, даёт элемент, эквивалентный :
А что представляет собой секретный ингридиент в комплексных числах? Это такое число, которое при возведении в квадрат даёт . Давайте проверим, выполняет ли такую роль матрица, представляющая мнимый компонент:
И в самом деле, работает, ведь единичная матрица представляет вещественную единицу.
Расширение алгебраической структуры
Вернёмся к обобщённому взгляду. Матричные представления числовых систем позволили нам разглядеть в формальном и лишённом структуры прямом произведении (абстрактных парах) важную структуру: линейную комбинацию двух независимых компонент. Одна компонента при этом представляет базовую арифметику , а другая пропорциональна элементу, не существующему в . Эта добавка сосредотачивает в себе очень конкретные мультипликативные свойства новой арифметики и определяет каким будет умножение в ней.
При этом, вся исходная арифметика полностью содержится в новой, как подсистема. Ею можно пользоваться, если «обнулить» добавку. Опять же, если вам кажется, что это банальная мысль, то вспомните нашу модель кольца целых чисел, в которой элементы пары, а значит и коэффициенты в линейной комбинации, не могут быть равны нулю, поскольку ноль не содержится в натуральных числах. Тем не менее, арифметика натуральных чисел содержатся в арифметике целых чисел, причём, в бесконечном числе копий.
Процедура добавления к алгебраической структуре (полукольцу, кольцу или полю) элемента , которого в ней нет, но который в линейной комбинации с элементами вновь порождает корректную алгебраическую структуру, называется расширением , и обозначается как . Для того, чтобы подчеркнуть свойства добавляемого элемента, он определяется уравнением, корнем которого он является. Так, в частности, гауссовы числа расширяют кольцо целых чисел, добавляя к нему корень многочлена . Это обозначается так:
В случае гауссовых чисел это уравнение неразрешимо в исходной арифметике, но оно может быть и разрешимым, если исходная арифметика содержит не все его корни. Так в примере с расширением полукольца натуральных чисел до кольца целых с помощью добавления , мы добавляем элемент, решающий уравнение , но не равный . Так что можно записать, что
Значок показывает, что мы имеем дело не с равенством, а с изоморфизмом, более мягким, но тем не менее, точным отношением.
Подведëм промежуточный итог
От пар (прямого произведения) чисел с искусственными операциями, моделирующих числовые системы, мы перешли к представлениям этих систем, которые живут по законам линейной алгебры. Представления, в свою очередь, снова вернули нас к парам, но наделили их несколько более отчëтливым смыслом: линейной комбинации двух независимых компонент. Одна из этих компонент отвечает за базовую арифметику, а вторая расширяет её, добавляя некоторый новый элемент. Свойства этого элемента и свойства новой алгебры полностью определяются мультипликативными свойствами одной единственной матрицы, представляющей добавку.
Самое замечательное то, что про матрицы мы знаем всё. И надо сказать, что матриц , имеющих примечательный алгебраический и геометрический смысл, не так уж и много, более того, их можно определëнным образом классифицировать, а это значит, что можно получить исчерпывающую классификацию возможных арифметик над двумерными модулями.
Вот это уже — математика!
Матрицы, геометрия и мультики
Векторы и матрицы встречаются повсеместно в математике и физике, поскольку примеров линейных пространств в нашем мире много. Сладкий кофе с молоком, кодировка цветов в формате RGB, разложение функции в ряд Тейлора, галилеево сложение скоростей, конфигурация электронных орбиталей в атомах, представление чисел в позиционной системе счисления, спектры звёзд и единицы измерения физических величин… Это всё примеры линейных пространств, и для их описания можно использовать векторы и матрицы.
Впервые с линейным пространством мы встречаемся в школе, при решении систем линейных уравнений и когда знакомимся с геометрическим евклидовым пространством, в котором вектор, представляет направленный прямолинейный отрезок. Матрицы в геометрии представляют линейные преобразования всей плоскости, которые оставляют прямые линии прямыми и пересекающиеся прямые пересекающимися. Всё остальное: углы, расстояния и площади, может при этом измениться.
Любое линейное преобразование двумерного пространства это композиция растяжения, сдвига, скашивания, поворота и отражения относительно какой-либо линии.
За сдвиг отвечает сложение векторов, а умножение матрицы на вектор представляет те преобразования, которые оставляют начало координат на месте.
Классификация линейных преобразований
То как именно действует преобразование, описываемое конкретной матрицей
определяется двумя числами, которые называются её собственными числами. Они вычисляются, как корни уравнения, которое называется характеристическим:
Коэффициент при линейном члене уравнения называется следом матрицы, а свободный член — еë определителем. Согласно теореме Виета, след матрицы равен сумме собственных чисел, а её определитель — их произведению. Это полезно помнить, при работе с матрицами в контексте числовых систем.
Набор собственных чисел матрицы называется еë спектром. Зная его, можно сказать каким будет действие преобразования, которое представляет матрица.
-
Собственные числа вещественные — композиция растяжений и скашивания. При этом вдоль двух выделенных направлений наклон векторов не изменяется.
-
Собственные числа комплексные — композиция растяжений и поворота. При этом все векторы изменяют наклон.
-
Собственные числа равны друг другу (кратные) — композиция растяжений и скашивания. При этом есть одно выделенное направление вдоль которого наклоны векторов не изменяются.
-
Если какое-либо собственное число равно нулю, то соответствующее преобразование становится вырожденным и необратимым. При этом всё двумерное пространство стягивается в одну линию.
Итак, характер линейного преобразования определяется его спектром. Он, в свою очередь, зависит от характеристического уравнения: от знака дискриминанта и линейного члена. Для матриц второго порядка все возможные случаи можно показать на одной диаграмме, по осям которой отложены след и определитель матрицы.
Я позволил себе дать областям имена, которые не являются общеупотребимыми, применительно именно к матрицам, и которые обычно используются для классификации квадратичных форм, конических сечений, дифференциальных уравнений в частных производных или двумерных динамических систем. Но дело в том, что все упомянутые объекты описываются с помощью матриц, а для классификации используются их собственные числа или приведëнная выше диаграмма. Так что выбор названий абсолютно оправдан.
В область гиперболических преобразований попадают те, которые имеют вещественные собственные числа. Эллиптическими назовëм системы с комплексными собственными числами, а разделяют эти области параболические преобразования с кратными корнями характеристического уравнения. Среди гиперболических преобразований встречаются ещё вырожденные, имеющие одно собственное число, равное нулю.
Для того, чтобы лучше понять характер линейного преобразования в контексте представлений арифметик, можно рассмотреть не однократное его действие на координатную сетку, а многократное действие этого преобразования на точки пространства. Так получаются линии-орбиты, вдоль которых происходит перемещение точек пространства при многократном применении к ним преобразования.
Полюбуйтесь на то как выглядят линейные преобразования различных типов, их орбиты и собственные числа.
Теперь видно откуда берутся термины эллиптический, параболический и гиперболический, применительно к преобразованиям: орбитами соответствующих преобразований, действительно являются эллипсы (или эллиптические спирали), параболы и гиперболы.
Теперь с этих позиций взглянем на арифметики, которые имеют представление в виде линейной композиции единичной матрицы и некоторой матрицы-расширения. Модель целых чисел, как модуля над натуральными является гиперболической арифметикой, а гауссовы числа относятся к эллиптическим. Забегая вперёд, замечу, что модель рациональных чисел в виде дробей тоже можно вписать в эту классификацию, но с некоторыми техническими нюансами. Мы увидим, что её можно отнести к параболическим арифметикам.
Самое приятное свойство матричных представлений состоит в том, что между матрицами и их характеристическими уравнениями существует красивая связь: матрица представляет решения своего характеристического уравнения.
Вспомните, гауссовы числа мы определили как расширение кольца целых чисел мнимой единицей , которая решает уравнение . Матричные представления для мнимой единицы могут выглядеть так:
и если мы выпишем для них характеристические уравнения, то оно будет совпадать с решаемым уравнением: .
Таким образом, по матрице можно понять, какое уравнение оно решает. И наоборот, по уравнению, не имеющему решения в заданной числовой системе, можно построить его решение в виде матрицы, для которой это уравнение будет характеристическим.
В следующих статьях мы рассмотрим по отдельности примеры арифметик всех трёх типов и сможем увидеть какой геометрический смысл имеет в них операция умножения.
Оглавление серии
-
Изобретаем числа по-взрослому
-
Изобретаем эллитические числа
-
Изобретаем гиперболические числа
-
Изобретаем параболические числа