Геном и фрактальное хранение информации

18 Апр в 17:45

Геном – содержит всю необходимую информацию для развития, функционирования и наследования организма. Геном стоит в центре всех биологических проблем, всех свойств и способностей человека, всего его разнообразия. Хромосомы являются структурой, на которой организован геном, и они содержат ДНК, на которой располагаются гены.

Как говорил Козьма Прутков: «Многие люди подобны колбасам: чем их начинят, то и носят в себе». Так вот, мы «начинены» ДНК, носим ее в себе, а она-то, главным образом, и определяет многое в нас.

Остановимся на вопросе об объеме хранимых данных. Для оценки количества информации в хромосомах человека можно использовать примерное количество пар оснований в геноме и умножить на количество битов информации, которое содержится в каждой паре. Для человека это примерно 3 миллиарда пар оснований, каждая из которых кодируется двумя битами (базами A, T, G или C) [1]. Итак, общее количество информации в хромосомах человека можно оценить как:

^{3 миллиарда пар×2 бита/пара=6 миллиардов бит.3 миллиарда пар×2 бита/пара=6 миллиардов бит}

Это примерная оценка о фактическом количестве информации может варьироваться в зависимости от конкретных характеристик генома. В Wiki приводится похожая информация : «Азотистые основания в ДНК (аденин, тимин, гуанин, цитозин) соответствуют 4 различным логическим состояниям, что эквивалентно 2 битам информации. Таким образом, геном человека содержит более 6 гигабит информации в каждой цепи, что эквивалентно 800 мегабайтам и сопоставимо с количеством информации на компакт-диске.»

Всего лишь гигабайты, в то время как, например, примерное количество синапсов в мозгу человека составляет около 10141014 (то есть порядка 100 триллионов). Понятно, можно возразить, что построение такой сложной сети это циклические алгоритмы с коротким кодом разворачивающие и генерирующие эту сложную сеть. Однако и настройка такой сети, и алгоритмы ее функционирования требуют гораздо бОльших объемов чем гигабайты. Для сравнения GPT-3 (нейросеть искусственного интеллекта) имеет около 175 миллиардов параметров. Объем памяти, необходимый для хранения модели GPT-3 составляет порядка нескольких сотен гигабайт, включая веса модели и другие артефакты, необходимые для ее функционирования. И если для нейронной сети еще можно ввести объяснения связанные с обучением, и моделированием на основе первично заложенных примитивов, то для роста всех клеток в организме с их локацией и функциональностью, для развертывания иммунных и прочих систем в организме, обучение невозможно в рамках работы уже живого организма, так как отклонение от правильного функционирования и развития ведет к гибели . И совершенно очевидно что данных требуется на порядки больше. Что же делать?

Мы можем представить геном (точнее развернутую ДНК) как пункты оглавления книги по описанию роста и функционирования живого организма, каждый пункт которого ведет к нужной странице с алгоритмом плана действий.

Линк на нужную "страницу" — Линк на нужную “страницу”

Алгоритм может содержать огромнейшее количество действий, описывающих нужный процесс, (например, для построения конкретной клетки в конкретном месте организма) или набор инструкций необходимых для выполнения реакций той или иной системой на проявления воздействий внешнего мира.

Итак, ДНК содержит оглавление или линки на страницы книги . А где содержание самих страниц с огромным объемом информации. Где и на чем? Ответ – во фрактальных множествах.

Понять фрактальное множество и даже воспроизвести его с помощью математических операций совсем нетрудно, используется всего лишь нескольких формул. Но внутреннее содержание и связи внутри сложных фракталов невообразимы и практически бесконечны, особенно если это не само подобные фракталы . Вы сами можете построить такой фрактал с помощью компьютера и полюбоваться его сложностью ,например, множество Мандельброта или фрактал на рисунке ниже [2][3].

Прежде чем вернутся к геному рассмотрим механизм фрактальной архивации, связанный с фракталами. В теории сжатия данных это направление давно и успешно развивается, существует целые институты занятые перспективными разработками по изучению алгоритмов и математических методов фрактального архивирования изображений и видеорядов. Принципиально суть этих методов заключена в нахождении соответствующих фракталов в компактной, иногда даже в аналитической формуле, для сжатия и последующего восстановления большого объема информации. И не важно, что данные это не только изображения. Мы всегда можем превратить данные в многомерные картинки и применить к ним архивирование , точно также и наоборот. Существуют алгоритмы архивации (сжатия) больших информационных массивов, информационных хранилищ и складов данных с помощью фракталов. Они основаны на теореме Банаха о сжимающих преобразованиях (также известной как Collage «Theorem»).

«Потенциально наиболее полезным видом фракталов являются фракталы на основе системы итеративных функций (Iterated Function System – IFS). Метод IFS применительно к построению фрактальных изображений, изобретённый большим их знатоком Майклом Барнсли (Michael Barnsley)и его коллегами из Технологического института шт. Джорджия(Georgia Institute of Technology), базируется на самоподобии элементов изображения и заключается в моделировании рисунка несколькими меньшими фрагментами его самого. Специальные уравнения позволяют переносить, поворачивать и изменять масштаб участков изображения; таким образом, эти участки служат компоновочными блоками остальной части картины. Одним из наиболее поразительных (и знаменитых) IFS-изображений является чёрный папоротник, в котором каждый лист в действительности представляет собой миниатюрный вариант самого папоротника (см. рис.). Несмотря на то, что картинка создана компьютером методом аффинных преобразований, папоротник выглядит совершенно как настоящий. Выдвинуто предположение, что природа при кодировании генетической структуры растений и деревьев пользуется чем-то близким к методу IFS-фракталов.

IFS-фракталы имеют одно вполне реальное и полезное применение: с их помощью можно сжимать большие растровые изображения до долей их нормальных размеров. Этот утверждение следует из теоремы Банаха о сжимающих преобразованиях (также известной какCollage Theorem) и является результатом работы исследователя Технологического института шт. Джорджия Майкла Барнсли в области IFS. О своём достижении он рассказал миру в журнале Byte за январь 1988 г. Однако там отсутствовали какие-либо сведения о решении обратной задачи: как по заданному изображению найти аффинные преобразования. К тому моменту у этой задачи не было даже намёка на решение.

В идеале хотелось бы уметь находить для любого изображения систему аффинных преобразований (IFSM), воспроизводящую изображение с заданной точностью. Однако решение находилось немного в стороне. Первым нашёл его именно студент Барнсли, Арно Жакан (Arnaud Jacquin). Предложенный метод получил название «Система итерируемых кусочно-определённых функций» (Partitioned Iterated Function System – PIFS). Согласно этой схеме, отдельные части изображения подобны не всему изображению, а только его частям.» [4]

Нейробиологи открыли и установили, что внутри клеток есть специальные молекулярные автоматы способные на очень сложные действия, которые могут открыть молекулу ДНК, прочитать ее фрагмент, отредактировать, что-то удалить из нее, исправить ошибки. Другими словами, в клетках есть система, которая занимается такой же обработкой информации, как компьютер.

Теперь мы можем условно восстановить развитие генома в процессе эволюции. Начнем с момента, когда появились органические образования со свойствами копирования, то есть у «протоклетки» есть алгоритмы своего копирования. Эти алгоритмы могут быть достаточно «объемными», поэтому естественно предположить, что они должны храниться в сжатом и даже закодированном виде. Заметим, что данный факт перекликается со свойствами Информации, описанной в ранних постах [5][6]. Наиболее эффективным способом эти механизмы реализуются через указанное выше фрактальное архивирование, когда и алгоритмы и сопутствующие данные записываются во фракталы. Большие размеры алгоритмов и данных перестают играть существенную роль, так как сами механизмы воспроизведения любой части фрактала очень компактны. В ДНК сохраняется только указание на фрактал и область фрактала, где содержатся в закодированном виде необходимые данные. По другому, весь объем данных о построении человека и функционировании всех его систем хранится в зашифрованном виде в различных областях фракталов, которые ДНК и РНК могут считывать и руководствуясь расшифрованным инструкциям строить живые организмы шаг за шагом и клетка за клеткой. Скорее всего первоначально фракталы хранились в специализированных молекулах, как в storages [7], но затем клетки научились использовать новые механизмы для постройки фракталов и считывания из них данных на лету. Заметим, что в силу появляющихся «неточностей» при фрактальном декодировании и копировании генома могут возникать мутации при воспроизведении структур, что и является причиной эволюции, как генома так и живых организмов. Итак, в процессе эволюции клетками в результате удачных мутаций отбирались новые функциональности для эволюционного развития и самих клеток и их ансамблей в виде живых организмов, в то время как клетки (организмы) с неудачные мутациями просто погибали. Понятны и времена необходимые для такого эволюционного случайного отбора – миллиарды и миллиарды лет.

Литература:

1. Э. Макконки, «Геном человека», Техносфера, 2020 г.

2. https://www.youtube.com/watch?v=7HSmu5l6vAg

3. https://waksoft.susu.ru/2019/04/27/mnozhestvo-mandelbrota-na-python

4. https://studfile.net/preview/5150865/page:24/

5. https://habr.com/ru/articles/776080/

6. https://habr.com/ru/articles/774930/

7. https://dzen.ru/a/Zh6fhjZT7FHAOebt

Источник