Что более выгодно — собственное оборудование или облачные технологии?

Привет, SE7EN! Вопрос из заголовка уже давно волнует и малый бизнес, и крупные компании. На первый взгляд облако кажется идеальным решением: не нужно сразу вкладываться в железо, можно быстро масштабироваться, легко получать доступ к новым технологиям. Однако стоит копнуть чуть глубже, и картина становится не такой однозначной. Особенно когда речь заходит о долгосрочной перспективе и финансах.

Сегодня мы в ServerFlow попробуем разобраться, что же действительно выгоднее: аренда облачных ресурсов или покупка своего оборудования. Для начала сравним наиболее популярные конфигурации в облаке и on-premise(свое железо), так как они наиболее востребованы на рынке. А о таких вещах как colocation, private cloud, hybrid и прочих вариантах мы поговорим как-нибудь в другой раз — в отдельной статье.

Что более выгодно — собственное оборудование или облачные технологии?
Сервер DELL R640 на базе LGA3647

Витая в облаках

Всем известно, что любой бизнес начинается с малого: сегодня вы берете в свой штат первого сотрудника и выставляете счета через онлайн-бухгалтерию, а завтра вокруг вас витают такие термины, как 1С, CRM, Dev, Test и Prod, а штат компании должен быть пополнен целым списком новых вакансий.

В попытках найти ответы на все возникающие вопросы через поисковые системы, алгоритмы таргетированной рекламы вовремя предлагают услуги облачных провайдеров. В своих офферах облака обещают взять все заботы на себя: установить ОС, настроить сеть и установить необходимое ПО. И все это за «небольшой» ежемесячный платеж.

В большинстве случаев вышеперечисленные удобства подкупают потенциального клиента, и облачный провайдер обретает долгосрочные отношения с клиентом. Однако иногда законы экономики берут свое, и вы решаете посчитать, во сколько обходится облако, и можете прийти к весьма неоднозначным выводам.

Сегодня мы порассуждаем об облаках и сравним их с собственной IT-инфраструктурой. Поставим под сомнение оба пути развития компании и постараемся сделать вывод, какой путь выбрать.

Нюансы облачных сервисов

Overcommit

Многие провайдеры используют технологию под названием «overcommit», суть её заключается в том что как-бы выделяется больше виртуальных ресурсов, чем у них есть физически. Логика механизма такая: не все клиенты будут использовать ресурсы на полную мощность одновременно, а значит часть их ресурсов можно выделять тем кому их требуется больше. Либо по умолчанию при казалось бы одинаковых характеристиках, в зависимости от тарифа, overcommit будет настроен по разному, предоставляя больше ресурсов тем кто платит больше. В результате вы можете обнаружить, что ваши виртуальные процессоры работают не на полную мощность, а производительность падает в самый неподходящий момент.

Виртуальные машины с частотой 5GHz

Иногда встречаются и более спорные маркетинговые ходы. Например, рекламируются виртуальные машины с частотой процессора 5 ГГц. Звучит впечатляюще, но если понимать рынок серверных процессоров, становится очевидно, что такие показатели практически недостижимы в рамках экономически эффективного ЦОД.
Серверные процессоры легко масштабируются за счёт увеличения числа вычислительных ядер, однако повышение тактовой частоты остаётся задачей со звездочкой для чипмейкеров. Высокие частоты требуют повышения напряжения работы ядер, что резко увеличивает тепловыделение (TDP) многоядерных чипов. Также нужно поддерживать высокий уровень отбраковки кристаллов, что в свою очередь значительно повышает стоимость конечного CPU.
В большинстве случаев частота 5 ГГц оказывается злополучной Turbo Boost частотой, которая при значительной нагрузке на сервер попросту недостижима.

Характеристики актуальных EPYC 9004, обратите внимание, что не один из процессоров не обладает соответствующей частотой.
Характеристики актуальных EPYC 9004, обратите внимание, что не один из процессоров не обладает соответствующей частотой.

А что у нас за железо?

Кроме того, часто сложно точно узнать, на каком железе работают ваши виртуальные машины. Провайдеры не всегда раскрывают полную информацию. Вы можете не знать, какие именно процессоры используются, какая у них реальная частота, какая архитектура серверов. Все это может существенно влиять на производительность ваших приложений.

Проверить реальную частоту процессора в облаке зачастую непросто. Команда lscpu может не отображать точную информацию. Вы можете увидеть что-то вроде:

$ lscpu

Architecture: x86_64

CPU op-mode(s): 32-bit, 64-bit

Model name: "QEMU Virtual CPU"

CPU MHz: 3400.000

Hypervisor vendor: KVM

Virtualization type: full

Как видите, никаких 5 ГГц тут и близко нет. В итоге вы можете платить за ресурсы, не получая той производительности, на которую рассчитываете.

Собственное оборудование: путь развития компании

А теперь перейдём от теории к практике, на примере бизнеса и его потребностей в IT-инфраструктуре. В России путь многих компаний начинается с внедрения 1С, и выбор между облаком и собственным сервером становится одним из первых серьезных решений для предпринимателей. Этот выбор может существенно повлиять на развитие бизнеса, его гибкость и финансовые показатели. Рассмотрим, как меняются потребности в IT-инфраструктуре на разных этапах развития бизнеса и какие преимущества дает собственное оборудование.

Конфигурация для малого бизнеса или стартапа:

Представьте небольшой стартап по разработке мобильных приложений. Команда из пяти человек арендует скромный офис и начинает свой путь. Основатели понимают: нужна надежная система для ведения бухгалтерии, управления проектами и хранения кода, но бюджет ограничен. Скорее всего в таком случае выбор падёт на подобную и схожую с ней конфигурации:

Серверная платформа Dell PowerEdge T140

  • Процессор: Intel Xeon E-2286G (6 ядер / 12 потоков, 4.0–4.9 ГГц)

  • Оперативная память: 64 ГБ DDR4 ECC UDIMM

  • M.2 SSD Samsung PM983 PCIe 3.0 на 960 ГБ (под базы данных)(50K IOPS)

  • 2× SSD Intel S4510 по 960 ГБ в RAID 1 для ОС и резервных копий(36K IOPS)

  • Интерфейс DELL iDRAC для удалённого администрирования системы

Стоимость такого оборудования составит: около 170 000 рублей

Эта конфигурация отлично справляется с задачами 1С, позволяет хранить исходный код проектов, запустить систему управления задачами и небольшой сайт-портфолио. Производительности процессора хватает для компиляции кода и запуска нескольких виртуальных машин для тестирования. SSD-накопители обеспечивают быструю работу с базами данных и файловой системой.

В облаке аналогичные ресурсы обошлись бы в 30 000 — 50 000 рублей ежемесячно. Таким образом, собственный сервер окупается за 5-6 месяцев. Но дело не только в деньгах. Собственное оборудование дает команде полный контроль над данными и возможность тонкой настройки под свои нужды. Например, разработчики могут экспериментировать с различными конфигурациями без опасений за перерасход бюджета на облачные ресурсы.

Кроме того, наличие собственного сервера позволяет компании обеспечить высокий уровень безопасности данных. Это особенно важно, когда речь идет о разработке приложений для корпоративных клиентов, которые очень щепетильно относятся к вопросам конфиденциальности.

Конфигурация для среднего бизнеса с высокими нагрузками:

Прошло три года. Стартап превратился в успешную компанию с штатом в 50 человек. Появились крупные клиенты, требующие высокой производительности и надежности систем. Компания разрабатывает не только мобильные приложения, но и сложные веб-сервисы с высокой нагрузкой.

Серверная платформа Supermicro AS-2024US-TRT

  • Процессоры: 2× AMD EPYC 7F72 (24 ядра / 48 потоков, 3.2–3.7 ГГц)

  • Оперативная память: 256 ГБ DDR4 ECC REG

  • 5× U.3 SSD Intel D5-P5530 по 1.92 ТБ(75K IOPS)

  • 6× SAS HDD 1.8 ТБ 10K RPM(RAID 5 для резервных копий)

  • RAID-контроллер: LSI 9361-8i 1GB

  • IPMI 2.0 для управления сервером

Итого стоимость: около 780 000 рублей

Эта система способна справиться с большими объемами данных, высоконагруженными базами данных и множеством одновременных пользователей. Она обеспечивает бесперебойную работу усложнившейся инфраструктуры компании: CRM, ERP, системы аналитики и многое другое.

Два мощных процессора AMD EPYC позволяют запускать множество виртуальных машин, что идеально подходит для микросервисной архитектуры, которую компания использует в своих проектах. Большой объем оперативной памяти обеспечивает быструю работу с базами данных и кэширование часто используемых данных.

SSD используются для часто запрашиваемых данных и операционных систем, а HDD — для хранения больших объемов данных, таких как логи и бэкапы.

Аренда подобной конфигурации в облаке обошлась бы в 150 000 — 200 000 рублей в месяц. Собственный сервер окупается за 4-5 месяцев, при этом компания получает полный контроль над данными и может гибко настраивать систему под свои нужды.

Важно отметить, что такая мощная система позволяет компании быстро разворачивать новые проекты и экспериментировать с новыми технологиями без необходимости каждый раз согласовывать расходы на облачные ресурсы. Это значительно ускоряет процесс разработки и вывода новых продуктов на рынок.

Конфигурация для виртуализации:

Компания продолжает расти. Открываются филиалы в других городах, появляется необходимость в изолированных средах для разработки, тестирования и продакшена. Кроме того, часть сотрудников начинает работать удаленно, и им нужен безопасный доступ к корпоративным ресурсам.

Серверная платформа H3C UniServer R4950 G5

  • Процессоры: 2× AMD EPYC 7713 (64 ядер / 128 потоков, 2.0–3.675 ГГц)

  • Оперативная память: 512 ГБ DDR4 ECC REG 

  • 4× U.3 SSD Intel D5-P5530 по 1.92 ТБ(75K IOPS)

  • 4× SAS HDD 1.8 ТБ 10K RPM(RAID 5 для резервных копий)

  • RAID-контроллер: Broadcom 9560-16i 8GB

  • HDM(IPMI 2.0) для управления сервером

Итого стоимость: около 990 000 рублей

Это решение позволяет развернуть множество виртуальных машин для разных задач: отдельные среды для разработки, тестирования и продакшена, изолированные системы для разных отделов. Удаленные сотрудники получают доступ к виртуальным рабочим столам, что повышает безопасность и удобство работы.

Процессоры AMD EPYC отлично подходят для задач виртуализации благодаря большому количеству ядер и поддержке современных технологий виртуализации. Это позволяет эффективно изолировать рабочие среды разных проектов и отделов, обеспечивая при этом высокую производительность для каждой виртуальной машины.

На SSD размещаются операционные системы и базы данных виртуальных машин, что обеспечивает их быструю работу, а на HDD в RAID 5 хранятся большие объемы данных, для которых важнее надежность хранения, чем скорость доступа.

Производительный RAID-контроллер с модулем резервного копирования обеспечивает дополнительный уровень защиты данных, что критически важно в условиях, когда на одном физическом сервере работает множество виртуальных машин с разными проектами.

В облаке аналогичные ресурсы стоили бы от 200 000 до 290 000 рублей в месяц. Срок окупаемости собственного оборудования — 4-5 месяцев. Но главное преимущество здесь не в экономии, а в гибкости. Компания может быстро создавать новые виртуальные машины под новые проекты, выделять дополнительные ресурсы там, где они нужны, и оперативно масштабировать инфраструктуру без дополнительных затрат.

Конфигурация для задач машинного обучения и работы с нейросетями:

Компания становится лидером рынка в своем сегменте. Руководство понимает: чтобы сохранить лидерство, нужно внедрять инновационные технологии, в частности, искусственный интеллект. Принимается решение интегрировать ИИ в продукты компании и использовать его для оптимизации внутренних процессов.

Серверная платформа Supermicro SYS-1028GR-TR

  • Процессоры: 2× Intel Xeon E5-2699v4 (22 ядра / 44 потоков, 2.3–3.6 ГГц)

  • Оперативная память: 512ГБ DDR4 ECC REG

  • 2× SSD Intel S4510 по 1,92 ТБ в RAID 1(36K IOPS)

  • 4× NVIDIA Tesla A100 40GB

  • IPMI 2.0 для управления сервером

Итого стоимость: около 3 398 000 рублей

Эта мощная система предназначена для работы с искусственным интеллектом, анализа больших данных и компьютерного зрения. Она позволяет компании разрабатывать собственные AI-модели для персонализации контента, автоматизации продаж, улучшения поддержки клиентов и оптимизации бизнес-процессов.

Процессоры Intel Xeon обеспечивают высокую производительность для предобработки данных и управления процессами машинного обучения. Большой объем оперативной памяти позволяет работать с крупными датасетами, не обращаясь постоянно к дисковой подсистеме.

Главная особенность этой конфигурации — наличие четырех мощных GPU NVIDIA Tesla A100. Эти карты специально разработаны для задач машинного обучения и обеспечивают феноменальную производительность при обучении нейронных сетей. Это позволяет компании экспериментировать с самыми современными архитектурами нейросетей и обрабатывать большие объемы данных в реальном времени.

SSD в RAID 1 обеспечивают быстрый доступ к данным и защиту от потери информации в случае выхода из строя одного из дисков. Это критически важно, учитывая, что процесс обучения нейросетей может занимать дни или даже недели, и потеря промежуточных результатов была бы катастрофой.

Пример работы квантизированной мультимодальной нейросети Pixtral-12b на менее мощном GPU-сервере
Пример работы квантизированной мультимодальной нейросети Pixtral-12b на менее мощном GPU-сервере

Аренда сопоставимых ресурсов в облаке стоила бы от 900 000 до 1 200 000 рублей в месяц. При таких ценах собственное оборудование окупается за 3-4 месяца. Но дело не только в экономии. Владение собственным оборудованием для машинного обучения дает компании несколько ключевых преимуществ:

  1. Полный контроль над данными. В эпоху, когда данные становятся ключевым активом бизнеса, возможность хранить и обрабатывать их на собственном оборудовании становится критически важной.

  2. Отсутствие ограничений на время использования. В облаке стоимость аренды GPU может быть очень высокой, что ограничивает возможности для экспериментов. С собственным оборудованием команда может проводить длительные эксперименты без оглядки на счетчик.

  3. Возможность тонкой настройки. Владея оборудованием, компания может оптимизировать его работу под свои конкретные задачи, что часто невозможно в облаке.

  4. Предсказуемость затрат. Облачные провайдеры могут менять цены или вводить новые тарифы. С собственным оборудованием компания защищена от таких сюрпризов.

Преимущества собственного оборудования

Когда у вас есть свое оборудование, вы точно знаете, что установлено, и можете настроить все под свои задачи. Нет сюрпризов с «урезанными» процессорами или ограниченными каналами памяти. Вы заранее знаете все расходы — никаких скрытых платежей или неожиданных повышений тарифов.

Ваши ресурсы принадлежат только вам. Нет проблемы «шумных соседей», когда другие клиенты могут потреблять большую часть мощности сервера. Данные хранятся на вашем оборудовании, вы сами контролируете доступ к ним и отвечаете за их сохранность. Вы можете добавлять ресурсы, когда нужно, модернизировать систему, менять компоненты. И все это без лишних переплат и зависимости от провайдера.

Современные процессоры EPYC имеют до 128 вычислительных ядер и могут масштабироваться до 2-х сокетов.
Современные процессоры EPYC имеют до 128 вычислительных ядер и могут масштабироваться до 2-х сокетов.

Гибкость и масштабируемость: мифы и реальность

Облако часто рекламируют как бесконечно масштабируемое решение. Но в реальности картина может быть не столь радужной. Дополнительные ресурсы могут быть недоступны в нужный момент, или их стоимость окажется неожиданно высокой. С собственным оборудованием вы планируете масштабирование заранее, добавляете компоненты по мере роста бизнеса и всегда знаете, во что это выльется.

Например, если вам срочно понадобится увеличить мощность в пиковый период, облачный провайдер может предложить это сделать, но по повышенному тарифу. С собственным оборудованием вы можете заранее заложить запас мощности, не опасаясь каких либо ограничений, кроме больших стартовых затрат.

О чём часто забывают

Когда оценивают стоимость облака, часто упускают из виду дополнительные расходы. А они могут быть существенными. Многие провайдеры взимают плату за входящий и исходящий трафик. При высоких нагрузках это может стать значительной статьей расходов. Услуги по резервному копированию данных нередко оплачиваются отдельно. Расширенные пакеты поддержки и SLA тоже могут заметно увеличить итоговый счет.

Например, если ваше приложение обрабатывает большие объемы данных, стоимость трафика может составить существенную часть общих расходов. Некоторые провайдеры берут оплату и за входящий, и за исходящий трафик, что может стать неприятным сюрпризом в конце месяца.

Минусы on-premise решений: 

Несмотря на все преимущества, у решений on-premise есть и свои недостатки, о которых нельзя забывать.

Большие стартовые затраты

Первое, с чем сталкивается компания при переходе на собственное оборудование — это значительные первоначальные вложения. Если в облаке вы платите постепенно, то здесь нужно сразу выложить крупную сумму. Для небольших компаний или стартапов это может быть серьезным препятствием. Однако, не стоит забывать про такие опции по финансированию закупки оборудования как лизинг, рассрочка и кредит, ежемесячный платёж по которым может выйти аналогичным с тарифом облачного провайдера, а по окончанию выплат в отличие от облака вы не потеряете доступ, а будете полноправно владеть вашим железом.

Кроме того, нужно учитывать не только стоимость самих серверов, но и затраты на организацию серверной комнаты или колокейшена в дата-центре: системы охлаждения, бесперебойного питания, пожаротушения и т.д. Все это требует дополнительных инвестиций.

Конфигурация оборудования с возможностью апгрейда может значительно снизить начальные вложения. Такой подход позволяет выбрать платформу с учётом будущего роста и масштабироваться по мере необходимости.
Конфигурация оборудования с возможностью апгрейда может значительно снизить начальные вложения. Такой подход позволяет выбрать платформу с учётом будущего роста и масштабироваться по мере необходимости.

Кадровый вопрос

Для малого и среднего бизнеса затраты на персонал для обслуживания своей инфраструктуры зачастую ограничиваются одним единственным сисадмином или DevOps-инженером, однако, даже у малого и среднего бизнеса инфраструктура со временем растёт и становится сложнее. А также малый бизнес имеет свойство со временем становиться средним, а средний крупным, и тут уже DevOps/Сисадмин в количестве один-штука начинает банально физически не справляться.

Более крупная инфраструктура требует более квалифицированного обслуживания. Вам понадобятся  дополнительные системные администраторы, специалисты по безопасности, возможно, даже целый IT-отдел. Это означает дополнительные расходы на зарплаты, социальные пакеты, обучение персонала. При этом на рынке труда наблюдается дефицит действительно квалифицированных кадров в сфере IT. Найти хорошего специалиста, который сможет грамотно настроить и обслуживать вашу инфраструктуру, может быть непросто. А если такой специалист уйдет, его замена может стать серьезной проблемой.

Но с другой стороны, в крупных компаниях и облачную инфраструктуру никто не доверит на самотёк исключительно облачному провайдеру и без своего IT-отдела всё равно никуда не деться. К тому же, количество сотрудников необходимых для обслуживания растущих мощностей поднимается не экспоненциально, а постепенно, порой вовсе выходя на плато благодаря автоматизации и оптимизации процессов.

Выборка предложений с hh.ru по Москве на позицию системный администратор c опытом работы 3-6 лет. Данные о работодателях скрыты из этических соображений.
Выборка предложений с hh.ru по Москве на позицию системный администратор c опытом работы 3-6 лет. Данные о работодателях скрыты из этических соображений.

Ответственность за инфраструктуру

Когда вы используете облачные сервисы, ответственность за работоспособность инфраструктуры лежит на провайдере. В случае с on-premise решениями вся ответственность ложится на вас.

Вам нужно самостоятельно обеспечивать:

  • Бесперебойную работу оборудования

  • Своевременное обновление программного обеспечения

  • Защиту от сбоев и атак

  • Резервное копирование и восстановление данных

  • Масштабирование под растущие потребности бизнеса

Любой сбой или простой может привести к серьезным финансовым потерям и репутационным рискам. И единственный гарант стабильности в этом случае — это вы сами и ваша команда.

Сложности с масштабированием

Хотя мы говорили о гибкости on-premise решений, в некоторых случаях масштабирование может быть проблемой. Если вам внезапно понадобится значительно увеличить мощности, это может потребовать времени на закупку, монтаж и настройку нового оборудования или апгрейд старого. В облаке этот процесс обычно происходит намного быстрее. Впрочем, если вы заранее организовали кластер с избыточной мощностью, то труда масштабировать его ресурсы вам не составит, процесс будет сравним с тем как если бы это была аренда облака.

Заключение

Так что же все-таки дешевле и лучше — свое железо или облако? Однозначного ответа нет. Все зависит от конкретной ситуации, потребностей и возможностей вашего бизнеса.

Собственное оборудование может быть выгоднее в долгосрочной перспективе, особенно при высоких и стабильных нагрузках. Оно дает полный контроль, предсказуемую производительность, повышенную безопасность и гибкость в настройке. Но требует значительных начальных вложений и квалифицированного персонала для обслуживания.

Облако, в свою очередь, позволяет начать с минимальными затратами, легко масштабироваться и не заботиться об обслуживании инфраструктуры. Но при долгосрочном использовании и высоких нагрузках может оказаться дороже. Кроме того, вы теряете часть контроля над своими данными и зависите от провайдера.

Оптимальное решение часто лежит где-то посередине. Многие компании выбирают гибридный подход, комбинируя собственную инфраструктуру и облачные сервисы. Это позволяет получить преимущества обоих вариантов и минимизировать их недостатки.

Какой бы путь вы ни выбрали, главное — тщательно проанализировать все факторы и принять решение, которое наилучшим образом соответствует потребностям вашего бизнеса.

А какой выбор сделали бы вы? Поделитесь своими мыслями и опытом в комментариях. Нам интересно узнать, как вы решаете вопрос выбора между облаком и собственной инфраструктурой.

 

Источник

Читайте также