nmk

Лекція №5 (2 години). Основи IaaS: віртуальні машини та обчислювальні ресурси

План лекції

Концепція IaaS та сценарії застосування
Віртуальні машини: архітектура, типи та конфігурація
Управління екземплярами: запуск, зупинка, зміна типу
Автоматичне масштабування та групи доступності
Спеціалізовані обчислювальні ресурси: GPU, HPC, ARM-інстанси

Перелік умовних скорочень

Списком

IaaS — Infrastructure as a Service — інфраструктура як послуга
VM — Virtual Machine — віртуальна машина
EC2 — Elastic Compute Cloud — хмарний сервіс обчислень AWS
vCPU — virtual CPU — віртуальний процесор
AMI — Amazon Machine Image — образ машини Amazon
EBS — Elastic Block Store — блочне сховище AWS
SSD — Solid State Drive — твердотільний накопичувач
GPU — Graphics Processing Unit — графічний процесор
HPC — High Performance Computing — високопродуктивні обчислення
ASG — Auto Scaling Group — група автоматичного масштабування
AZ — Availability Zone — зона доступності
SLA — Service Level Agreement — угода про рівень обслуговування
IOPS — Input/Output Operations Per Second — операцій введення/виведення за секунду
SSH — Secure Shell — захищений мережевий протокол
TCO — Total Cost of Ownership — сукупна вартість володіння

Вступ

Віртуальні машини є базовим будівельним блоком IaaS і, ширше, всієї хмарної інфраструктури. Концепція VM у хмарі є прямим розвитком технологій віртуалізації, що виникли ще у 1970-х на мейнфреймах IBM. Проте саме хмарна реалізація — з миттєвим розгортанням, гнучким масштабуванням і погодинною тарифікацією — перетворила VM із дорогого корпоративного інструменту на загальнодоступний ресурс.

Розуміння принципів роботи хмарних VM, їх типів, моделей оплати і механізмів масштабування є фундаментальною навичкою для будь-якого архітектора або адміністратора хмарних систем.

1. Концепція IaaS та сценарії застосування

1.1 IaaS у контексті хмарних моделей

IaaS (Infrastructure as a Service) — модель хмарних послуг, за якої провайдер надає клієнту доступ до базових обчислювальних ресурсів: віртуальних машин, сховища та мередж. Клієнт управляє всім програмним стеком: операційною системою, проміжним ПЗ, застосунками та даними.

Якщо PaaS можна порівняти з оренддю повністю укомплектованого офісу (необхідно лише принести своїх співробітників), то IaaS — це оренда порожнього приміщення з підключеними комунікаціями. Ви самі вирішуєте, яку меблі (ОС), обладнання (ПЗ) і як організувати роботу.

1.2 Коли обирати IaaS

IaaS є оптимальним вибором у таких сценаріях:

Сценарій	Обґрунтування
Lift-and-shift міграція	Перенесення існуючих on-premise VM у хмару без переписування застосунків
Специфічні вимоги до ОС	Потреба у конкретній версії ОС, кастомних ядерних модулях
Спадщинні застосунки	Старі застосунки, що не підтримують PaaS-платформи
Повний контроль	Корпоративні вимоги до безпеки: custom SELinux, специфічне мережеве налаштування
HPC та ML-тренування	GPU-інстанси для ресурсоємних обчислень
Бази даних (self-managed)	Специфічна СУБД або версія, що не підтримується DBaaS

2. Віртуальні машини: архітектура, типи та конфігурація

2.1 Технологія віртуалізації

Хмарна VM — це програмна емуляція фізичного сервера, що запускається поверх реального фізичного обладнання за допомогою гіпервізора (Hypervisor).

Гіпервізор — спеціалізований програмний шар, що:

Абстрагує фізичні ресурси (CPU, RAM, диски) від VM
Ізолює VM одна від одної: кожна «думає», що виконується на виділеному залізі
Розподіляє фізичні ресурси між усіма VM, що виконуються на хості

Гіпервізор Тип 1 (Bare-metal): Встановлюється безпосередньо на фізичне обладнання. Найкраща продуктивність.

AWS використовує власний гіпервізор Nitro (базується на KVM + спеціалізований апаратний чіп)
Azure використовує Hyper-V
GCP використовує KVM

2.2 Родини типів EC2-екземплярів

AWS EC2 пропонує сотні типів VM, згрупованих у родини за оптимізацією під конкретне навантаження:

Загального призначення (General Purpose):

t4g, t3, t3a — Burstable: низька базова продуктивність CPU з можливістю короткострокових піків (CPU Credits). Підходять для веб-порталів, dev-середовищ, невеликих БД.
m7g, m6i, m6a — Збалансоване співвідношення vCPU / RAM. Ідеальні для більшості застосунків.

Оптимізовані під обчислення (Compute Optimized):

c7g, c6i, c6a — Висока обчислювальна потужність, менше RAM відносно CPU. Підходять для batch-обробки, HPC, відеокодування, наукових обчислень.

Оптимізовані під пам’ять (Memory Optimized):

r7g, r6i, x2idn — Велика кількість RAM (до 24 ТБ!). Підходять для in-memory БД (Redis, SAP HANA), аналітики великих даних, кешування.

Оптимізовані під зберігання (Storage Optimized):

i4i, i3, d3 — Локальний NVMe-SSD з надвисокою пропускною здатністю. Підходять для NoSQL БД (Cassandra, MongoDB), OLTP-систем.

Прискорені (Accelerated Computing) — GPU/FPGA:

p4d, p3 — NVIDIA GPU для ML-тренування. Tesla A100 (p4d) — до 8 GPU на інстанс.
g5, g4dn — NVIDIA GPU для ML-inference та графічних задач.
f1 — FPGA для спеціалізованих алгоритмів.
inf2 — Власні AWS Inferentia чіпи для ефективного ML-inference.
trn1 — AWS Trainium — оптимізовані для тренування DL-моделей.

2.3 Номенклатура типів EC2

Тип EC2 читається за чітким форматом:

m  7  g  .  2xlarge
│  │  │       │
│  │  │       └── Розмір: nano, micro, small, medium, large, xlarge, 2xlarge...
│  │  └────────── Процесор: g=AWS Graviton (ARM), a=AMD, пусто=Intel
│  └───────────── Покоління: 7 (новіше = краще)
└──────────────── Родина: m=general, c=compute, r=memory, i=storage, p/g=GPU

2.4 Розміри (Sizes) та ресурси

На прикладі родини m6i:

Тип	vCPU	RAM (GiB)	Мережа (Гбіт/с)	EBS-пропускна здатність
m6i.large	2	8	До 12,5	До 10 Гбіт/с
m6i.xlarge	4	16	До 12,5	До 10 Гбіт/с
m6i.2xlarge	8	32	До 12,5	До 10 Гбіт/с
m6i.4xlarge	16	64	12,5	10 Гбіт/с
m6i.8xlarge	32	128	25	25 Гбіт/с
m6i.16xlarge	64	256	50	50 Гбіт/с
m6i.32xlarge	128	512	50	50 Гбіт/с
m6i.metal	128	512	50	50 Гбіт/с (bare-metal)

2.5 AMI (Amazon Machine Image)

AMI (Amazon Machine Image) — шаблон, що містить операційну систему, налаштування та початковий набір програмного забезпечення для запуску EC2-інстансу.

Типи AMI:

AWS-надані: офіційні образи Amazon Linux, Ubuntu, Windows Server, RHEL тощо
AWS Marketplace: готові комерційні образи від ISV-партнерів (NGINX Plus, Kali Linux, checkpoint firewall тощо)
Community AMI: публічні образи від спільноти
Власні AMI: образи, що клієнт створив самостійно (golden images з попередньо встановленим корпоративним ПЗ)

Golden Image (Golden AMI):

Практика створення власного AMI зі всіма необхідними корпоративними налаштуваннями — патчами безпеки, агентами моніторингу, конфігурацією логування. Замість того щоб налаштовувати кожен новий сервер вручну — запускається golden image.

2.6 Azure VM та Google Compute Engine

Azure Virtual Machines:

Серії Azure VM: A (базові), B (burstable, аналог T3), D (загального призначення), E (пам’ять), F (обчислення), G/M (великий RAM), N (GPU).

Аналог AMI — Azure Marketplace image або Managed Image / Shared Image Gallery.

Google Compute Engine:

Типи машин GCE: E2 (загального призначення, дешевший), N2/N2D (збалансований), C3 (обчислення), M2/M3 (пам’ять), A2/A3 (GPU NVIDIA).

Preemptible VMs / Spot VMs — GCE-аналог AWS Spot Instances (розглядається далі).

3. Управління екземплярами: запуск, зупинка, зміна типу

3.1 Lifecycle (Життєвий цикл) EC2-інстансу

        pending           running          stopping         stopped
    ┌─────────────►  ┌─────────────┐  ◄──────────────  ┌──────────────┐
Launch            │  running      │  stop              │  stopped     │
                  │  (тарифікація)│  ──────────────►   │  (EBS-диск   │
                  └──────┬────────┘  start             │  зберігається│
                         │           ◄──────────────    └──────────────┘
                         │ terminate
                         ▼
                    terminated
                  (інстанс видалено)

Стани та тарифікація:

pending → running: запуск (тарифікація починається у running)
running: тарифікується погодинно (або посекундно для Linux)
stopped: тарифікація EC2 зупинена, але EBS-диск продовжує тарифікуватися
terminated: всі ресурси звільнені, тарифікація припинена

3.2 Типи зупинки та перезапуску

Stop (Зупинка): инстанс зупиняється, дані на EBS-диску зберігаються. При наступному запуску може бути запущений на іншому фізичному хості (зміниться публічна IP-адреса, якщо не використовується Elastic IP).

Hibernate (Сплячий режим): стан оперативної пам’яті (RAM) записується на диск. При наступному запуску — відновлення з попередньього стану. Корисно для збереження тривалих обчислень.

Terminate (Завершення): інстанс знищується назавжди. Root EBS-диск видаляється (за замовчуванням); додаткові EBS-томи зберігаються.

Reboot (Перезавантаження): перезавантаження ОС без зміни хоста, IP-адреса зберігається.

3.3 Elastic IP

Elastic IP (EIP) — статична публічна IPv4-адреса, що залишається незмінною незалежно від зупинки/запуску інстансу.

Безкоштовна, поки прив’язана до запущеного інстансу
Тарифікується, якщо не прив’язана до запущеного інстансу (неефективне використання публічних IP)
Дозволяє «перемістити» публічну адресу на інший інстанс при failover

3.4 Зміна типу інстансу

EC2 підтримує вертикальне масштабування — зміну типу інстансу (більше vCPU та RAM):

Зупинити інстанс (stop)
Змінити тип (Change Instance Type)
Запустити інстанс (start)

Обмеження: не всі типи сумісні між собою (деякі вимагають специфічної мережевої картки або драйверів).

4. Автоматичне масштабування та групи доступності

4.1 Моделі масштабування

Вертикальне масштабування (Scale Up/Down): Збільшення/зменшення ресурсів одного інстансу (більший тип VM). Потребує перезапуску. Обмежене максимальним розміром доступних інстансів.

Горизонтальне масштабування (Scale Out/In): Додавання або видалення екземплярів. Набагато гнучкіше, не потребує downtime. Є основою хмарної масштабованості.

4.2 Auto Scaling Group (ASG)

Auto Scaling Group (ASG) — група EC2-інстансів, якою AWS керує автоматично відповідно до налаштованих правил.

Ключові параметри ASG:

Min capacity: мінімальна кількість інстансів (ASG ніколи не зменшиться нижче)
Desired capacity: бажана кількість інстансів у нормальному стані
Max capacity: максимальна кількість (ASG ніколи не перевищить)

Min: 2,  Desired: 4,  Max: 10

Нормально:     ██ ██ ██ ██          (4 інстанси)
Пік:           ██ ██ ██ ██ ██ ██   (6 інстансів — AWS додав 2)
Спад:          ██ ██               (2 інстанси — AWS видалив 2)
(нижче мін. не опускається)

4.3 Політики масштабування

Target Tracking Scaling (рекомендований): Підтримує цільовий показник метрики. Наприклад: «Тримати середнє використання CPU на рівні 60%». ASG автоматично додає або видаляє інстанси для досягнення цього показника.

Step Scaling (Ступінчасте): Різні дії залежно від порогового рівня.

CPU > 70% → додати 2 інстанси
CPU > 90% → додати 5 інстансів
CPU < 30% → видалити 1 інстанс

Scheduled Scaling (Планове): Масштабування у визначені дні та час:

Щодня о 8:00 → збільшити до 10 інстансів (початок robочого дня)
Щодня о 20:00 → зменшити до 2 інстансів (ніч)
Перед Чорною п’ятницею → збільшити до 50

Predictive Scaling: AWS використовує ML для прогнозування майбутнього навантаження на основі історичних даних та заздалегідь масштабує інфраструктуру.

4.4 Launch Template / Launch Configuration

Перед створенням ASG необхідно визначити Launch Template — шаблон конфігурації інстансу, що включає:

AMI ID
Тип інстансу (напр. m6i.large)
Security Groups
User Data (скрипт, що виконується при першому запуску)
IAM Instance Profile
EBS-конфігурація

4.5 Health Checks та автоматичне відновлення

ASG автоматично замінює нездорові інстанси:

EC2 або ELB (Load Balancer) позначає інстанс як нездоровий
ASG завершує нездоровий інстанс
ASG запускає новий інстанс на його місці

Приклад: У 3 годині ночі один із 5 веб-серверів виходить з ладу через kernel panic. ASG автоматично завершує його та запускає новий — без участі адміністратора.

4.6 Multi-AZ розгортання та Placement Groups

Multi-AZ для ASG: ASG рекомендується розгортати у двох або більше зонах доступності. При виході з ладу цілої AZ, ASG автоматично перезапустить потрібну кількість інстансів в інших AZ.

Placement Groups (Групи розміщення):

Тип	Опис	Застосування
Cluster	Усі інстанси — в одній AZ на сусідньому обладнанні. Мінімальна затримка між ними	HPC, низьколатентні кластери
Spread	Кожен інстанс — на окремому обладнанні. Максимальна ізоляція відмов	Критичні одиничні дузлові сервіси
Partition	Групи інстансів на різних «стелажах» обладнання	HDFS, Kafka, Cassandra

5. Спеціалізовані обчислювальні ресурси та моделі оплати

5.1 GPU-інстанси

Інстанси з GPU (Graphical Processing Unit) дозволяють виконувати масово-паралельні обчислення, що критично для:

Тренування нейронних мереж (deep learning)
Inference (застосування навчених моделей)
3D-рендеринг та обробка відео
Наукові симуляції

AWS GPU-інстанси:

p4d.24xlarge: 8× NVIDIA A100 80GB, 1.1 TB RAM, 400 Гбіт/с мережа — топ для ML-тренування
g5.48xlarge: 8× NVIDIA A10G 24GB — ML-inference та графіка
inf2.48xlarge: 12× AWS Inferentia2 — ефективний inference нейромереж (~40% дешевший за GPU)

5.2 AWS Graviton (ARM-процесори)

Amazon розробила власні ARM-процесори AWS Graviton для своїх EC2-інстансів:

Graviton 3 (g суфікс, напр. m7g, c7g) — до 40% кращий показник ціна/продуктивність порівняно з x86-аналогами
Підходить для більшості Linux-навантажень, Java, Python, Node.js
Не підходить для Windows, застосунків лише з x86-бінарниками

5.3 Моделі оплати EC2

On-Demand (За запитом):

Оплата за фактичну секунду/годину використання
Без зобов’язань та авансу
Найвища погодинна ціна
Підходить: нові невідомі навантаження, тимчасові потреби

Reserved Instances (Зарезервовані):

Зобов’язання на 1 або 3 роки → знижка 30–72% відносно On-Demand
Типи: Standard (найбільша знижка, фіксований тип), Convertible (менша знижка, можна змінювати тип)
Оплата: повна наперед, часткова, без авансу
Підходить: стабільне, передбачуване навантаження (виробничі системи, БД)

Savings Plans:

Гнучкіша альтернатива Reserved: зобов’язання у $$/год, а не конкретного типу інстансу
Compute Savings Plan: охоплює EC2 будь-якого типу + λ Lambda + Fargate
EC2 Instance Savings Plan: конкретна родина у конкретному регіоні, але будь-який розмір і ОС
Знижка до 66%

Spot Instances (Спотові):

Невикористані потужності AWS — до 90% дешевше за On-Demand
AWS може завершити інстанс у будь-який момент з попередженням 2 хвилини
Підходить: batch-обробка, ML-тренування, CI/CD, рендеринг, stateless навантаження
НЕ підходить: бази даних, критичні сервіси без механізму відновлення

Dedicated Hosts (Виділені хости):

Весь фізичний сервер — для одного клієнта
Відповідність регуляторним вимогам (деякі ліцензії ПЗ прив’язані до фізичних сокетів)
Найдорожча опція

Порівняння моделей оплати:

Модель	Відносна ціна	Переривання	Зобов’язання
On-Demand	100%	Немає	Немає
Savings Plans	34–66%	Немає	1–3 роки
Reserved	28–72%	Немає	1–3 роки
Spot	10–30%	Можливе	Немає
Dedicated Host	150%+	Немає	Немає або 1–3 роки

Висновки

IaaS та VM забезпечують клієнту максимальний контроль над обчислювальним середовищем — від вибору ОС до повного адміністрування стеку. Це оптимально для lift-and-shift міграцій, специфічних вимог до ОС та спеціалізованих навантажень.
Родини типів EC2 організовані за оптимізацією: загального призначення (m), обчислення (c), пам’ять (r), сховище (i), GPU (p/g). Правильний вибір типу безпосередньо впливає на продуктивність і вартість.
AMI — шаблон VM — є ключовим інструментом для стандартизації та швидкого розгортання. Golden AMI практика скорочує час підготовки нових серверів.
Auto Scaling Group реалізує горизонтальне масштабування автоматично, забезпечуючи еластичність та відмовостійкість. Поєднання ASG з Multi-AZ та Load Balancer є стандартом для production-розгортань.
Моделі оплати (On-Demand, Reserved, Savings Plans, Spot) дозволяють оптимізувати витрати: стабільні навантаження — Reserved/Savings Plans; непостійні — Spot + On-Demand. Комбінування моделей дає максимальну економію.

Джерела

AWS Documentation. (2024). Amazon EC2 User Guide for Linux Instances. https://docs.aws.amazon.com/ec2/
AWS Documentation. (2024). Amazon EC2 Auto Scaling User Guide. https://docs.aws.amazon.com/autoscaling/
Microsoft. (2024). Azure Virtual Machines Documentation. https://learn.microsoft.com/en-us/azure/virtual-machines/
Google Cloud. (2024). Compute Engine Documentation. https://cloud.google.com/compute/docs
Linthicum, D. (2020). Cloud Computing and SOA Convergence in Your Enterprise. Addison-Wesley.
Fehling, C., Leymann, F., Retter, R., Schupeck, W., & Arbitter, P. (2014). Cloud Computing Patterns. Springer.
Varia, J., & Mathew, S. (2014). Overview of Amazon Web Services. AWS Whitepaper.

Запитання для самоперевірки

У яких сценаріях IaaS є кращим вибором, ніж PaaS? Наведіть три конкретних приклади.
Що таке гіпервізор? Яку роль він відіграє у роботі хмарних VM? Які гіпервізори використовують AWS, Azure та GCP?
Розшифруйте тип EC2-інстансу r6g.2xlarge. Що означає кожна частина найменування?
Що таке AMI? Поясніть концепцію «Golden AMI image» та її переваги для корпоративних середовищ.
Яка різниця між зупинкою (stop) та завершенням (terminate) EC2-інстансу? Які ресурси продовжують тарифікуватися при зупинці?
Що таке Auto Scaling Group? Поясніть параметри min/desired/max capacity та їхній вплив на поведінку ASG.
Порівняйте три типи політик масштабування ASG (Target Tracking, Step Scaling, Scheduled Scaling). Для якого сценарію підходить кожен тип?
Що таке Spot Instances? Яку головну відмінність мають від On-Demand? For яких навантажень вони підходять, а для яких — ні?
Порівняйте Reserved Instances та Savings Plans за критеріями гнучкості та знижки.
У чому полягає перевага AWS Graviton (ARM) інстансів порівняно з x86-аналогами? Чи є обмеження?