Java Software Engineer

Kafka. ZooKeeper. Raft

27 лютого 5 хв читати

Apache Kafka, популярна система обробки потокових даних, зробила значний крок у своєму розвитку, вирішивши перейти від використання Apache Zookeeper до власної реалізації протоколу консенсусу, відомого як KRaft (Kafka Raft). Це рішення має значні наслідки для архітектури та управління Kafka.

Консенсус

Консенсус в розподілених системах — це фундаментальний принцип, який дозволяє декільком взаємопов'язаним вузлам (або процесам) у системі досягти загальної домовленості щодо певних даних або стану системи, незважаючи на наявність помилок або відмов деяких вузлів. Цей принцип є ключовим для забезпечення надійності та послідовності в розподілених системах, таких як блокчейни, бази даних, системи управління версіями тощо. Протоколи консенсусу, такі як Paxos, Raft, або Zab, дозволяють системі продовжувати роботу коректно, навіть коли деякі компоненти відмовляють або існують мережеві розриви, забезпечуючи, що всі підняті вузли мають консистентний вигляд даних.

Основні аспекти консенсусу в розподілених системах включають:

Узгодженість (Agreement): Всі коректні вузли системи мають погодитися на одне й те саме значення або рішення.
Стійкість до відмов (Fault Tolerance): Система повинна забезпечувати консенсус навіть у присутності відмов частини вузлів. Це означає, що система може витримувати певну кількість відмов (зазвичай меншу половину вузлів) без втрати здатності досягати консенсусу.
Живучість (Liveness): Система повинна забезпечити, що кожен коректний запит на досягнення консенсусу буде врешті-решт завершений.
Відсутність блокувань (Non-blocking): Процес досягнення консенсусу не повинен назавжди застрягти в стані, де рішення не може бути прийняте.

А що таке розподілена система?

Розподілена система — це група комп'ютерів, що працюють разом, як єдине ціле, для досягнення спільної мети. Ці комп'ютери (вузли) можуть бути фізично розташовані в одному центрі обробки даних або розкидані по всьому світу. Розподілені системи дозволяють обробляти більші обсяги даних, забезпечувати високу доступність послуг шляхом реплікації даних та обчислювальних ресурсів, а також підвищити витривалість системи за рахунок толерантності до відмов окремих компонентів.

Zookeeper

Apache Zookeeper — це централізована служба для зберігання конфігурацій, неймінгу, синхронізації та надання групових послуг. Вона використовується для координації між вузлами в розподіленій системі. У контексті Kafka, Zookeeper використовувався для управління метаданими кластера (такими як інформація про топіки, партиції, репліки та їх статуси) та вибору лідера серед реплік.

Перехід до KRaft

Рішення Kafka перейти на використання KRaft замість Zookeeper було мотивовано декількома факторами:

Спрощення архітектури: Видалення залежності від Zookeeper дозволяє спростити розгортання та управління Kafka, усуваючи потребу у додатковому компоненті та можливих точок збою.
Покращення продуктивності: Власний протокол консенсусу може бути тісно інтегрований з логікою Kafka, забезпечуючи кращу продуктивність та масштабованість.
Контроль та оптимізація: Розробка протоколу KRaft надає команді Kafka більше можливостей для контролю та оптимізації протоколу консенсусу. Вони можуть адаптувати протокол до специфічних потреб та сценаріїв використання Kafka, що може сприяти покращенню загальної ефективності та надійності системи.

Що таке Raft?

Raft — це протокол консенсусу, який був розроблений як більш проста альтернатива іншим протоколам, наприклад Paxos. Його основне завдання полягає в забезпеченні узгодженого стану між вузлами у розподіленій системі, що дозволяє системі залишатися стійкою до збоїв окремих вузлів. Основою Raft є механізм 'вибору лідера', який гарантує, що в кожний момент часу існує один вузол-лідер, відповідальний за управління процесом реплікації даних між вузлами, з метою досягнення консистентності інформації в усьому кластері.

Концепція 'вибору лідера' полягає в автоматичному виборі одного вузла кластера, який тимчасово виконує роль координатора між усіма вузлами. Цей лідер відповідає за прийняття оновлень і координування процесу їх реплікації до інших вузлів, забезпечуючи, щоб усі вузли мали однаковий, актуальний стан даних.

Відмінності між Zookeeper і Raft

Концепція та архітектура: Zookeeper був розроблений як загальний інструмент для координації розподілених систем, тоді як Raft спеціально призначений для забезпечення консенсусу в таких системах.
Спрощення vs універсальність: Raft надає більш простий підхід до досягнення консенсусу, зосереджуючись на легкості розуміння та реалізації. Zookeeper, навпаки, пропонує більш універсальні можливості координації, що може призвести до більшої складності в конфігурації та управлінні.
Інтеграція з Kafka: Перехід до KRaft дозволяє Kafka тісніше інтегрувати логіку консенсусу з внутрішніми процесами системи, забезпечуючи кращу продуктивність та масштабованість.

Java Computer Science Networking Kafka Distributed Systems

Статті про вітчизняний бізнес та цікавих людей:

FARVATER@farvater.travel
Тури на острів Крит: як обрати область, сезон і готель під свій формат відпочинку
На Криті є одразу і довгі пляжі, і гори з ущелинами, і мінойські палаци, і таверни, де вечеря непомітно триває до півночі.
Дата публікації: 22 год томуЧас на прочитання: 8 хв читати
Теми цього довгочиту:
Тур На Крит
Mate Academy@mate.academy
Front-end розробник: які навички потрібні для старту кар'єри у 2026 році
Дізнайтеся, хто такий Front-end developer, які технології потрібно знати у 2026 році, скільки заробляють фронтенд-розробники та як розпочати кар'єру з нуля.
Дата публікації: учораЧас на прочитання: 4 хв читати
Теми цього довгочиту:
Front-end Розробник
Art Light@art_light
Об’ємні букви з підсвічуванням: ефектне оформлення фасаду та інтер’єру
Вивіска має вирішувати два завдання: виділяти заклад на вулиці та легко зчитуватися з будь-якого кута. Об’ємні світлові літери справляються з цим найефективніше. Це простий і зрозумілий орієнтир, який веде людину з вулиці прямо до ваших дверей.
Дата публікації: 3 дн. томуЧас на прочитання: 4 хв читати
Теми цього довгочиту:
Вивіски
A
A-Radio@a_radio
Які інструменти потрібні для професійного монтажу кабелів та електропроводки
Монтаж кабельних ліній часто здається нескладною роботою, поки не доводиться виконувати її на практиці. Саме тому досвідчені монтажники приділяють увагу не лише якості кабелю, а й інструментам, які використовуються в процесі. Особливо, інструментам для зняття ізоляції з кабелів.
Дата публікації: 3 дн. томуЧас на прочитання: 4 хв читати
Теми цього довгочиту:
Електроінструменти
Вчасно.Каса@kasa.vchasno.com.ua
Як працює розподіл оплати між готівкою та карткою в одному чеку
Чи можна поєднувати готівку та оплату карткою в одному чеку, як це працює в ПРРО та яких помилок варто уникати
Дата публікації: 4 дн. томуЧас на прочитання: 4 хв читати
Теми цього довгочиту:
Прро

Поділись своїми ідеями в новій публікації.
Ми чекаємо саме на твій довгочит!

Написати

Oleksandr Klymenko@overpathz

Java Software Engineer

40Довгочити

9.3KПерегляди

103Підписники

На Друкарні з 19 квітня 2023

Більше від автора

Java Memory Model ↔ PostgreSQL MVCC: один і той самий фундамент конкурентності
Java Memory Model та PostgreSQL MVCC/Isolation Levels — це дві відповіді на одне й те саме фундаментальне питання: за яких умов зміна, зроблена одним учасником (потоком / транзакцією), стає видимою для іншого?
Дата публікації: 15 лютогоЧас на прочитання: 21 хв читати
Теми цього довгочиту:
Java
Коли використовувати JSONB у реляційній БД?
Проблема: Ви інтегруєтесь із зовнішнім сервісом, чий API змінюється кожні кілька місяців.
Дата публікації: 18 грудняЧас на прочитання: 4 хв читати
Теми цього довгочиту:
Sql
Як виконується SQL-запит
Сьогодні розберемо, що відбувається з вашим SELECT * FROM users WHERE age > 21 перед тим, як БД поверне вам дані
Дата публікації: 6 грудняЧас на прочитання: 9 хв читати
Теми цього довгочиту:
Computer Science

Це також може зацікавити:

Edgar@avuzi
🔥 How to deep clone / copy complex objects in Kotlin or Java using MapStruct
Have you ever stumbled upon the challenge of copying complex, nested Java/ Kotlin data structures without losing your mind or cluttering your codebase with tedious boilerplate? You’re not alone.
Дата публікації: 16 квітняЧас на прочитання: 4 хв читати
Теми цього довгочиту:
Java
Yaroslav Kutsela@penrose
Аспектно орієнтоване програмування в Java
Стаття про детальний огляд AOP в Java. Weaving: CTW, LTW, RTW. Способи використання. Порівняння інструментів, пояснення анотацій, конфігурування, термінологія.
Дата публікації: 2 березняЧас на прочитання: 15 хв читати
Теми цього довгочиту:
Java
Михайло Шевченко@mike_shevchenko
MVC vs WebFlux: Усе, що потрібно знати для правильного вибору
Web MVC — динозавр чи надійний ветеран? WebFlux — хайп чи майбутнє Java? Якщо вагаєшся, що обрати для веб-проєкту, настав час розкласти все по поличках.
Дата публікації: 2 липняЧас на прочитання: 8 хв читати
Теми цього довгочиту:
Java

Java Memory Model ↔ PostgreSQL MVCC: один і той самий фундамент конкурентності

Теми цього довгочиту:

Коли використовувати JSONB у реляційній БД?

Теми цього довгочиту:

Як виконується SQL-запит

Теми цього довгочиту:

Консенсус

А що таке розподілена система?

Zookeeper

Перехід до KRaft

Що таке Raft?

Відмінності між Zookeeper і Raft

Статті про вітчизняний бізнес та цікавих людей:

Тури на острів Крит: як обрати область, сезон і готель під свій формат відпочинку

Теми цього довгочиту:

Front-end розробник: які навички потрібні для старту кар'єри у 2026 році

Теми цього довгочиту:

Об’ємні букви з підсвічуванням: ефектне оформлення фасаду та інтер’єру

Теми цього довгочиту:

Які інструменти потрібні для професійного монтажу кабелів та електропроводки

Теми цього довгочиту:

Як працює розподіл оплати між готівкою та карткою в одному чеку

Теми цього довгочиту:

Більше від автора

Java Memory Model ↔ PostgreSQL MVCC: один і той самий фундамент конкурентності

Теми цього довгочиту:

Коли використовувати JSONB у реляційній БД?

Теми цього довгочиту:

Як виконується SQL-запит

Теми цього довгочиту:

Це також може зацікавити:

🔥 How to deep clone / copy complex objects in Kotlin or Java using MapStruct

Теми цього довгочиту:

Аспектно орієнтоване програмування в Java

Теми цього довгочиту:

MVC vs WebFlux: Усе, що потрібно знати для правильного вибору

Теми цього довгочиту:

Коментарі (0)

Це також може зацікавити:

🔥 How to deep clone / copy complex objects in Kotlin or Java using MapStruct

Теми цього довгочиту:

Аспектно орієнтоване програмування в Java

Теми цього довгочиту:

MVC vs WebFlux: Усе, що потрібно знати для правильного вибору

Теми цього довгочиту: