Зміст:
Kudu - новий проект з відкритим кодом, який забезпечує оновлення пам’яті. Це доповнення до HDFS / HBase, що забезпечує послідовне зберігання та лише для читання. Kudu більше підходить для швидкої аналітики на швидких даних, що зараз є попитом бізнесу. Тож Kudu - це не просто ще один проект екосистеми Hadoop, а навпаки, має потенціал змінити ринок. (Докладніше про Hadoop див. У 10 найважливіших умовах Hadoop, які потрібно знати та розуміти.)
Що таке Куду?
Kudu - це особливий вид системи зберігання, який зберігає структуровані дані у вигляді таблиць. Кожна таблиця має кількість стовпців, які визначені заздалегідь. Кожен з них має первинний ключ, який фактично є групою одного або декількох стовпців цієї таблиці. Цей первинний ключ зроблений для додавання обмеження та захисту стовпців, а також працює як індекс, що дозволяє легко оновлювати та видаляти. Ці таблиці представляють собою низку підмножин даних, що називаються планшетами.
Який сучасний статус Куду?
Куду справді добре розвинений і вже поєднаний з великою кількістю функцій. Однак все-таки знадобиться певна полірування, яку можна зробити простіше, якщо користувачі запропонують і внесуть якісь зміни.