Зміст:
Визначення - Що означає екосистема Hadoop?
Екосистема Hadoop стосується різних компонентів бібліотеки програмного забезпечення Apache Hadoop, а також аксесуарів та інструментів, наданих Фондом програм Apache Software для цих типів програмних проектів, та способів спільної роботи.
Hadoop - це база на Java, яка надзвичайно популярна для обробки та аналізу великих наборів даних.
Техопедія пояснює екосистему Hadoop
Як основний пакет Hadoop, так і його аксесуари - це здебільшого проекти з відкритим кодом, ліцензовані Apache. Ідея екосистеми Hadoop передбачає використання різних частин основного набору Hadoop, таких як MapReduce, рамок для обробки великої кількості даних та розподіленої файлової системи Hadoop (HDFS), складної системи обробки файлів. Є також YARN, менеджер ресурсів Hadoop.
На додаток до цих основних елементів Hadoop, Apache також постачав інші види аксесуарів або додаткових інструментів для розробників. До них належить Apache Hive, інструмент аналізу даних; Apache Spark, загальний двигун для обробки великих даних; Apache Pig, мова потоку даних; HBase, інструмент бази даних; а також Ambarl, якого можна вважати менеджером екосистеми Hadoop, оскільки він допомагає одночасно керувати використанням цих різних ресурсів Apache. Коли Hadoop стає фактичним стандартом для збору даних і стає всюдисущим у багатьох організаціях, менеджери та керівники розробок дізнаються все про екосистему Hadoop та які види речей, що беруть участь у загальних налаштуваннях Hadoop.