Зміст:
Визначення - Що означає SQL на Hadoop?
SQL on Hadoop - це тип інструменту аналітичного застосування - реалізація SQL на платформі Hadoop, яка поєднує стандартний запит у структурі даних у стилі SQL із рамкою даних Hadoop. Hadoop - це відносно нова платформа, як і самі великі дані, і не багато професіоналів є фахівцями в цьому, але SQL на Hadoop спрощує доступ до фреймворку Hadoop і полегшує її реалізацію в сучасних корпоративних системах.
Техопедія пояснює SQL на Hadoop
SQL на Hadoop відноситься до різних реалізацій SQL для платформи Hadoop. MapReduce, який є картографом завдань і організатором результатів Hadoop, підтримує SQL як основний випадок використання, так і інші методи обробки. Тому має сенс створити потужні інструменти для дозволу SQL, який є однією з найбільш широко використовуваних мов для запитів і маніпуляцій із базами даних. Оскільки Hadoop набирає популярності для архітектури даних підприємств, SQL є ключовим для правильного прийняття як слабко структурованих даних, так і структурованих даних, що використовуються в Hadoop.
У драйвери ключових драйверів Hadoop входять:
- Використання існуючих навичок SQL, присутніх у більшості організацій
- Повторне використання навантаження на трансформацію екстракту (ETL), бізнес-аналітики (BI) та аналітичні інвестиції в Hadoop
Деякі реалізації SQL на Hadoop включають:
- Apache Spark SQL
- Apache вулик
- Apache Tajo
- Дриль Apache
- HP Vertica на MapR
- ODBC драйвери
- Престо
- Акула
