Будинки Тенденції Як існуючі середовища зберігання даних найкращим чином можуть відповідати потребам аналітики великих даних?

Як існуючі середовища зберігання даних найкращим чином можуть відповідати потребам аналітики великих даних?

Anonim

Q:

Як існуючі середовища зберігання даних найкращим чином можуть відповідати потребам аналітики великих даних?

A:

Окремі проекти сховищ даних повинні оцінюватися у кожному конкретному випадку. Як правило, намагаючись розтягнути існуючий дизайн сховища даних для кращого аналізу великої аналітики даних, є основний процес для з'ясування того, що потрібно зробити. ІТ-професіонали можуть назвати це "масштабуванням" або "масштабуванням".

Вебінар: Big Iron, Знайомтеся з великими даними: Звільнення даних основної системи за допомогою Hadoop & Spark

Зареєструйтесь тут

Масштабування зазвичай передбачає отримання достатньої потужності для обробки, отримання достатнього обсягу пам’яті та розміщення більш потужних серверних заходів для обробки всіх великих наборів даних, які бізнес обробляє. Навпаки, масштабування може означати збір кластерів апаратного забезпечення сервера та обмінювання ними мережею для отримання великих даних.

Деякі ІТ-експерти припустили, що більш поширеним методом з Apache Hadoop та іншими популярними інструментами та платформами великих даних є масштабування та об'єднання апаратних засобів для досягнення бажаних ефектів. Однак інші зазначають, що за сучасних технологій сховище даних може масштабуватися за допомогою стратегії закупівель, яка додає ресурси для сервера, наприклад, отримуючи більшу кількість ядер обробки разом із більшим обсягом оперативної пам’яті.

Незалежно від того, незалежно від їх масштабування чи масштабування, сховища даних потребують додаткових засобів фізичного обладнання, щоб можна було обробляти більші навантаження даних. Вони також потребують додаткового управління людьми, а це означає більшу підготовку внутрішніх команд. Для планування проекту необхідно визначити, який стрес і тиск матимуть більші навантаження на дані на існуючу спадщину, щоб використати її для нової екосистеми великих даних. Важливою проблемою є вузькі місця зберігання даних, які потребують оновлення центрів зберігання даних, та інші види вузьких місць, які можуть виправити зароджувану систему, якщо їх не вирішити.

Як існуючі середовища зберігання даних найкращим чином можуть відповідати потребам аналітики великих даних?