Зміст:
Визначення - Що означає паралельний аналіз даних?
Паралельний аналіз даних - це метод аналізу даних за допомогою паралельних процесів, які працюють одночасно на декількох комп'ютерах.
Цей процес використовується при аналізі великих наборів даних, таких як великі записи телефонних викликів, мережеві журнали та веб-сховища для текстових документів, які можуть бути занадто великими, щоб розміщуватися в єдиній реляційній базі даних. Метод часто використовується в аналізі даних великих даних та загальному аналізі даних.
Техопедія пояснює паралельний аналіз даних
Основна концепція паралельного аналізу даних - паралелізм, визначений в обчислювальній системі як одночасне виконання процесів.
Це часто досягається за допомогою декількох процесорів або навіть декількох комп'ютерів і є звичайною практикою розподілених обчислень. При паралельному аналізі даних різні комп'ютери, що виконують різні аспекти аналізу даних, одночасно виконують ці процеси, а потім згодом консолідують результати в єдиний великий звіт.
Причина цього паралелізму полягає в основному в тому, щоб зробити аналіз швидшим, але це також тому, що деякі набори даних можуть бути занадто динамічними, занадто великими або просто занадто громіздкими, щоб ефективно розміщуватися в одній реляційній базі даних. Результатом було б те, що ці набори даних розміщуються в різних базах даних, оптимізованих для такого типу даних, і в різних машинах, тому лінійний аналіз просто не буде ефективним варіантом.




