Q:
Які міркування є найважливішими при вирішенні, які рішення для великих даних використовувати?
A:Кожен бізнес та організація повинні враховувати власні потреби та ресурси, визначаючи, які питання є найбільш важливими для впровадження великих даних. Однак існує низка принципів, які, як правило, вважаються критичними для такого типу впровадження технології.
Вебінар: Big Iron, Знайомтеся з великими даними: Звільнення даних основних систем за допомогою Hadoop & Spark Зареєструйтесь тут |
Одне з найбільших питань - це впровадження та кількість зривів, які він спричинить. Користувачі великих систем даних завжди повинні порівнювати те, що вони збираються використовувати, з тим, що вони зараз використовують. У багатьох випадках зрив є вирішальним фактором того, чи збираються великі ресурси даних для підвищення продуктивності та прибутку, або направляють бізнес, що припиняється, через непереборні перешкоди з впровадженням. Підтримка постачальників (або її відсутність) має багато спільного з цим, але підприємствам також доводиться дивитись на криву навчання технологій, наскільки вони б змінили роботу застарілих систем, і взагалі, чи зміни є чимось, що підприємство може впоратися.
Ще одне важливе питання - які дані є найбільш цінними для бізнесу чи організації. Вивчаючи значення різних наборів даних, ті, хто має намір реалізувати великі дані, можуть встановити обсяг свого проекту. Без таких видів настанов великі проекти даних можуть бути роздуті та переповнені на підприємстві. Експерти рекомендують зосередитись на конкретних наборах даних, які даватимуть найбільшу цінність, не зациклюючись на литті ширшої мережі.
Слідчим питанням є використання структурованих та неструктурованих даних. Бізнес-лідери можуть розглянути рівень складності отримання різних бітів даних у такий великий контекст даних, як центр обробки даних. Наприклад, вже відформатовані набори даних можна легко засвоїти, але деякі інші фрагменти даних можуть потребувати масштабних маніпуляцій, щоб перетворити їх у корисний формат, і це може не варто.
Усиновлювачам також доведеться звернути увагу на удосконалену обробку великих даних. Системи великих даних визначаються як такі, які важко обробляти основними та простими апаратними та програмними інфраструктурами. Це означає, що усиновлювачі повинні мати адекватний талант і ресурси під рукою, щоб знайти способи використання великих наборів даних, які не спричинять перевантаженість мережі або іншим чином створювати вузькі місця в операціях.