Зміст:
Визначення - Що означає схема «Читання»?
Схема читання стосується інноваційної стратегії аналізу даних у нових інструментах обробки даних, таких як Hadoop та інших більш задіяних технологіях баз даних. У схемі з читанням дані застосовуються до плану чи схеми під час витягування із збереженого місця, а не під час його вступу.
Техопедія пояснює схему на читання
Старі технології баз даних мали стратегію введення схеми при записі - іншими словами, дані потрібно було застосувати до плану або схеми, коли вони надходили в базу даних. Це було зроблено частково для забезпечення узгодженості даних, і це є однією з головних переваг схеми при записі. Маючи схему зчитування, особам, які обробляють дані, можливо, доведеться зробити більше роботи для виявлення кожного фрагмента даних, але є набагато більше універсальності.
Принципово, схема, прочитана на схемі, доповнює основні використання Hadoop та пов'язаних з ними інструментів. Компанії хочуть ефективно агрегувати багато даних і зберігати їх для конкретного використання. Зважаючи на це, вони можуть цінувати збір нечистих чи непослідовних даних більше, ніж вони цінують суворий режим застосування даних. Іншими словами, Hadoop може вмістити в себе широкий спектр різних невеликих бітів даних, які можуть бути не повністю організованими. Потім, коли ця інформація використовується, вона впорядковується. Застосування старої системи баз даних на схемі запису означало б, що менш організовані дані, ймовірно, будуть викинуті.
Інший спосіб зробити це, що схема запису краще для отримання дуже чистих та послідовних наборів даних, але ці набори даних можуть бути більш обмеженими. Схема читання розгортає широку мережу та дозволяє більш універсальну організацію даних. Експерти також зазначають, що простіше створити два різних представлення одних і тих же даних із схемою на прочитане.
Ця стратегія читання схем є однією з важливих частин того, чому Hadoop та пов'язані з ними технології настільки популярні в сучасній технології підприємств. Підприємства використовують велику кількість необроблених даних для живлення всіх видів бізнес-процесів, застосовуючи нечітку логіку та інші системи сортування та фільтрації, що включають корпоративні сховища даних та інші великі активи даних.