Зміст:
Визначення - Що означає попередня обробка даних?
Попередня обробка даних - це техніка обміну даними, яка передбачає перетворення необроблених даних у зрозумілий формат. Дані в реальному світі часто неповні, непослідовні та / або відсутні у певній поведінці чи тенденціях і, ймовірно, містять багато помилок. Попередня обробка даних - це перевірений метод вирішення таких питань. Попередня обробка даних готує вихідні дані для подальшої обробки.
Попередня обробка даних використовується додатками, керованими базами даних, такими як управління відносинами з клієнтами та додатки на основі правил (наприклад, нейронні мережі).
Техопедія пояснює попередню обробку даних
Під час попередньої обробки дані проходять ряд кроків:
- Очищення даних: дані очищаються за допомогою таких процесів, як заповнення пропущених значень, згладжування галасливих даних або усунення невідповідностей у даних.
- Інтеграція даних: Дані з різними поданнями складаються разом і конфлікти всередині даних вирішуються.
- Трансформація даних: Дані нормалізуються, агрегуються та узагальнюються.
- Скорочення даних: Цей крок спрямований на подання зменшеного представлення даних у сховищі даних.
- Дискретизація даних: включає в себе зменшення ряду значень безперервного атрибута шляхом ділення діапазону інтервалів атрибутів.
