Будинки Бази даних Що таке брудні дані? - визначення з техопедії

Що таке брудні дані? - визначення з техопедії

Зміст:

Anonim

Визначення - Що означає брудні дані?

Брудні дані стосуються даних, що містять помилкову інформацію. Він також може бути використаний при посиланні на дані, які є в пам'яті та ще не завантажені в базу даних. Повне видалення брудних даних з джерела недоцільно або практично неможливо.

Наступні дані можна вважати брудними даними:

  • Оманливі дані
  • Дублювання даних
  • Неправильні дані
  • Неточні дані
  • Неінтегровані дані
  • Дані, що порушують правила ведення бізнесу
  • Дані без узагальненого форматування
  • Неправильно пунктировані або написані дані

Техопедія пояснює брудні дані

Крім неправильного введення даних, брудні дані можуть генеруватися через неправильні методи управління та зберігання даних. Деякі типові дані пояснюються нижче:

  • Неправильні дані - Щоб переконатися у правильності або правильності даних, введене значення повинно відповідати дійсним значенням поля. Наприклад, значення, введене в полі місяця, має становити від 1 до 12, або вік особи повинен бути менше 130. Правильність значення даних може бути запрограмована програмно за допомогою таблиць пошуку або за допомогою чеків редагування.
  • Неточні дані - Можливо, що значення даних може бути правильним, але не точним. Інколи практично перевіряти інші файли чи поля, щоб з’ясувати, чи точно значення даних в залежності від використовуваного контексту. Однак точність часто може бути підтверджена лише вручну.
  • Порушення бізнес-правил - Дані, що порушують бізнес-правила, - це ще один тип брудних даних. Наприклад, дата набуття чинності завжди повинна наставати до дати закінчення терміну дії. Іншим прикладом порушення правил ділових правил може бути претензія на страхування Medicare від пацієнта, коли пацієнт може ще не досягти пенсійного віку та не має права на Medicare.
  • Невідповідні дані - Неперевірене надмірність даних призводить до невідповідностей даних. Кожна організація впливає на суперечливі та повторювані дані. Це особливо характерно для даних про клієнтів.
  • Неповні дані - Основними видами неповних даних є дані з відсутніми значеннями.
  • Дублікати даних - повторювані дані можуть виникати через неодноразові подання, неправильне приєднання даних або помилка користувача.

Для підвищення якості даних та запобігання забрудненню даних організації повинні включати методики для забезпечення повноти, обгрунтованості, послідовності та правильності даних.

Що таке брудні дані? - визначення з техопедії