Зміст:
- Визначення - Що означає дедуплікація після обробки даних (PPD)?
- Техопедія пояснює дедупликацію після обробки (PPD)
Визначення - Що означає дедуплікація після обробки даних (PPD)?
Дедуплікація після процесу (PPD) відноситься до системи, де програмні процеси фільтрують зайві дані з набору даних після їх перенесення в місце зберігання даних. Це також можна назвати асинхронним дедупликацією, і його часто використовують, коли менеджери вважають неефективним або нездійсненним видалення зайвих даних до або під час передачі.
Техопедія пояснює дедупликацію після обробки (PPD)
Дедупликація після процесу може протиставлятися практиці, яка називається поточною дедупликацією, коли надлишкові дані виймаються під час передачі даних для зберігання. Однією з причин того, що адміністратори можуть вибрати підхід до дедупликації після процесу, - це те, що вбудована дедупликація може уповільнити процес передачі та ускладнити легке та ефективне архівування даних.
Хоча менеджерам або адміністраторам може бути легше використовувати метод дедупликації після процесу, є недоліки в цьому типі оптимізації даних. Один з них полягає в тому, що для місця зберігання даних потрібно мати достатньо місця для розміщення більшого нефільтрованого набору даних. Якщо припустити, що менеджери даних мають достатньо місця для зберігання даних і що аналіз даних у сховищі не представляє технічних труднощів, метод дедупликації після обробки часто може бути бажаним способом очищення набору даних для подальшого використання після того, як він уже ретельно укладений "зберігання в холоді".