Дедуплікація даних є процес, який усуває надмірні копії даних і значно зменшує вимоги до ємності. Дедуплікацію можна запускати як вбудований процес, коли дані записуються в систему зберігання, та/або як фоновий процес для усунення дублікатів після запису даних на диск.
Приклад дедуплікації даних Якщо платформа електронної пошти створена резервна копія або заархівована, усі 100 екземплярів зберігаються, вимагаючи 100 МБ місця для зберігання. При дедуплікації даних зберігається лише один екземпляр вкладення; кожен наступний екземпляр посилається на одну збережену копію.
Дедуплікація може допоможе заощадити кошти за рахунок зменшення обсягу пам’яті, необхідного як для повсякденної діяльності, так і для резервного копіювання чи архівування.
Як працює дедуплікація даних?
- Перевірте файлову систему на наявність файлів, які відповідають політиці оптимізації.
- Розбивайте файли на фрагменти змінного розміру.
- Визначте унікальні блоки.
- Помістіть шматки в сховище для шматків і за бажанням стисніть.
- Замініть оригінальний файловий потік тепер оптимізованих файлів точкою повторного аналізу до сховища фрагментів.
Дедуплювання даних перед запуском процесу перевірки може значно скоротити час обробки, заощадивши гроші та звільнивши потужності для наступного важливого проекту.
Недоліки дедуплікації Втрата цілісності даних через неправильне зіставлення – Якщо дані неправильно зіставляються під час процесу дедуплікації, їх не можна буде отримати без втрат. Це може призвести до втрати даних під час процесу «декодування» дедуплікації.