Apa itu Deduplikasi Data?

Deduplikasidataadalah teknik untuk mengompresi data di mana data duplikat dihapus, mempertahankan satu salinan dari setiap unit informasi pada suatu sistem daripada membiarkan banyak data berkembang.Salinan yang disimpan memiliki referensi yang memungkinkan sistem untuk mengambilnya.Teknik ini mengurangi kebutuhan akan ruang penyimpanan dan dapat membuat sistem berjalan lebih cepat selain membatasi biaya yang terkait denganpenyimpanan data.Ini dapat bekerja dalam beberapa cara dan digunakan pada banyak jenis sistem komputer.

Wanita melakukan handstand dengan komputer

Dalam deduplikasi data tingkat file, sistem mencari file duplikat dan menghapus ekstra.Deduplikasi tingkat blok melihat blok data di dalam file untuk mengidentifikasi data asing.Orang dapat berakhir dengan data berlipat ganda karena berbagai alasan, dan menggunakan deduplikasi data dapat merampingkan sistem, membuatnya lebih mudah digunakan.Sistem dapat secara berkala memeriksa data untuk memeriksa duplikat, menghilangkan tambahan, dan menghasilkan referensi untuk file yang tertinggal.

Sistem seperti itu kadang-kadang disebut sebagai sistem kompresi cerdas, atausistempenyimpanan instans tunggal.Kedua istilah tersebut merujuk pada gagasan bahwa sistem bekerja secara cerdas untuk menyimpan dan mengarsipkan data untuk mengurangi beban pada sistem.Deduplikasi data dapat sangat berharga dengan sistem besar di mana data dari sejumlah sumber disimpan dan biaya penyimpanan terus meningkat, karena sistem perlu diperluas dari waktu ke waktu.

Sistem ini dirancang untuk menjadi bagian dari sistem yang lebih besar untuk mengompresi dan mengelola data.Penggandaan data tidak dapat melindungi sistem dari virus dan kesalahan, dan penting untuk menggunakan perlindungan antivirus yang memadai untuk menjaga sistem tetap aman dan membatasi kontaminasi virus pada file sambil juga mencadangkan di lokasi terpisah untuk mengatasi kekhawatiran tentangkehilangan datakarena pemadaman, kerusakan pada peralatan, dan lain sebagainya.Memampatkan data sebelum mencadangkan akan menghemat waktu dan uang.

Sistem yang memanfaatkan deduplikasi data dalam penyimpanannya dapat berjalan lebih cepat dan efisien.Mereka masih akan memerlukan ekspansi berkala untuk mengakomodasi data baru dan untuk mengatasi masalah keamanan, tetapi mereka seharusnya tidak terlalu cepat terisi dengan data duplikat.Ini adalah masalah yang sangat umum di server email, di mana server dapat menyimpan data dalam jumlah besar untuk pengguna dan bagian yang signifikan dapat terdiri dari duplikat seperti lampiran yang sama berulang-ulang;misalnya, banyak orang yang mengirim email dari kantor telah melampirkan footer dengan penafian email dan logo perusahaan, dan ini dapat menghabiskan ruang server dengan cepat.