Ilmu data

ilmu Data adalah disiplin yang studi di mana itu berasal dari basis pengetahuan tertentu. Ini juga membahas bagaimana sumber daya ini dapat ditafsirkan dan direpresentasikan untuk penggunaan yang produktif.

Artinya, ilmu data adalah yang terkait dengan pengelolaan database, disimpan dalam file digital, dari mana banyak informasi yang berguna dapat diekstraksi sebagai indikator statistik. Ini dapat membantu, misalnya, sebuah perusahaan untuk membuat keputusan bisnis.

Demikian juga, ilmu data menyediakan alat yang memungkinkan tidak hanya untuk menafsirkan, tetapi juga untuk mewakili, misalnya, dalam gambar, data yang tersedia. Jadi, kita memiliki histogram , diagram batang, diagram lingkaran, dan lainnya.

Seperti yang dapat disimpulkan, ilmu ini bersifat interdisipliner karena mencakup pengetahuan matematika, statistik dan ilmu komputer, terutama.

Ilmu data dan tipe data

Perlu juga dicatat bahwa ilmu data dapat bekerja dengan dua jenis data:

  • Terstruktur: Adalah tabel yang tersusun, seperti tabel dengan kolom yang berbeda, masing-masing dengan kategori yang berbeda seperti: nama, nama keluarga, usia, nomor dokumen identitas, dll.
  • Tidak terstruktur: Mereka yang tidak sesuai dengan format tertentu seperti, misalnya, teks yang ditulis secara bebas. Dalam hal ini, Anda perlu menafsirkan konten dan mengekstrak data yang dapat dikelola.

Mempertimbangkan semua yang telah dijelaskan, para profesional yang berspesialisasi dalam ilmu data tidak hanya harus memiliki keterampilan analitis, tetapi juga harus dapat mengkomunikasikan isi informasi yang telah mereka proses.

Pentingnya ilmu data

Ilmu data penting bagi perusahaan atau institusi yang harus bekerja dengan data dalam jumlah besar. Dengan demikian, ini bisa menjadi informasi yang berharga.

Kita dapat menghubungkan ilmu data dengan Big Data, yang terdiri dari mekanisme pengembangan yang mampu memproses dan mengelola data masif yang berasal dari berbagai sumber. Tujuannya adalah untuk mengubahnya menjadi informasi yang dapat diinterpretasikan oleh manusia dan yang membantunya membuat keputusan.

Data yang akan diproses ini dapat berasal dari transaksi antara individu dan organisasi (seperti operasi perbankan), tindakan sehari-hari orang (seperti pencarian di Internet), mesin (seperti GPS ponsel yang mencatat di mana pengguna berada) atau informasi biometrik. (seperti sidik jari).

Sejarah ilmu data

Dapat dikatakan bahwa ahli statistik Amerika John Wilder Tukey mempelopori ilmu data pada tahun 1960-an, menekankan pentingnya menganalisis data daripada menguji caral statistik.

Namun, baru pada tahun 1996 istilah ilmu data digunakan untuk pertama kalinya dalam judul kuliah, dalam ceramah yang disebut: “Ilmu data, klasifikasi dan metode terkait.” Hal ini, dalam rangka pertemuan anggota ‘International Federation of Classification Societies’ (IFCS) yang diadakan di Kobe, Jepang.

Tonggak penting lainnya datang pada tahun 2005 ketika “Pengumpulan Data Digital Berumur Panjang yang Memungkinkan Penelitian dan Pendidikan di Abad 21” diterbitkan oleh National Science Board. Dalam dokumen itu, ilmuwan data didefinisikan sebagai pakar komputer, pemrogram basis data dan perangkat lunak, dan profesional dari disiplin lain (seperti pustakawan dan arsiparis), yang sangat penting bagi keberhasilan pengelolaan pengumpulan data digital.

Namun, ini masih merupakan bidang studi yang masih dalam pengembangan.