Kalian pernah mendengar istilah data mining, kah? Atau, justru kalian sudah pernah mengolah data mining, nih? Sebenarnya definisi dan fungsi dari data mining itu apa sih? Baiklah, baca pembahasannya yuk Mengenal Apa Itu Data Mining, Fungsi, dan Metodenya
Pengertian Data Mining
Data mining adalah suatu prose pengumpulan informasi penting dari suatu data yang besar. Proses data mining seringkali menggunakan metode statistika, matematika, hingga memanfaatkan teknologi artificial intelligence (AI).
Nama alternatifnya ialah Knowledge Discovery (mining) in Databases (KDD), knowledge extraction, data/pattern analysis, data archeology, data dredging, information harvesting, business intelligence, dan lain-lain.
Banyak konsep dan teknik yang digunakan dalam proses data mining. Proses tersebut membutuhkan beberapa langkah untuk mendapatkan sebuah data yang diinginkan.
Dalam proses KDD, termasuk melakukan pembersihan data, integrasi data, seleksi data, transformasi, penambangan data, evaluasi pola, dan presentasi pengetahuan.
Fungsi Data Mining
Data mining mempunyai berbagai fungsi, termasuk fungsi utamanya, yaitu descriptive dan predictive. Berikut ini akan diberikan penjelasannya:
Descriptive
Descriptive merupakan suatu fungsi yang bertujuan memahami lebih jauh terkait data yang diamati sehingga dapat diketahui perilaku dari sebuah data.
Predictive
Fungsi ini adalah sebuah fungsi yang menjelaskan suatu proses dalam menemukan pola tertentu dari sebuah data. Pola-pola yang digunakan diketahui dari berbagai variabel yang terdapat pada data.
Classification
Fungsi ini bertujuan untuk menyimpulkan beberapa definisi karakteristik dari sebuah grup. Misal, pelanggan perusahaan yang sudah berpindah karena tersaingi oleh perusahaan lain.
Clustering
Clustering adalah identifikasi kelompok dari produk-produk atau barang-barang yang memiliki karakteristik khusus.
Association
Association merupakan identifikasi hubungan dari kejadian-kejadian yang sudah terjadi di suatu waktu.
Sequencing
Sequencing sebenarnya hampir sama dengan association tapi sequencing berfungsi untuk identifikasi hubungan-hubungan berbeda di sebuah periode waktu tertentu. Contoh, para pelanggan yang berkunjung di supermarket secara berulang.
Forecasting
Fungsi ini bertujuan untuk memperkirakan nilai di suatu masa di masa mendatang sesuai dengan pola-pola dengan kumpulan data dalam jumlah besar.
Metode Data Mining
Dalam proses pengumpulan informasi tentunya terdapat metode dong, ya. Nah, metode tersebut akan membantu dalam proses menemukan data.
Proses Pengambilan Data
Sebelumnya sudah sedikit disampaikan tentang KDD atau Knowledge discovery (mining) in databases. Dengan KDD inilah kalian dapat melakukan proses pengambilan data.
Tahapan-tahapan tersebut dimulai dari data mentah dan berakhir dengan pengetahuan atau informasi yang telah diolah. Nah, proses tersebut sebagai berikut :
- Data Cleansing: proses yang mana data-data yang tidak lengkap, mengandung error, dan tidak konsisten dibuang dari koleksi data. Silakan ketahui juga data lifecycle management untuk mengetahui tentang pengolahan data.
- Data Integration: proses integrasi data yang mana yang berulang akan dikombinasikan.
- Selection: proses seleksi atau pemilihan data yang relevan terhadap analisis untuk diterima dari koleksi data yang ada.
- Data Transformation: proses transformasi data yang sudah dipilih ke dalam bentuk mining procedure melalui cara dan agresi data.
- Data Mining: proses yang paling penting, yang mana akan dilakukan berbagai teknik yang diaplikasikan untuk mengekstrak berbagai pola-pola potensial untuk mendapatkan data yang berguna.
- Pattern Evolution: sebuah proses yang mana pola-pola menarik yang sebelumnya sudah ditemukan dengan identifikasi berdasarkan measure yang telah diberikan.
- Knowledge Presentation: merupakan proses tahap terakhir. Dalam hal ini digunakan teknik visualisasi yang bertujuan membantu user dalam memahami dan menginterpretasikan hasil dari penambangan data.
Teknik Dalam Proses Penambangan Data
Terdapat berbagai macam teknik yang digunakan dalam proses penambangan data:
- Predictive Modeling: ada dua teknik, yaitu Classification dan Value Prediction.
- Database Segmentation: melakukan partisi database menjadi sejumlah segmen, cluster, atau record yang sama
- Link Analysis: sebuah teknik untuk membuat hubungan antara record yang individu atau sekumpulan record dalam database.
- Deviation Detection: sebuah teknik untuk mengidentifikasi outlier yang mengekspresikan sebuah deviasi dari ekspektasi yang sudah diketahui sebelumnya.
- Nearest Neighbour: teknik yang memprediksi pengelompokan. Teknik ini sendiri merupakan teknik tertua yang digunakan dalam data mining.
- Clustering: merupakan teknik untuk mengklasifikasikan data berdasarkan kriteria masing-masing data.
- Decision Tree: teknik generasi selanjutnya, yang mana teknik ini adalah sebuah model prediktif yang dapat digambarkan seperti pohon. Setiap node yang terdapat dalam struktur pohon tersebut mewakili sebuah pertanyaan yang digunakan untuk menggolongkan data.
Permasalahan Dalam Data Mining
Berikut ini beberapa permasalahan dalam data mining:
Metodologi Mining
- Menambang berbagai jenis pengetahuan dari berbagai tipe data.
- Kinerja: efisiensi, efektivitas, dan skalabilitas.
- Evaluasi pola: masalah ketertarikan.
- Memasukkan pengetahuan latar belakang.
- Menangani kebisingan dan data yang tidak lengkap.
- Metode penambangan paralel, terdistribusi, dan tambahan.
- Integrasi pengetahuan yang ditemukan dengan yang ada: fusi pengetahuan.
User Interaction
- Bahasa kueri penambangan data dan penambangan ad-hoc.
- Ekspresi dan visualisasi hasil penambangan data.
- Penambangan pengetahuan interaktif di berbagai tingkatan abstraksi.
Applications and Social Impacts
- Penambangan data khusus domain dan penambangan data tak terlihat.
- Perlindungan keamanan data, integritas, dan privasi.
Penerapan Data Mining
Berikut ini beberapa contoh penerapan data mining yang perlu diketahui:
Telekomunikasi
Penerapan pengumpulan data dapat dilakukan di perusahaan telekomunikasi untuk melihat jutaan transaksi yang masuk. Oleh karena itu, dapat diketahui transaksi mana saja yang harus ditangani secara manual.
Asuransi
Penggunaan data di perusahaan asuransi salah satunya oleh Australian Health Insurance Commision. Perusahaan tersebut memakai data mining untuk identifikasi layanan kesehatan yang sebetulnya tidak dibutuhkan namun tetap dilakukan peserta asuransi.
Olahraga
Pengumpulan data juga diterapkan pada IBM Advanced Scout untuk analisis statistik permainan NBA sehingga dapat mencapai keunggulan dalam bersaing utuk tim Miami Heat dan New York Knicks.
Guys, bisa dikatakan bahwa tanpa data mining kemungkinan proses pengambilan keputusan dari suatu masalah akan lebih sulit dilakukan karena tidak ada data yang bisa menjadi dasar pertimbangan. FYI, bagi kalian yang bekerja di dunia keuangan, akademik maupun bidang lainnya, sebaiknya pelajari tentang data mining secara lebih mendalam, ya 🙂
Good luck
Oya, bagi kalian ingin membuat website, bisa langsung cek ke Jetorbit guna memenuhi kebutuhan pembuatan website kalian. Selain itu, kami juga menyediakan VPS dan bisa Anda cek di sini.
Leave a Comment