Tutorial Data Mining menggunakan Orange🍊

Data mining merupakan salah satu teknik implementasi dari machine learning yang saat ini banyak digunakan di berbagai bidang. Data mining menjadi salah satu primadona teknik pemodelan dan pengambilan keputusan berdasarkan data yang dapat menghasilkan insight dan forecast yang dapat membantu kita di kehidupan sehari-hari.

Kalau mendengar istilah-istilah seperti machine learning dan data mining, yang terpikir dalam benak biasanya adalah “pasti ngoding.” Ya, sebagian besar tutorial mengenai machine learning dan data mining pasti berupa tutorial membuat program, biasanya menggunakan Python. Alasannya karena dengan membuat program, kita bisa leluasa untuk melakukan pemodelan apapun.

Tetapi kalau kita belum pernah membuat program sama sekali bagaimana? Tenang saja, sekarang sudah banyak aplikasi yang bisa kita pakai untuk melakukan data mining tanpa perlu membuat kode program sama sekali!

Wah gimana tuh? Pada artikel ini penulis akan berbagi tutorial video mengenai aplikasi Orange Data Mining. Aplikasi ini bisa kita gunakan untuk melakukan data mining tanpa perlu menulis kode program sama sekali.

Data Mining

Data mining merupakan proses ekstraksi pola-pola dan model-model dari data dalam jumlah besar yang merupakan perpaduan dari ilmu matematika, statistika, dan komputer.

Data mining menjadi salah satu hal yang penting dilakukan karena pada zaman informasi 4.0 ini, manusia memiliki kumpulan data yang sangat banyak, tetapi sebagian besar data tersebut tidak dapat diolah dengan teknik tradisional (big data). Diperlukan suatu cara baru untuk dapat mengolah data dalam jumlah besar, khususnya untuk mencari informasi dari kumpulan data yang banyak.

person using MacBook Pro
Photo by Campaign Creators on Unsplash

Salah satu hal yang menjadi alasan data mining menjadi populer selain karena terdapat banyak data yang perlu diolah, juga karena kemajuan dari machine learning. Machine learning merupakan kemampuan mesin untuk dapat belajar tanpa perlu diprogram secara eksplisit. Artinya sebuah algoritma dapat belajar untuk menjadi baik pada suatu tugas tertentu, dengan cara belajar dari data dalam jumlah besar.

Dengan kombinasi dari machine learning dan big data, akhirnya data mining menjadi salah satu teknik yang marak digunakan untuk mengambil informasi dari data.

Salah satu contoh proses data mining sudah pernah dibahas pada artikel Pengenalan Data Science, AI, dan ML🛸 dan Klasifikasi Bunga Iris menggunakan KNN Python🌺.

Orange Data Mining🍊

Pada tutorial data mining ini, kita akan menggunakan aplikasi Orange Data Mining. Orange merupakan aplikasi yang dikembangkan oleh University of Ljubljana, dengan target menghadirkan sebuah aplikasi untuk mengolah data secara visual tanpa perlu pengalaman membuat program sebelumnya.

Unduh Orange Data Mining di sini.

Pada Orange, untuk melakukan data mining kita akan menggunakan sistem widget. Setiap widget punya fungsinya masing-masing dan dapat menerima input atau mengeluarkan output.

selective focus photography of unpicked orange fruits during daytime
Photo by Hoyoung Choi on Unsplash

Misalnya kita ingin membaca data dari sebuah file, kita bisa menggunakan widget File untuk membaca data dari file tersebut dan menggunakan widget Data Table untuk menampilkan isi data yang sudah dibaca.

Sama halnya jika kita ingin membuat sebuah model untuk melakukan data mining seperti klasifikasi atau regresi. Kita bisa menambahkan widget seperti KNN dan Naive Bayes untuk membuat model dan memberikan data ke dalam model tersebut dengan cara menghubungkan sumber data dengan model dengan cara menarik garis penghubung.

Pokoknya mudah deh! Kamu bisa cek di playlist Tutorial Data Mining di channel YouTube di bawah ini.

Check the Playlist!

Kamu bisa cek playlist YouTube penulis untuk melihat kumpulan tutorial data mining menggunakan aplikasi Orange di bawah ini.

Subscribe ke channel YouTube
Fahmi Noor Fiqri!

Tutorial ini akan berisi 24 video yang akan membahas berbagai topik yang berkaitan dengan data mining.

  1. Pendahuluan Data Mining
  2. Supervised, Unsupervised, dan Reinforcement Learning
  3. Pengenalan Orange
  4. Exploratory Data Analysis
  5. Preprocessing
  6. Metrik
  7. Klasifikasi Bunga Iris menggunakan KNN
  8. Prediksi Pendapatan Penduduk menggunakan Naive Bayes
  9. Klasifikasi Varietas Biji menggunakan Decision Tree dan Ensemble Methods (Random Forest dan AdaBoost)
  10. Reduksi Dimensi menggunakan Principal Component Analysis dan t-SNE
  11. Regresi Harga Rumah menggunakan Linear Regression
  12. Forecasting Penjualan Tiket Pesawat menggunakan ARIMA
  13. Clustering Pelanggan Toko menggunakan k-Means
  14. Clustering Suhu Daerah di Indonesia menggunakan Hierarchical Clustering (Data Spasial)
  15. Prediksi Asosiasi Barang Belanja menggunakan Apriori
  16. Text Mining
  17. Sentiment Analysis Twitter
  18. Topic Modelling Sinopsis Buku
  19. Deep Learning dan Neural Network
  20. Klasifikasi Pengidap Kanker menggunakan Neural Network
  21. Regresi Output Pembangkit Listrik menggunakan Neural Network
  22. Computer Vision
  23. Klasifikasi Gambar menggunakan Neural Network
  24. Clustering Gambar menggunakan Hierarchical Clustering

Video akan diperbarui setiap satu pekan sekali atau satu pekan dua kali, bergantung kesibukan penulis.

Is This Really Data Mining?

Yes. Ini adalah data mining. Mungkin kamu berpikir kalau dengan aplikasi ini saja bisa melakukan data mining, untuk apa ada banyak library untuk melakukan hal yang sama dengan bahasa pemrograman?

Well, aplikasi Orange juga dibuat menggunakan suatu bahasa pemrograman tentunya dan juga aplikasi Orange ini bukan tidak punya kelemahan. Kalau kalian hanya ingin mengekstrak informasi dari data, maka dengan aplikasi Orange ini sudah cukup.

Tetapi jika kalian ingin mengintegrasikan sistem kerja data mining yang sudah dibuat dengan Orange, pastinya kamu akan butuh membuat kode program untuk mengintegrasikan data mining ke dalam sistem yang sudah ada. Jadi, keduanya punya kelebihan dan kekurangannya masing-masing ya!

The right tool for the right task

Ingat, gunakan tool yang tepat untuk pekerjaan yang tepat. Jika kita hanya ingin melakukan analisis, maka kita tidak perlu membuat kode program yang rumit jika sudah ada aplikasi yang bisa melakukan hal tersebut.

Jika kita butuh untuk melakukan integrasi sistem, maka jalan terbaiknya adalah dengan membuat implementasi sendiri dengan kode program, karena tidak semua aplikasi memiliki API yang bisa digunakan.

Penutup

Kalau kamu punya saran atau ingin request tutorial tertentu, silakan berikan komentar di video atau posting ini dan jangan lupa di subscribe, like dan share ya teman-teman!

Semoga dengan tutorial ini, kamu bisa belajar data mining dengan lebih mudah dan dapat mengolah data dengan lebih baik! #NgodingItuMudah