Terminologi Machine Learning
Machine Learning (ML) merupakan cabang dari kecerdasan buatan (Artificial Intelligence) yang memungkinkan komputer untuk belajar dari data dan meningkatkan kinerjanya melalui pengalaman tanpa harus secara eksplisit diprogram. Berikut adalah beberapa terminologi yang umum digunakan dalam dunia Machine Learning:
Dataset: Dataset adalah kumpulan data yang digunakan untuk melatih dan menguji model Machine Learning. Dataset terdiri dari contoh-contoh data yang masing-masing memiliki fitur atau atribut dan seringkali dilabeli dengan hasil yang diinginkan.
Fitur (Feature): Fitur adalah variabel atau atribut dari setiap contoh data dalam dataset. Misalnya, jika kita memiliki dataset karyawan, fitur-fiturnya mungkin termasuk usia, gaji, dan jabatan.
Label: Label adalah hasil atau keluaran yang diinginkan dari model Machine Learning saat diberikan suatu fitur tertentu. Pada tugas klasifikasi, label menunjukkan kategori atau kelas yang sesuai dengan fitur, sedangkan pada tugas regresi, label adalah nilai yang berhubungan dengan fitur.
Model: Model adalah representasi matematis dari hubungan antara fitur dan label dalam dataset. Model Machine Learning dipelajari dari data pelatihan dan digunakan untuk membuat prediksi pada data baru.
Pelatihan (Training): Pelatihan adalah proses di mana model Machine Learning mempelajari pola dari data pelatihan. Selama pelatihan, model melakukan iterasi melalui dataset, menyesuaikan parameter berulang kali, dan mencari pola yang paling relevan.
Pengujian (Testing): Pengujian adalah proses di mana model dievaluasi pada data pengujian yang belum pernah dilihat sebelumnya. Pengujian membantu mengukur kinerja model dan memastikan bahwa model dapat melakukan prediksi yang akurat pada data baru.
Validasi Silang (Cross-Validation): Validasi silang adalah metode evaluasi model Machine Learning yang membagi dataset menjadi beberapa bagian (lipatan) dan melakukan pelatihan dan pengujian berulang kali untuk menghindari overfitting dan memastikan kinerja yang stabil.
Overfitting: Overfitting terjadi ketika model Machine Learning sangat baik dalam mempelajari data pelatihan, tetapi kinerjanya buruk pada data yang tidak terlihat sebelumnya (data pengujian) karena model terlalu spesifik atau "menghafal" data pelatihan.
Underfitting: Underfitting terjadi ketika model Machine Learning gagal mempelajari pola yang ada dalam data pelatihan dan kinerjanya juga buruk pada data pengujian karena model terlalu sederhana.
Klasifikasi (Classification): Klasifikasi adalah tugas Machine Learning di mana model diminta untuk memprediksi label atau kelas dari data baru berdasarkan contoh-contoh data dengan label yang sudah diketahui.
Regresi (Regression): Regresi adalah tugas Machine Learning di mana model diminta untuk memprediksi nilai numerik berdasarkan data pelatihan yang memiliki nilai yang berkaitan.
Unsupervised Learning: Unsupervised Learning adalah jenis Machine Learning di mana model bekerja pada data yang tidak memiliki label atau keluaran yang diinginkan. Tujuannya adalah untuk mengelompokkan data atau menemukan pola tersembunyi di dalamnya.
Supervised Learning: Supervised Learning adalah jenis Machine Learning di mana model belajar dari data yang memiliki label atau keluaran yang diinginkan. Model ini belajar untuk memetakan fitur ke label berdasarkan contoh-contoh data pelatihan.
Reinforcement Learning: Reinforcement Learning adalah jenis Machine Learning di mana model belajar melalui interaksi dengan lingkungan. Model mengambil tindakan dan menerima umpan balik positif atau negatif sebagai hadiah atau hukuman.
Deep Learning: Deep Learning adalah subbidang dari Machine Learning yang menggunakan arsitektur jaringan saraf tiruan (neural networks) yang dalam untuk mempelajari representasi fitur hierarkis dari data.
Kesimpulan
Terminologi di atas adalah beberapa istilah umum yang digunakan dalam Machine Learning. Memahami istilah-istilah ini menjadi penting untuk memahami konsep dan algoritma dalam Machine Learning serta untuk berkomunikasi dengan jelas tentang proses pembelajaran mesin dan penerapannya.
Tidak ada komentar:
Posting Komentar