Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.
Untuk mengelompokkan data, Anda harus mengikuti langkah-langkah berikut:
Menyiapkan data.
Buat metrik kesamaan.
Menjalankan algoritma pengelompokan.
Menafsirkan hasil dan menyesuaikan pengelompokan Anda.
Halaman ini memperkenalkan langkah-langkahnya secara singkat. Kita akan membahasnya lebih lanjut di bagian berikutnya.
Menyiapkan data
Seperti masalah ML lainnya, Anda harus melakukan normalisasi, penskalaan, dan transformasi data fitur sebelum melatih atau menyesuaikan model pada data tersebut. Selain itu, sebelum mengelompokkan, pastikan data yang disiapkan memungkinkan Anda menghitung kemiripan antara contoh secara akurat.
Membuat metrik kesamaan
Sebelum dapat mengelompokkan data, algoritma pengelompokan perlu mengetahui seberapa mirip pasangan contoh. Anda dapat mengukur kesamaan antara contoh dengan membuat metrik kesamaan, yang memerlukan pemahaman yang cermat tentang data Anda.
Menjalankan algoritma pengelompokan
Algoritma pengelompokan menggunakan metrik kesamaan untuk mengelompokkan data. Kursus ini menggunakan k-means.
Menafsirkan hasil dan menyesuaikan
Karena pengelompokan tidak menghasilkan atau menyertakan "kebenaran" dasar yang dapat Anda gunakan untuk memverifikasi output, penting untuk memeriksa hasilnya berdasarkan ekspektasi Anda di tingkat cluster dan tingkat contoh. Jika hasilnya terlihat aneh atau berkualitas rendah, lakukan eksperimen dengan tiga langkah sebelumnya. Lanjutkan iterasi hingga kualitas output memenuhi kebutuhan Anda.
[[["Mudah dipahami","easyToUnderstand","thumb-up"],["Memecahkan masalah saya","solvedMyProblem","thumb-up"],["Lainnya","otherUp","thumb-up"]],[["Informasi yang saya butuhkan tidak ada","missingTheInformationINeed","thumb-down"],["Terlalu rumit/langkahnya terlalu banyak","tooComplicatedTooManySteps","thumb-down"],["Sudah usang","outOfDate","thumb-down"],["Masalah terjemahan","translationIssue","thumb-down"],["Masalah kode / contoh","samplesCodeIssue","thumb-down"],["Lainnya","otherDown","thumb-down"]],["Terakhir diperbarui pada 2025-02-25 UTC."],[[["Data needs to be prepared through normalization, scaling, and transformation before using it for clustering."],["A similarity metric is crucial for clustering algorithms as it quantifies how similar data points are to each other."],["The k-means algorithm is employed in this course to group data based on the defined similarity metric."],["Evaluating and adjusting clustering outcomes is an iterative process involving reviewing cluster quality and individual data point assignments."]]],[]]