Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.
Per raggruppare i dati, segui questi passaggi:
Prepara i dati.
Crea la metrica di somiglianza.
Esegui l'algoritmo di clustering.
Interpreta i risultati e modifica il clustering.
Questa pagina illustra brevemente i passaggi. Ne parleremo più approfonditamente nelle sezioni successive.
Preparazione dei dati
Come per qualsiasi problema di ML, devi normalizzare, scalare e trasformare i dati delle funzionalità prima di addestrare o perfezionare un modello su questi dati. Inoltre, prima di eseguire il clustering, verifica che i dati preparati ti consentano di calcolare con precisione la somiglianza tra gli esempi.
Creare una metrica di somiglianza
Prima che un algoritmo di clustering possa raggruppare i dati, deve sapere quanto sono simili le coppie di esempi. Puoi quantificare la somiglianza tra gli esempi creando una metrica di somiglianza, che richiede un'attenta comprensione dei dati.
Esegui l'algoritmo di clustering
Un algoritmo di clustering utilizza la metrica di somiglianza per raggruppare i dati. Questo corso utilizza K-means.
Interpreta i risultati e apporta le modifiche necessarie
Poiché il clustering non produce o include dati empirici reali in base ai quali verificare l'output, è importante verificare il risultato in base alle tue aspettative sia a livello di cluster che di esempio. Se il risultato sembra strano o di bassa qualità, prova i tre passaggi precedenti. Continua a eseguire l'iterazione finché la qualità dell'output non soddisfa le tue esigenze.
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Mancano le informazioni di cui ho bisogno","missingTheInformationINeed","thumb-down"],["Troppo complicato/troppi passaggi","tooComplicatedTooManySteps","thumb-down"],["Obsoleti","outOfDate","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Problema relativo a esempi/codice","samplesCodeIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2025-02-25 UTC."],[[["Data needs to be prepared through normalization, scaling, and transformation before using it for clustering."],["A similarity metric is crucial for clustering algorithms as it quantifies how similar data points are to each other."],["The k-means algorithm is employed in this course to group data based on the defined similarity metric."],["Evaluating and adjusting clustering outcomes is an iterative process involving reviewing cluster quality and individual data point assignments."]]],[]]