Zadbaj o dobrą organizację dzięki kolekcji Zapisuj i kategoryzuj treści zgodnie ze swoimi preferencjami.
Specjaliści ds. systemów uczących się poświęcają znacznie więcej czasu na ocenę, sprzątanie i transformację niż na tworzeniu modeli. Dane są tak ważne, że ten kurs poświęca temu tematowi 3 całe jednostki:
Ta część koncentruje się dane liczbowe, oznaczające liczby całkowite lub wartości zmiennoprzecinkowe które zachowują się jak liczby. czyli sumować się, zliczać, porządkować, i tak dalej. Następna część dotyczy danych kategorialnych, które mogą zawierają liczby, które są podobne do kategorii. Trzecia część dotyczy sposobów przygotowywanie danych w celu zapewnienia wysokiej jakości wyników podczas trenowania i oceniania; i modelu.
Przykłady danych liczbowych:
Temperatura
Waga
Liczba jeleni zimujących w rezerwacie przyrody
Natomiast kody pocztowe w USA, mimo są pięciocyfrowymi lub dziewięciocyfrowymi liczbami, nie zachowuj się jak liczby ani nie reprezentują w matematyce. Kod pocztowy 40004 (w hrabstwie Nelson w stanie Kentucky) to nie dwukrotnie więcej niż w przypadku kodu pocztowego 20002 (w Waszyngtonie). Te numery reprezentują kategorie, konkretne obszary geograficzne i są uważane dane kategorialne.
[[["Łatwo zrozumieć","easyToUnderstand","thumb-up"],["Rozwiązało to mój problem","solvedMyProblem","thumb-up"],["Inne","otherUp","thumb-up"]],[["Brak potrzebnych mi informacji","missingTheInformationINeed","thumb-down"],["Zbyt skomplikowane / zbyt wiele czynności do wykonania","tooComplicatedTooManySteps","thumb-down"],["Nieaktualne treści","outOfDate","thumb-down"],["Problem z tłumaczeniem","translationIssue","thumb-down"],["Problem z przykładami/kodem","samplesCodeIssue","thumb-down"],["Inne","otherDown","thumb-down"]],["Ostatnia aktualizacja: 2024-08-13 UTC."],[[["This module focuses on preparing numerical data, such as temperature or weight, for use in machine learning models."],["Machine learning practitioners spend significant time on data preparation tasks like cleaning and transformation."],["The module covers techniques like feature scaling, outlier detection, and binning to improve data quality for model training."],["Learners should have a basic understanding of machine learning concepts before starting this module."],["Categorical data, like postal codes, will be addressed in a separate module due to its distinct characteristics and handling requirements."]]],[]]