Regressionsmodell mit BigQuery DataFrames erstellen

Mit der BigQuery DataFrames API ein lineares Regressionsmodell für die Körpermasse von Pinguinen erstellen.

Weitere Informationen

Eine ausführliche Dokumentation, die dieses Codebeispiel enthält, finden Sie hier:

Codebeispiel

Python

Bevor Sie dieses Beispiel anwenden, folgen Sie den Schritten zur Einrichtung von Python in der BigQuery-Kurzanleitung zur Verwendung von Clientbibliotheken. Weitere Angaben finden Sie in der Referenzdokumentation zur BigQuery Python API.

Richten Sie zur Authentifizierung bei BigQuery die Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für Clientbibliotheken einrichten.

from bigframes.ml.linear_model import LinearRegression import bigframes.pandas as bpd  # Load data from BigQuery query_or_table = "bigquery-public-data.ml_datasets.penguins" bq_df = bpd.read_gbq(query_or_table)  # Filter down to the data to the Adelie Penguin species adelie_data = bq_df[bq_df.species == "Adelie Penguin (Pygoscelis adeliae)"]  # Drop the species column adelie_data = adelie_data.drop(columns=["species"])  # Drop rows with nulls to get training data training_data = adelie_data.dropna()  # Specify your feature (or input) columns and the label (or output) column: feature_columns = training_data[     ["island", "culmen_length_mm", "culmen_depth_mm", "flipper_length_mm", "sex"] ] label_columns = training_data[["body_mass_g"]]  test_data = adelie_data[adelie_data.body_mass_g.isnull()]  # Create the linear model model = LinearRegression() model.fit(feature_columns, label_columns)  # Score the model score = model.score(feature_columns, label_columns)  # Predict using the model result = model.predict(test_data)

Nächste Schritte

Informationen zum Suchen und Filtern von Codebeispielen für andere Google Cloud -Produkte finden Sie im Google Cloud Beispielbrowser.