使用 BigQuery DataFrames 创建回归模型

使用 BigQuery DataFrames API 为企鹅的体积创建线性回归模型。

深入探索

如需查看包含此代码示例的详细文档,请参阅以下内容:

代码示例

Python

试用此示例之前,请按照 BigQuery 快速入门:使用客户端库中的 Python 设置说明进行操作。 如需了解详情,请参阅 BigQuery Python API 参考文档

如需向 BigQuery 进行身份验证,请设置应用默认凭据。 如需了解详情,请参阅为客户端库设置身份验证

from bigframes.ml.linear_model import LinearRegression import bigframes.pandas as bpd  # Load data from BigQuery query_or_table = "bigquery-public-data.ml_datasets.penguins" bq_df = bpd.read_gbq(query_or_table)  # Filter down to the data to the Adelie Penguin species adelie_data = bq_df[bq_df.species == "Adelie Penguin (Pygoscelis adeliae)"]  # Drop the species column adelie_data = adelie_data.drop(columns=["species"])  # Drop rows with nulls to get training data training_data = adelie_data.dropna()  # Specify your feature (or input) columns and the label (or output) column: feature_columns = training_data[     ["island", "culmen_length_mm", "culmen_depth_mm", "flipper_length_mm", "sex"] ] label_columns = training_data[["body_mass_g"]]  test_data = adelie_data[adelie_data.body_mass_g.isnull()]  # Create the linear model model = LinearRegression() model.fit(feature_columns, label_columns)  # Score the model score = model.score(feature_columns, label_columns)  # Predict using the model result = model.predict(test_data)

后续步骤

如需搜索和过滤其他 Google Cloud 产品的代码示例,请参阅Google Cloud 示例浏览器