Regressão linear: exercício de gradiente descendente
Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.
Neste exercício, você vai revisitar o gráfico de dados de eficiência de combustível do exercício de parâmetros. Mas, desta vez, você vai usar a gradiente descendente para aprender os valores de peso e viés ideais para um modelo linear que minimize a perda.
Conclua as três tarefas abaixo do gráfico.
Tarefa 1:ajuste o controle deslizante Taxa de aprendizado abaixo do gráfico para definir uma taxa de aprendizado de 0,03. Clique no botão Start para executar a descida pendente.
Quanto tempo o treinamento do modelo leva para convergir (atingir um valor mínimo estável de perda)? Qual é o valor da MSE na convergência do modelo? Quais valores de peso e viés produzem esse valor?
Clique no ícone de adição para conferir nossa solução.
Quando definimos uma taxa de aprendizado de 0,03, o modelo convergiu após aproximadamente 30 segundos, alcançando um MSE de pouco menos de 3 com valores de peso e viés de –2,08 e 23,098, respectivamente. Isso indica que escolhemos um bom valor de taxa de aprendizado.
Tarefa 2:clique no botão Redefinir abaixo do gráfico para redefinir os valores de peso e viés no gráfico. Ajuste o controle deslizante Taxa de aprendizado para um valor de 1,10e–5. Clique no botão Start para executar a descida pendente.
O que você notou sobre o tempo que o treinamento do modelo leva para convergir dessa vez?
Clique no ícone de adição para conferir a solução.
Após vários minutos, o treinamento do modelo ainda não foi concluído. Pequenas atualizações nos valores de peso e viés continuam resultando em valores de perda um pouco menores. Isso sugere que escolher uma taxa de aprendizado mais alta permitiria que a descida côncava encontrasse os valores de peso e viés ideais mais rapidamente.
Tarefa 3:clique no botão Redefinir abaixo do gráfico para redefinir os valores de peso e viés no gráfico. Ajuste o controle deslizante Taxa de aprendizado para 1. Clique no botão Start para executar a descida pendente.
O que acontece com os valores de perda à medida que o gradiente descendente é executado? Quanto tempo o treinamento do modelo vai levar para convergir dessa vez?
Clique no ícone de adição para conferir a solução.
Os valores de perda variam muito em valores altos (MSE acima de 300). Isso indica que a taxa de aprendizado é muito alta e que o treinamento do modelo nunca vai alcançar a convergência.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Não contém as informações de que eu preciso","missingTheInformationINeed","thumb-down"],["Muito complicado / etapas demais","tooComplicatedTooManySteps","thumb-down"],["Desatualizado","outOfDate","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Problema com as amostras / o código","samplesCodeIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-03-11 UTC."],[],[]]