Neste documento, explicamos as principais diferenças entre treinar um modelo na Vertex AI usando o AutoML ou treinamento personalizado e treinar um modelo usando o BigQuery ML.
Com o AutoML, você cria e treina um modelo com o mínimo de esforço técnico. é possível usar o AutoML para prototipar modelos rapidamente e explorar novos conjuntos de dados, antes de investir em desenvolvimento. Por exemplo, é possível usá-lo para saber quais recursos são melhores para um determinado conjunto de dados.
O treinamento personalizado permite criar um aplicativo de treinamento otimizado para os resultados desejados. Você tem controle total sobre a funcionalidade do aplicativo de treinamento. Ou seja, é possível focar em qualquer objetivo, usar qualquer algoritmo, desenvolver funções ou métricas de perda próprias ou fazer qualquer outra personalização.
Com o BigQuery ML, é possível treinar modelos usando os dados do BigQuery diretamente no BigQuery. Com os comandos SQL, é possível criar rapidamente um modelo e usá-lo para receber previsões em lote.
Para comparar as diferentes funcionalidades e especialidades necessárias para cada serviço, consulte a tabela a seguir.
AutoML | Treinamento personalizado | BigQuery ML | |
---|---|---|---|
É preciso ter experiência em ciência de dados. | Não | Sim, para desenvolver o aplicativo de treinamento e realizar algumas das preparações de dados, como a engenharia de atributos. | Não. |
Capacidade de programação necessária | Não, o AutoML não tem código. | Sim, para desenvolver o aplicativo de treinamento. | Habilidade de programação SQL necessária para criar, avaliar e usar o modelo no BigQuery ML. |
Tempo para o modelo treinado | Baixo. Não é necessário preparar os dados, e não é necessário nenhum desenvolvimento. | Alto. É necessária mais preparação de dados, e o desenvolvimento do aplicativo de treinamento é necessário. | Baixo. A velocidade de desenvolvimento do modelo aumenta porque você não precisa criar a infraestrutura necessária para previsões em lote ou treinamento de modelo, já que o BigQuery ML utiliza o mecanismo computacional do BigQuery. Isso acelera o treinamento, a avaliação e a previsão. |
Limites dos objetivos de machine learning | Sim, você precisa segmentar um dos objetivos predefinidos do AutoML. | Não | Sim. |
Pode otimizar manualmente o desempenho do modelo com o ajuste de hiperparâmetro | Não. O AutoML faz alguns ajustes automáticos de hiperparâmetros, mas não é possível modificar os valores usados. | Sim. É possível ajustar o modelo durante cada execução de treinamento para fins de experimentação e comparação. | Sim. O BigQuery ML tem suporte para ajuste de hiperparâmetros durante o treinamento de modelos de ML usando as instruções CREATE MODEL. |
Pode controlar aspectos do ambiente de treinamento | emissor. Para conjuntos de dados de imagem e tabulares, é possível especificar o número de horas de nó a serem treinados e permitir o fechamento antecipado do treinamento. | Sim. Especifique aspectos do ambiente, como tipo de máquina do Compute Engine, tamanho do disco, framework de machine learning e número de nós. | Não. |
Limites no tamanho dos dados |
Sim. O AutoML usa conjuntos de dados gerenciados. As limitações de tamanho de dados variam de acordo com o tipo de conjunto de dados. Consulte um dos seguintes tópicos para mais detalhes: |
Para conjuntos de dados não gerenciados, não. Os conjuntos de dados gerenciados têm os mesmos limites dos objetos de conjuntos de dados gerenciados criados e hospedados pela Vertex AI e são usados para treinar modelos do AutoML. | Sim. O BigQuery ML aplica cotas adequadas por projeto. Para saber mais, consulte Cotas e limites. |
A seguir
- Escolha um tutorial de introdução para começar o Vertex AI Training.
- Saiba mais sobre como treinar um modelo ML.
- Saiba mais sobre como criar um job de treinamento personalizado usando Python.