L'IA générative sur Vertex AI (également appelée genAI ou gen AI) vous permet d'accéder aux modèles d'IA générative de Google pour plusieurs modalités (texte, code, images, voix). Vous pouvez tester et régler ces grands modèles de langage (LLM), puis et les déployer pour les utiliser dans vos applications basées sur l'IA. Pour en savoir plus, consultez le cours Présentation de l'IA générative sur Vertex AI.
Vertex AI dispose de divers modèles de fondation d'IA générative accessibles via un API, y compris les modèles utilisés dans les exemples suivants:
- Gemini Pro est conçu pour gérer le langage naturel le chat textuel et de code multitour, et la génération de code.
- Gemini Pro Vision est compatible avec les requêtes multimodales. Vous pouvez inclure du texte, des images et des vidéos dans vos requêtes et obtenir des réponses textuelles ou de code.
- Pathways Language Model 2 (PaLM 2) pour le texte est affiné pour des tâches linguistiques telles que comme la classification, la synthèse et l'extraction d'entités.
Chaque modèle est exposé via un point de terminaison d'éditeur spécifique à votre projet Google Cloud. Il n'est donc pas nécessaire de déployer le modèle de fondation, sauf si vous devez le régler pour un cas d'utilisation spécifique. Vous pouvez envoyer une requête à l'éditeur et un point de terminaison unique. Une requête est une requête en langage naturel envoyée à un LLM pour obtenir une une réponse.
Ce tutoriel présente les workflows qui génèrent des réponses à partir de
des modèles Vertex AI en envoyant des requêtes textuelles à l'éditeur ;
à l'aide d'un connecteur Workflows ou d'un POST
HTTP
requête. Pour en savoir plus, consultez la présentation du connecteur de l'API Vertex AI et Envoyer une requête HTTP.
Notez que vous pouvez déployer et exécuter chaque workflow indépendamment les uns des autres.
Objectifs
Dans ce tutoriel, vous allez effectuer les opérations suivantes :
- Activer les API Vertex AI et Workflows
attribuez le rôle "Utilisateur Vertex AI" (
roles/aiplatform.user
) à votre service de service. Ce rôle permet d'accéder à la plupart des fonctionnalités de Vertex AI. Pour en savoir plus sur la configuration de Vertex AI, voir Lancez-vous sur Google Cloud. - Déployer et exécuter un workflow qui invite un modèle Vertex AI (Gemini Pro Vision) pour décrire une image disponibles via Cloud Storage. Pour en savoir plus, consultez Rendre les données publiques
- Déployer et exécuter un workflow qui parcourt une liste de pays en parallèle et invite un modèle Vertex AI (Gemini Pro) pour générer et renvoyer les historiques des pays. Utiliser des branches parallèles vous permet de réduire le temps d'exécution total en lançant les appels au LLM en même temps et en attendant qu'elles soient toutes terminées avant de combiner les résultats. Pour en savoir plus, consultez Exécuter les étapes du workflow en parallèle.
- Déployez un workflow semblable au précédent. Toutefois, demandez à un modèle Vertex AI (PaLM 2 pour le texte) de générer et de renvoyer les histoires des pays. Pour en savoir plus sur comment choisir un modèle, consultez Informations sur le modèle.
- Déployez un workflow capable de résumer un document volumineux. Parce qu'il existe un à la fenêtre de contexte, qui définit jusqu'où le modèle doit remonter l'entraînement (et pour les prévisions), le flux de travail divise le document en puis invite un modèle Vertex AI (Gemini Pro) pour résumer chaque partie en parallèle. Pour plus pour en savoir plus, consultez les requêtes de synthèse et Horizon de prévision, fenêtre de contexte et fenêtre de prévision.
Coûts
Dans ce document, vous utilisez les composants facturables suivants de Google Cloud :
Obtenez une estimation des coûts en fonction de votre utilisation prévue à l'aide du simulateur de coût.
Une fois que vous avez terminé les tâches décrites dans ce document, vous pouvez éviter de continuer à payer des frais en supprimant les ressources que vous avez créées. Pour en savoir plus, consultez la section Effectuer un nettoyage.
Avant de commencer
Avant d'essayer les exemples de ce tutoriel, assurez-vous d'avoir suivi comme suit.
Console
- Connectez-vous à votre compte Google Cloud. Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de nos produits en conditions réelles. Les nouveaux clients bénéficient également de 300 $ de crédits gratuits pour exécuter, tester et déployer des charges de travail.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Vérifiez que la facturation est activée pour votre projet Google Cloud.
-
Enable the Vertex AI and Workflows APIs.
-
Create a service account:
-
In the Google Cloud console, go to the Create service account page.
Go to Create service account - Select your project.
-
In the Service account name field, enter a name. The Google Cloud console fills in the Service account ID field based on this name.
In the Service account description field, enter a description. For example,
Service account for quickstart
. - Click Create and continue.
-
Grant the Vertex AI > Vertex AI User role to the service account.
To grant the role, find the Select a role list, then select Vertex AI > Vertex AI User.
- Click Continue.
-
Click Done to finish creating the service account.
-
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Vérifiez que la facturation est activée pour votre projet Google Cloud.
-
Enable the Vertex AI and Workflows APIs.
-
Create a service account:
-
In the Google Cloud console, go to the Create service account page.
Go to Create service account - Select your project.
-
In the Service account name field, enter a name. The Google Cloud console fills in the Service account ID field based on this name.
In the Service account description field, enter a description. For example,
Service account for quickstart
. - Click Create and continue.
-
Grant the Vertex AI > Vertex AI User role to the service account.
To grant the role, find the Select a role list, then select Vertex AI > Vertex AI User.
- Click Continue.
-
Click Done to finish creating the service account.
-
gcloud
- Connectez-vous à votre compte Google Cloud. Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de nos produits en conditions réelles. Les nouveaux clients bénéficient également de 300 $ de crédits gratuits pour exécuter, tester et déployer des charges de travail.
- Install the Google Cloud CLI.
-
To initialize the gcloud CLI, run the following command:
gcloud init
-
Create or select a Google Cloud project.
-
Create a Google Cloud project:
gcloud projects create PROJECT_ID
Replace
PROJECT_ID
with a name for the Google Cloud project you are creating. -
Select the Google Cloud project that you created:
gcloud config set project PROJECT_ID
Replace
PROJECT_ID
with your Google Cloud project name.
-
-
Vérifiez que la facturation est activée pour votre projet Google Cloud.
-
Enable the Vertex AI and Workflows APIs:
gcloud services enable aiplatform.googleapis.com
workflows.googleapis.com -
Set up authentication:
-
Create the service account:
gcloud iam service-accounts create SERVICE_ACCOUNT_NAME
Replace
SERVICE_ACCOUNT_NAME
with a name for the service account. -
Grant the
roles/aiplatform.user
IAM role to the service account:gcloud projects add-iam-policy-binding PROJECT_ID --member="serviceAccount:SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com" --role=roles/aiplatform.user
Replace the following:
SERVICE_ACCOUNT_NAME
: the name of the service accountPROJECT_ID
: the project ID where you created the service account
-
- Install the Google Cloud CLI.
-
To initialize the gcloud CLI, run the following command:
gcloud init
-
Create or select a Google Cloud project.
-
Create a Google Cloud project:
gcloud projects create PROJECT_ID
Replace
PROJECT_ID
with a name for the Google Cloud project you are creating. -
Select the Google Cloud project that you created:
gcloud config set project PROJECT_ID
Replace
PROJECT_ID
with your Google Cloud project name.
-
-
Vérifiez que la facturation est activée pour votre projet Google Cloud.
-
Enable the Vertex AI and Workflows APIs:
gcloud services enable aiplatform.googleapis.com
workflows.googleapis.com -
Set up authentication:
-
Create the service account:
gcloud iam service-accounts create SERVICE_ACCOUNT_NAME
Replace
SERVICE_ACCOUNT_NAME
with a name for the service account. -
Grant the
roles/aiplatform.user
IAM role to the service account:gcloud projects add-iam-policy-binding PROJECT_ID --member="serviceAccount:SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com" --role=roles/aiplatform.user
Replace the following:
SERVICE_ACCOUNT_NAME
: the name of the service accountPROJECT_ID
: the project ID where you created the service account
-
Déployer un workflow qui décrit une image (Gemini Pro Vision)
Déployer un workflow qui utilise une méthode de connecteur
(generateContent
) pour envoyer une requête à Gemini Pro Vision
le point de terminaison de l'éditeur. Cette méthode permet de générer du contenu avec
des entrées multimodales.
Le workflow fournit une requête textuelle et l'URI d'une image accessible publiquement dans un bucket Cloud Storage. Vous pouvez voir l'image Dans la console Google Cloud, vous pouvez afficher les détails de l'objet.
Le workflow renvoie une description de l'image à partir de l'image générée de réponse.
Pour en savoir plus sur les paramètres du corps de la requête HTTP utilisés lors de l'invite du LLM et sur les éléments du corps de la réponse, consultez la documentation de référence de l'API Gemini.
Console
Dans la console Google Cloud, accédez à la page Workflows.
Cliquez sur
Créer.Saisissez un nom pour le nouveau workflow:
describe-image
.Dans la liste Région, sélectionnez us-central1 (Iowa).
Dans le champ Compte de service, sélectionnez le compte de service que vous avez précédemment créé.
Cliquez sur Suivant.
Dans l'éditeur de workflow, saisissez la définition suivante pour votre workflow :
Cliquez sur Déployer.
gcloud
Créez un fichier de code source pour votre workflow:
touch describe-image.yaml
Dans un éditeur de texte, copiez le workflow suivant dans votre fichier de code source:
Déployez le workflow en saisissant la commande suivante :
gcloud workflows deploy describe-image \ --source=describe-image.yaml \ --location=us-central1 \ --service-account=SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com
Exécuter le workflow
L'exécution d'un workflow exécute la définition actuelle du workflow associé au workflow.
Console
Dans la console Google Cloud, accédez à la page Workflows.
Sur la page Workflows, sélectionnez l'icône describe-image pour accéder à sa page d'informations.
Sur la page Détails du workflow, cliquez sur play_arrow Exécuter.
Dans le champ Entrée, saisissez la commande suivante:
{"image_url":"gs://generativeai-downloads/images/scones.jpg"}
Cliquez à nouveau sur Exécuter.
Affichez les résultats du workflow dans le volet Output (Résultat).
La sortie devrait ressembler à ce qui suit :
{ "image_description": "There are three pink peony flowers on the right side of the picture[]...]There is a white napkin on the table.", "image_url": "gs://generativeai-downloads/images/scones.jpg" }
gcloud
Ouvrez un terminal.
Exécutez le workflow :
gcloud workflows run describe-image \ --data='{"image_url":"gs://generativeai-downloads/images/scones.jpg"}'
Les résultats de l'exécution doivent ressembler à ce qui suit:
Waiting for execution [258b530e-a093-46d7-a4ff-cbf5392273c0] to complete...done. argument: '{"image_url":"gs://generativeai-downloads/images/scones.jpg"}' createTime: '2024-02-09T13:59:32.166409938Z' duration: 4.174708484s endTime: '2024-02-09T13:59:36.341118422Z' name: projects/1051295516635/locations/us-central1/workflows/describe-image/executions/258b530e-a093-46d7-a4ff-cbf5392273c0 result: "{\"image_description\":\"The picture shows a rustic table with a white surface,\ \ on which there are several scones with blueberries, as well as two cups of coffee\ [...] \ on the table. The background of the table is a dark blue color.\",\"image_url\"\ :\"gs://generativeai-downloads/images/scones.jpg\"}" startTime: '2024-02-09T13:59:32.166409938Z' state: SUCCEEDED
Déployer un workflow qui génère des historiques de pays (Gemini Pro)
Déployez un workflow qui fait défiler une liste de pays en entrée
parallèle
et utilise une méthode de connecteur
(generateContent
) pour envoyer une demande à Gemini Pro
le point de terminaison de l'éditeur. Cette méthode permet de générer du contenu avec
des entrées multimodales.
Le workflow renvoie les historiques des pays générés par le modèle, en les combinant dans une carte.
Pour en savoir plus sur les paramètres du corps de la requête HTTP utilisés lors de la requête le LLM et les éléments du corps de la réponse, consultez Documentation de référence de l'API Gemini
Console
Dans la console Google Cloud, accédez à la page Workflows.
Cliquez sur
Créer.Saisissez un nom pour le nouveau workflow:
gemini-pro-country-histories
.Dans la liste Région, sélectionnez us-central1 (Iowa).
Dans le champ Compte de service, sélectionnez le compte de service que vous avez précédemment créé.
Cliquez sur Suivant.
Dans l'éditeur de workflow, saisissez la définition suivante pour votre workflow :
Cliquez sur Déployer.
gcloud
Créez un fichier de code source pour votre workflow:
touch gemini-pro-country-histories.yaml
Dans un éditeur de texte, copiez le workflow suivant dans votre fichier de code source:
Déployez le workflow en saisissant la commande suivante :
gcloud workflows deploy gemini-pro-country-histories \ --source=gemini-pro-country-histories.yaml \ --location=us-central1 \ --service-account=SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com
Exécuter le workflow
L'exécution d'un workflow exécute la définition actuelle du workflow associé au workflow.
Console
Dans la console Google Cloud, accédez à la page Workflows.
Sur la page Workflows, sélectionnez l'icône gemini-pro-country-histories pour accéder à sa page d'informations.
Sur la page Détails du workflow, cliquez sur play_arrow Exécuter.
Dans le champ Entrée, saisissez la commande suivante:
{"countries":["Argentina", "Bhutan", "Cyprus", "Denmark", "Ethiopia"]}
Cliquez à nouveau sur Exécuter.
Affichez les résultats du workflow dans le volet Output (Résultat).
La sortie devrait ressembler à ce qui suit :
{ "Argentina": "The history of Argentina is a complex and fascinating one, marked by periods of prosperity and decline, political [...] "Bhutan": "The history of Bhutan is a rich and fascinating one, dating back to the 7th century AD. Here is a brief overview: [...] "Cyprus": "The history of Cyprus is a long and complex one, spanning over 10,000 years. The island has been ruled by a succession [...] "Denmark": "1. **Prehistory and Early History (c. 12,000 BC - 800 AD)**\\n - The earliest evidence of human habitation in Denmark [...] "Ethiopia": "The history of Ethiopia is a long and complex one, stretching back to the earliest human civilizations. The country is [...] }
gcloud
Ouvrez un terminal.
Exécutez le workflow :
gcloud workflows run gemini-pro-country-histories \ --data='{"countries":["Argentina", "Bhutan", "Cyprus", "Denmark", "Ethiopia"]}' \ --location=us-central1
Les résultats de l'exécution devraient ressembler à ce qui suit :
Waiting for execution [7ae1ccf1-29b7-4c2c-99ec-7a12ae289391] to complete...done. argument: '{"countries":["Argentina","Bhutan","Cyprus","Denmark","Ethiopia"]}' createTime: '2024-02-09T16:25:16.742349156Z' duration: 12.075968673s endTime: '2024-02-09T16:25:28.818317829Z' name: projects/1051295516635/locations/us-central1/workflows/gemini-pro-country-histories/executions/7ae1ccf1-29b7-4c2c-99ec-7a12ae289391 result: "{\"Argentina\":\"The history of Argentina can be traced back to the arrival\ [...] n* 2015: Argentina elects Mauricio Macri as president.\",\"Bhutan\":\"The history\ [...] \ natural beauty, ancient monasteries, and friendly people.\",\"Cyprus\":\"The history\ [...] ,\"Denmark\":\"The history of Denmark can be traced back to the Stone Age, with\ [...] \ a high standard of living.\",\"Ethiopia\":\"The history of Ethiopia is long and\ [...] startTime: '2024-02-09T16:25:16.742349156Z' state: SUCCEEDED
Déployer un workflow qui génère des histoires de pays (PaLM 2 pour le texte)
Vous ne souhaitez peut-être pas utiliser Gemini Pro comme modèle. La
l'exemple suivant utilise un flux de travail semblable au précédent. Toutefois, il utilise
une méthode de connecteur
(predict
) pour envoyer une requête à un PaLM 2
pour le point de terminaison de l'éditeur de texte. La méthode effectue une prédiction en ligne.
Pour en savoir plus sur les paramètres du corps de la requête HTTP utilisés lors de la requête le LLM et les éléments du corps de la réponse, consultez PaLM 2 pour la documentation de référence de l'API Text
Console
Dans la console Google Cloud, accédez à la page Workflows.
Cliquez sur
Créer.Saisissez un nom pour le nouveau workflow:
text-bison-country-histories
.Dans la liste Région, sélectionnez us-central1 (Iowa).
Dans le champ Compte de service, sélectionnez le compte de service que vous avez précédemment créé.
Cliquez sur Suivant.
Dans l'éditeur de workflow, saisissez la définition suivante pour votre workflow:
Notez qu'en fonction du modèle utilisé, vous devrez peut-être supprimer les des espaces blancs inutiles dans la réponse.
Cliquez sur Déployer.
gcloud
Créez un fichier de code source pour votre workflow:
touch text-bison-country-histories.yaml
Dans un éditeur de texte, copiez le workflow suivant dans votre fichier de code source:
Notez qu'en fonction du modèle utilisé, vous devrez peut-être supprimer les des espaces blancs inutiles dans la réponse.
Déployez le workflow en saisissant la commande suivante :
gcloud workflows deploy text-bison-country-histories \ --source=text-bison-country-histories.yaml \ --location=us-central1 \ --service-account=SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com
Déployer un workflow qui résume un document volumineux (Gemini Pro)
Déployez un workflow qui divise un document volumineux en plusieurs parties, ce qui
http.post
à un point de terminaison d'éditeur Gemini Pro
parallèle afin que le modèle puisse résumer chaque partie en même temps. Enfin, le workflow
combine tous les résumés partiels en un seul.
Pour en savoir plus sur les paramètres du corps de la requête HTTP utilisés lors de la requête le LLM et les éléments du corps de la réponse, consultez Documentation de référence de l'API Gemini
La définition du workflow suppose que vous avez créé un bucket Cloud Storage
dans lequel vous pouvez importer un fichier texte. Pour en savoir plus,
à propos du connecteur Workflows (googleapis.storage.v1.objects.get
)
utilisée pour récupérer des objets dans le bucket Cloud Storage, consultez la
Documentation de référence sur les connecteurs
Après avoir déployé le workflow, vous pouvez l'exécuter en créant un workflow approprié
déclencheur Eventarc, puis en important un fichier dans le bucket. Pour
Pour en savoir plus, consultez
Acheminez les événements Cloud Storage vers Workflows.
Notez que d'autres API doivent être activées et que d'autres rôles doivent être
y compris en accordant à votre compte de service le rôle "Utilisateur des objets Storage"
(roles/storage.objectUser
) compatible avec l'utilisation de Cloud Storage
d'objets. Pour en savoir plus, consultez les
Préparer la création d'un déclencheur.
Console
Dans la console Google Cloud, accédez à la page Workflows.
Cliquez sur
Créer.Saisissez un nom pour le nouveau workflow:
gemini-pro-summaries
.Dans la liste Région, sélectionnez us-central1 (Iowa).
Dans le champ Compte de service, sélectionnez le compte de service que vous avez précédemment créé.
Cliquez sur Suivant.
Dans l'éditeur de workflow, saisissez la définition suivante pour votre workflow :
Cliquez sur Déployer.
gcloud
Créez un fichier de code source pour votre workflow:
touch gemini-pro-summaries.yaml
Dans un éditeur de texte, copiez le workflow suivant dans votre fichier de code source:
Déployez le workflow en saisissant la commande suivante :
gcloud workflows deploy gemini-pro-summaries \ --source=gemini-pro-summaries.yaml \ --location=us-central1 \ --service-account=SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com
Effectuer un nettoyage
Pour éviter que les ressources utilisées lors de ce tutoriel soient facturées sur votre compte Google Cloud, supprimez le projet contenant les ressources, ou conservez le projet et supprimez les ressources individuelles.
Supprimer le projet
Console
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
gcloud
Delete a Google Cloud project:
gcloud projects delete PROJECT_ID
Supprimer des ressources individuelles
Supprimer les workflows que vous avez créés dans ce tutoriel.
Étape suivante
- En savoir plus sur les connecteurs Workflows
- En savoir plus sur la méthode
generateContent
de Vertex AI - En savoir plus sur la méthode
predict
de Vertex AI