试用 Gemini 1.5 模型，这是 Vertex AI 中最新的多模态模型，看看您可以运用多达 200 万词元的上下文窗口构建怎样的应用。 试用 Gemini 1.5 模型，这是 Vertex AI 中最新的多模态模型，看看您可以运用多达 200 万词元的上下文窗口构建怎样的应用。

使用 Google Cloud 控制台将语音转录为文字

此快速入门为您介绍 Cloud Speech-to-Text 控制台。在本快速入门中，您将创建和优化转录，并了解如何在自己的应用中将此配置与 Speech-to-Text API 搭配使用。

如需了解如何使用 REST API 而非控制台发送请求和接收响应，请参阅准备工作页面。

准备工作

在开始使用 Speech-to-Text 控制台之前，您必须在 Google Cloud Platform Console 中启用 API。以下步骤将引导您完成后续操作：

在项目上启用 Speech-to-Text。
确保已针对 Speech-to-Text 启用结算功能。

设置您的 Google Cloud 项目

登录 Google Cloud 控制台
转到项目选择器页面

您可以选择现有项目，也可以创建一个新项目。如需详细了解如何创建项目，请参阅 Google Cloud Platform 文档。
如果您创建新项目，则系统会提示您将一个结算账号关联到该项目。如果您使用的是现有项目，请确保已启用结算功能。

了解如何确认项目已启用结算功能。

注意：您必须启用结算功能才能使用 Speech-to-Text API，但除非您超出免费配额，否则不需要支付费用。如需了解详情，请参阅价格页面。
选择项目并将其关联到结算账号后，您就可以启用 Speech-to-Text API。转到页面顶部的搜索产品和资源栏，然后输入“speech”。
从结果列表中选择 Cloud Speech-to-Text API。
要在不将其与项目关联的情况下试用 Speech-to-Text，请选择试用此 API 选项。如需启用 Speech-to-Text API 以用于您的项目，请点击启用。

创建转录

执行此任务所需的权限

您必须拥有以下权限才能执行此任务：

storage.buckets.get
storage.buckets.list
storage.buckets.update

在项目级层或存储桶级层：

storage.objects.create
storage.objects.delete
storage.objects.get
storage.objects.list
storage.objects.update

使用 Google Cloud 控制台创建新的转写：

音频配置

打开 Speech-to-Text 概览。
点击创建转录。
- 如果这是您第一次使用控制台，系统会要求您选择 Cloud Storage 中存储配置和转录的位置。
在创建转录页面中，上传源音频文件。您可以选择保存在 Cloud Storage 中的现有文件，也可以将新文件上传到指定的 Cloud Storage 目标位置。
选择上传的音频文件的编码类型。
指定其采样率。
点击继续。您将转到转录选项。