创建文档处理器,帮助自动执行繁琐的任务、改进数据提取功能,并从非结构化或结构化文档信息中获得更深入的数据洞见。Document AI 可帮助开发者创建高准确率处理器,用于对文档进行提取、分类和拆分。
优势
使用生成式 AI 提取数据或对文档进行分类,无需任何训练即可开始使用。只需将文档发布到企业级 API 端点,即可获得结构化数据。
Document AI 由最新的基础模型提供支持,针对文档任务进行了优化。此外,借助强大的微调和自动添加标签功能,该平台还提供了多种途径来达到所需的准确率。
使用生成式 AI 构建并数字化文档中的信息,从而获取更深入的数据洞见,帮助企业做出更明智的决策。
演示
使用生成式 AI 从文档中提取数据。如需了解完整的产品功能,请访问 Google Cloud 控制台中的 Document AI。
主要特性
Document AI Workbench 提供了一种构建自定义处理器的简单方法,用于对文档中的结构化数据进行分类、拆分和提取。Workbench 由生成式 AI 提供支持,这意味着开箱即可使用,从而在众多文档中获得准确的结果。此外,只需提供 10 个文档来对大型模型进行微调,即可实现更高的准确度 - 只需点击一个按钮或调用 API 即可实现。
立即试用或了解详情。
借助 Enterprise Document OCR,用户可以利用 Google 25 年的光学字符识别 (OCR) 研究成果。OCR 由在商业文档上训练的模型提供支持,可以检测 PDF 文件中的文本以及 200 多种语言的扫描文档图片。该产品可以查看文档的结构,以识别文本块、段落、行、字词和符号等布局特征。高级功能包括一流的手写识别功能(50 种语言)、识别数学公式、检测字体样式信息以及提取复选框和单选按钮等选择标记。
建议您立即试用 Document OCR,以提取准确的文本和布局。
开发者使用 Form Parser 可从标准表单中获取字段和值,提取一般实体(包括名称、地址和价格),并构建表格中包含的数据。此产品开箱即用,无需任何培训或自定义,可用于各种文档自定义。
探索使用 Form Parser 处理文档。
试用适用于常用文档类型(包括 W2、工资条、银行对账单、账单、费用、美国驾照、美国护照和身份证明)的预训练模型。
在处��器库中探索预训练选项。
客户
Document AI 帮助客户改善欺诈检测的成效、实现客户服务自动化,以及处理临床试验数据。
最新资讯
订阅 Google Cloud 简报,了解产品动态、活动安排、特别优惠以及更多资讯。
文档
使用场景
使用 Document AI Workbench 从文档中提取结构化数据,从而自动输入数据。典型的应用包括邮局、装运站、抵押贷款处理部门、采购等。您可以利用这些数据做出更高效、更有效的业务决策。
试用自定义提取器。
您现在可以将文档中的元数据直接提取到 BigQuery 对象表中。将解析后的数据与其他 BigQuery 表无缝联接,将结构化和非结构化数据组合在一起,为全面的文档分析铺平道路。
如需详细了解 BigQuery 和 Document AI 集成,请点击此处。
在文档流入业务流程时为文档分配类别或类,使文档更易于管理、搜索、过滤或分析。自定义拆分器和分类器使用机器学习来准确预测一个文件中的单个文档或多个文档并对其进行分类。使用这些产品可以提高文档流程的效率。
了解详情并试用自定义拆分器和自定义分类器。
SaaS 客户和 ISV 合作伙伴可以利用生成式 AI 快速改进和扩展其文档处理解决方案。借助简单的 API 预测端点和文档响应格式,客户可以将文档应用提升到新的水平。
借助 Enterprise Document OCR,用户可以从无法用于训练机器学习模型的归档内容中创造价值。OCR 有助于从扫描的文档、图表、报告和演示文稿中提取文本,然后保存到云端存储空间或数据仓库。使用这些高质量的 OCR 输出,您可以加快数字化转型计划,例如训练特定于您的业务的机器学习模型。
捕获新的生成式 AI 架构和框架的文档信息。通过将 OCR 和 Vertex AI PaLM API 相结合,用户可以从文档中挖掘有价值的数据,从而打造文档问答体验、执行自动文档比较,甚至生成新的文档。
价格
Document AI 提供透明、经济高效的价格方案,满足您的所有文档处理、模型训练和存储需求。如需了解详情,请访问我们的价格页面。
如果您使用非美元货币付费,请参阅 Google Cloud SKU 上以您的币种列出的价格。
Cloud AI 产品遵循我们的服务等级协议 (SLA) 政策。这些产品在延迟时间或可用性方面的保证可能与其他 Google Cloud 服务有所不同。