了解 TPU¶
Google Cloud TPU 是定制设计的 AI 加速器,针对大型 AI 模型的训练和推理进行了优化。它们非常适合各种用例,例如聊天机器人、代码生成、媒体内容生成、合成语音、视觉服务、推荐引擎、个性化模型等。
Cloud TPU 设计用于在成本效益方面扩展,以适应广泛的 AI 工作负载,涵盖训练、微调和推理。Cloud TPU 提供了灵活性,可以加速在领先的 AI 框架(包括 PyTorch、JAX 和 TensorFlow)上的工作负载。通过 Google Kubernetes Engine (GKE) 中的 Cloud TPU 集成,无缝编排大型 AI 工作负载。利用动态工作负载调度程序,通过同时调度所有必需的加速器来提高工作负载的可伸缩性。寻求最简单方式开发 AI 模型的客户还可以利用 Vertex AI 中的 Cloud TPU,Vertex AI 是一个完全托管的 AI 平台。
有关更多信息,请参阅