了解 TPU¶
Google Cloud TPU 是定制设计的 AI 加速器,针对大型 AI 模型的训练和推理进行了优化。它们非常适合各种用例,例如聊天机器人、代码生成、媒体内容生成、合成语音、视觉服务、推荐引擎、个性化模型等。
Cloud TPU 旨在以成本效益的方式扩展,以适应各种 AI 工作负载,涵盖训练、微调和推理。Cloud TPU 提供了加速领先 AI 框架(包括 PyTorch、JAX 和 TensorFlow)上工作负载的灵活性。通过 Google Kubernetes Engine (GKE) 中的 Cloud TPU 集成,无缝编排大规模 AI 工作负载。利用动态工作负载调度器,通过同时调度所有必需的加速器来提高工作负载的可扩展性。寻求最简单方式开发 AI 模型的客户还可以利用 Vertex AI(一个完全托管的 AI 平台)中的 Cloud TPU。
有关更多信息,请参阅