在 Google Colab 中运行教程#
当您在 Google Colab 中运行教程时,为了使教程正常工作,可能需要满足额外的要求和依赖项。本节包含关于如何配置各种设置以在 Google Colab 中成功运行 PyTorch 教程的说明。
Google Colab 中的 PyTorch 版本#
当您运行需要最新发布的 PyTorch 版本的教程时,该版本可能尚未在 Google Colab 中可用。要检查是否安装了所需的 torch 及其兼容的领域库,请运行 !pip list。
如果安装的 PyTorch 版本低于要求,请运行以下命令将其卸载并重新安装
!pip3 uninstall --yes torch torchaudio torchvision torchtext torchdata
!pip3 install torch torchaudio torchvision torchtext torchdata
在 Colab 中使用来自 Google Drive 的教程数据#
我们在教程中添加了一项新功能,允许用户在 Google Colab 中打开与教程关联的笔记本。为了使较为复杂的教程能够运行,您可能需要将数据复制到您的 Google Drive 账户中。
在这个示例中,我们将演示如何修改 Colab 中的笔记本以配合聊天机器人(Chatbot)教程使用。为此,您首先需要登录 Google Drive。(有关如何在 Colab 中访问数据的完整说明,您可以查看他们的示例笔记本 这里。)
首先,在浏览器中打开 聊天机器人教程。
在页面顶部点击 Run in Google Colab。
文件将在 Colab 中打开。
如果您选择 Runtime(运行时),然后选择 Run All(全部运行),您将收到一个错误,因为找不到文件。
为了修复这个问题,我们将把所需的文件复制到我们的 Google Drive 账户中。
登录 Google Drive。
在 Google Drive 中,创建一个名为
data的文件夹,并在其中创建一个名为cornell的子文件夹。访问 Cornell Movie Dialogs Corpus 并下载 movie-corpus ZIP 文件。
在本地计算机上解压该文件。
将文件
utterances.jsonl复制到您在 Google Drive 中创建的data/cornell文件夹中。
现在我们需要编辑 Colab 中的文件,使其指向 Google Drive 中的文件。
在 Colab 中,在以 corpus\_name 开头的行之上,将以下内容添加到代码段的顶部
from google.colab import drive
drive.mount('/content/gdrive')
修改接下来的两行
将
corpus\_name的值改为"cornell"。将以
corpus开头的行改为如下内容
corpus = os.path.join("/content/gdrive/My Drive/data", corpus_name)
现在我们指向了上传到 Drive 的文件。
现在,当您点击代码段的 Run cell(运行单元格)按钮时,系统会提示您授权 Google Drive,并且您将获得一个授权代码。将该代码粘贴到 Colab 的提示框中,您就准备就绪了。
通过 Runtime / Run All 菜单命令重新运行笔记本,您将看到它开始处理。(请注意,此教程运行时间较长。)
希望这个示例能为您在 Colab 中运行一些较复杂的教程提供一个良好的起点。随着我们在 PyTorch 教程网站上对 Colab 使用的不断演进,我们将寻找让用户操作更简便的方法。
启用 CUDA#
某些教程需要启用 CUDA 的设备(NVIDIA GPU),这涉及到在执行教程之前更改运行时类型。要在 Google Colab 中更改运行时,请在顶部下拉菜单中选择 Runtime,然后选择 Change runtime type。在 Hardware accelerator(硬件加速器)下,选择 T4 GPU,然后点击 Save。