在 Google Colab 中运行教程#
当您在 Google Colab 中运行教程时,可能需要满足额外的要求和依赖项,教程才能正常工作。本节包含有关如何配置各种设置以成功在 Google Colab 中运行 PyTorch 教程的注意事项。
Google Colab 中的 PyTorch 版本#
当您运行需要刚刚发布的 PyTorch 版本的教程时,该版本可能尚未在 Google Colab 中提供。要检查您是否安装了所需的 torch
和兼容的领域库,请运行 !pip list
。
如果安装的 PyTorch 版本低于要求,请通过运行以下命令卸载并重新安装
!pip3 uninstall --yes torch torchaudio torchvision torchtext torchdata
!pip3 install torch torchaudio torchvision torchtext torchdata
在 Colab 中使用 Google Drive 中的教程数据#
我们为教程添加了一项新功能,允许用户在 Google Colab 中打开与教程关联的笔记本。您可能需要将数据复制到您的 Google Drive 帐户才能使更复杂的教程正常工作。
在此示例中,我们将演示如何在 Colab 中更改笔记本以使用聊天机器人教程。为此,您首先需要登录 Google Drive。(有关如何在 Colab 中访问数据的完整说明,您可以在此处查看其示例笔记本。)
首先在浏览器中打开聊天机器人教程。
在页面顶部单击在 Google Colab 中运行。
文件将在 Colab 中打开。
如果选择运行时,然后选择全部运行,您将收到错误,因为找不到文件。
要解决此问题,我们将把所需的文件复制到我们的 Google Drive 帐户中。
登录 Google Drive。
在 Google Drive 中,创建一个名为
data
的文件夹,并在其中创建一个名为cornell
的子文件夹。访问康奈尔电影对话语料库并下载 movie-corpus ZIP 文件。
在本地计算机上解压文件。
将文件
utterances.jsonl
复制到您在 Google Drive 中创建的data/cornell
文件夹中。
现在我们需要在 Colab 中编辑文件,使其指向 Google Drive 上的文件。
在 Colab 中,在代码部分的顶部,在以 corpus\_name
开头的行上方添加以下内容
from google.colab import drive
drive.mount('/content/gdrive')
更改接下来的两行
将
corpus\_name
值更改为"cornell"
。将以
corpus
开头的行更改为
corpus = os.path.join("/content/gdrive/My Drive/data", corpus_name)
我们现在指向已上传到 Drive 的文件。
现在,当您单击代码部分的运行单元格按钮时,系统会提示您授权 Google Drive,您将获得一个授权码。将代码粘贴到 Colab 中的提示符中,您就完成了设置。
从运行时/全部运行菜单命令重新运行笔记本,您将看到它正在处理。(请注意,此教程运行时间较长。)
希望此示例能为您在 Colab 中运行一些更复杂的教程提供一个良好的起点。随着我们在 PyTorch 教程网站上对 Colab 使用的演变,我们将寻求使这更容易用户使用的方法。
启用 CUDA#
某些教程需要支持 CUDA 的设备(NVIDIA GPU),这需要在执行教程之前更改运行时类型。要在 Google Colab 中更改运行时,请在顶部下拉菜单中选择运行时,然后选择更改运行时类型。在硬件加速器下,选择 T4 GPU
,然后单击 保存
。