在 Google Colab 中运行教程#
当你在 Google Colab 中运行教程时,可能需要满足一些额外的要求和依赖项,才能使教程正常工作。本节包含关于如何配置各种设置的说明,以便在 Google Colab 中成功运行 PyTorch 教程。
Google Colab 中的 PyTorch 版本#
当你运行一个需要刚刚发布的 PyTorch 版本的教程时,该版本可能尚未在 Google Colab 中提供。要检查你是否安装了所需的 torch 和兼容的域库,请运行 !pip list。
如果安装的 PyTorch 版本低于要求,请卸载并重新安装,运行以下命令:
!pip3 uninstall --yes torch torchaudio torchvision torchtext torchdata
!pip3 install torch torchaudio torchvision torchtext torchdata
在 Colab 中使用 Google Drive 中的教程数据#
我们在教程中添加了一项新功能,允许用户在 Google Colab 中打开与教程相关的 Notebook。为了让更复杂的教程正常工作,你可能需要将数据复制到你的 Google Drive 帐户。
在本例中,我们将演示如何修改 Colab 中的 Notebook 以便使用 Chatbot 教程。为此,你首先需要登录 Google Drive。(有关如何访问 Colab 中数据的完整说明,你可以在此处查看他们的示例 Notebook。)
要开始,请在浏览器中打开Chatbot 教程。
在页面顶部点击 在 Google Colab 中运行。
文件将在 Colab 中打开。
如果你选择 运行时,然后选择 全部运行,你将收到一个错误,因为找不到文件。
为了解决这个问题,我们将把所需文件复制到我们的 Google Drive 帐户。
登录 Google Drive。
在 Google Drive 中,创建一个名为
data的文件夹,并在其中创建一个名为cornell的子文件夹。访问 Cornell Movie Dialogs Corpus 并下载 movie-corpus ZIP 文件。
在本地计算机上解压该文件。
将
utterances.jsonl文件复制到你在 Google Drive 中创建的data/cornell文件夹。
现在我们需要编辑 Colab 中的文件,使其指向 Google Drive 上的文件。
在 Colab 中,在以 corpus_name 开头的行上方,将以下内容添加到代码部分顶部:
from google.colab import drive
drive.mount('/content/gdrive')
更改接下来的两行:
将
corpus_name的值更改为"cornell"。更改以
corpus开头的行,使其如下所示:
corpus = os.path.join("/content/gdrive/My Drive/data", corpus_name)
我们现在指向了上传到 Drive 的文件。
现在,当你点击代码部分的 运行单元格 按钮时,系统会提示你授权 Google Drive,你将获得一个授权码。将该代码粘贴到 Colab 中的提示符中,一切就绪。
从 运行时 / 全部运行 菜单命令中重新运行 Notebook,你将看到它正在处理。(请注意,此教程需要很长时间才能运行。)
希望这个例子能为你提供一个良好的起点,让你能够在 Colab 中运行一些更复杂的教程。随着我们在 PyTorch 教程网站上对 Colab 的使用不断发展,我们将寻求方法来为用户提供更便捷的体验。
启用 CUDA#
某些教程需要 CUDA 启用的设备(NVIDIA GPU),这涉及到在执行教程之前更改运行时类型。要更改 Google Colab 中的运行时,在顶部下拉菜单中选择 运行时,然后选择 更改运行时类型。在 硬件加速器 下,选择 T4 GPU,然后点击 保存。