C++ 前端#
PyTorch C++ 前端是一个 C++17 库,支持 CPU 和 GPU 张量计算,具备自动微分和用于最先进机器学习应用的高级构建模块。
描述#
PyTorch C++ 前端可以被看作是 PyTorch Python 前端的 C++ 版本,为机器学习和神经网络提供自动微分和各种更高级别的抽象。具体来说,它包含以下组件:
组件 |
描述 |
---|---|
|
自动微分、高效的 CPU 和 GPU 支持的张量 |
|
用于神经网络建模的可组合模块集合 |
|
用于训练模型的优化算法,如 SGD、Adam 或 RMSprop |
|
数据集、数据管道以及多线程、异步数据加载器 |
|
用于存储和加载模型检查点的序列化 API |
|
用于将您的 C++ 模型绑定到 Python 的连接库 |
|
纯 C++ 访问 TorchScript JIT 编译器 |
端到端示例#
这是一个在 MNIST 数据集上定义和训练简单神经网络的简单端到端示例。
#include <torch/torch.h>
// Define a new Module.
struct Net : torch::nn::Module {
Net() {
// Construct and register two Linear submodules.
fc1 = register_module("fc1", torch::nn::Linear(784, 64));
fc2 = register_module("fc2", torch::nn::Linear(64, 32));
fc3 = register_module("fc3", torch::nn::Linear(32, 10));
}
// Implement the Net's algorithm.
torch::Tensor forward(torch::Tensor x) {
// Use one of many tensor manipulation functions.
x = torch::relu(fc1->forward(x.reshape({x.size(0), 784})));
x = torch::dropout(x, /*p=*/0.5, /*train=*/is_training());
x = torch::relu(fc2->forward(x));
x = torch::log_softmax(fc3->forward(x), /*dim=*/1);
return x;
}
// Use one of many "standard library" modules.
torch::nn::Linear fc1{nullptr}, fc2{nullptr}, fc3{nullptr};
};
int main() {
// Create a new Net.
auto net = std::make_shared<Net>();
// Create a multi-threaded data loader for the MNIST dataset.
auto data_loader = torch::data::make_data_loader(
torch::data::datasets::MNIST("./data").map(
torch::data::transforms::Stack<>()),
/*batch_size=*/64);
// Instantiate an SGD optimization algorithm to update our Net's parameters.
torch::optim::SGD optimizer(net->parameters(), /*lr=*/0.01);
for (size_t epoch = 1; epoch <= 10; ++epoch) {
size_t batch_index = 0;
// Iterate the data loader to yield batches from the dataset.
for (auto& batch : *data_loader) {
// Reset gradients.
optimizer.zero_grad();
// Execute the model on the input data.
torch::Tensor prediction = net->forward(batch.data);
// Compute a loss value to judge the prediction of our model.
torch::Tensor loss = torch::nll_loss(prediction, batch.target);
// Compute gradients of the loss w.r.t. the parameters of our model.
loss.backward();
// Update the parameters based on the calculated gradients.
optimizer.step();
// Output the loss and checkpoint every 100 batches.
if (++batch_index % 100 == 0) {
std::cout << "Epoch: " << epoch << " | Batch: " << batch_index
<< " | Loss: " << loss.item<float>() << std::endl;
// Serialize your model periodically as a checkpoint.
torch::save(net, "net.pt");
}
}
}
}
要查看更多关于使用 PyTorch C++ 前端的完整示例,请参阅 示例存储库。
理念#
PyTorch 的 C++ 前端在设计时就秉持这样的理念:Python 前端非常出色,应尽可能使用;但在某些情况下,性能和可移植性要求使得使用 Python 解释器不可行。例如,Python 在低延迟、高性能或多线程环境(如视频游戏或生产服务器)中表现不佳。C++ 前端的目标是解决这些用例,同时不牺牲 Python 前端的使用体验。
因此,C++ 前端的编写遵循了几个哲学目标:
在设计、命名、约定和功能上紧密模仿 Python 前端。虽然两者之间可能存在一些差异(例如,我们可能删除了已弃用的功能或修复了 Python 前端中的“痛点”),但我们保证将 Python 模型移植到 C++ 所付出的努力应该仅限于语言特性的翻译,而不是修改功能或行为。
优先考虑灵活性和用户友好性,而非微观优化。在 C++ 中,您通常可以获得最优代码,但代价是用户体验极差。灵活性和动态性是 PyTorch 的核心,C++ 前端力求保留这种体验,在某些情况下牺牲性能(或“隐藏”性能调优选项)以保持 API 简单易懂。我们希望那些不以 C++ 为生的研究人员也能使用我们的 API。
需要说明的是:Python 不一定比 C++ 慢!PyTorch Python 前端几乎所有计算密集型操作(尤其是任何数值运算)都调用 C++ 后端,这些操作将占据程序的大部分时间。如果您更倾向于编写 Python,并且能够承受使用 Python,我们建议使用 PyTorch 的 Python 接口。但是,如果您更倾向于编写 C++,或者由于多线程、延迟或部署需求必须编写 C++,那么 PyTorch 的 C++ 前端提供了一个与 Python 版本一样方便、灵活、友好和直观的 API。这两种前端服务于不同的用例,并且协同工作,没有一种旨在无条件地取代另一种。