糖尿病康复 > pytorch初入门学习记录

pytorch初入门学习记录

时间：2023-11-25 21:18:13

相关推荐

pytorch初入门学习记录

PyTorch第一步

1.Tensor

from __future__ import print_functionimport torch as t

# 构建 5x3 矩阵，只是分配了空间，未初始化x = t.Tensor(5, 3)x = t.Tensor([[1,2],[3,4]])x

tensor([[1., 2.],[3., 4.]])

# 使用[0,1]均匀分布随机初始化二维数组x = t.rand(5, 3) x

tensor([[0.0626, 0.2190, 0.8587],[0.9044, 0.4278, 0.8374],[0.1144, 0.4394, 0.7455],[0.5614, 0.7953, 0.2981],[0.2485, 0.6495, 0.5445]])

print(x.size()) # 查看x的形状x.size()[1], x.size(1) # 查看列的个数, 两种写法等价

torch.Size([5, 3])(3, 3)

【注】torch.Size 是tuple对象的子类，因此它支持tuple的所有操作，如x.size()[0]

加法

y = t.rand(5, 3)# 加法的第一种写法x + y

tensor([[0.4237, 0.8735, 0.9449],[1.7534, 1.3813, 1.5050],[0.5260, 1.1490, 0.7811],[1.4929, 0.8446, 1.1280],[0.3338, 1.5457, 0.8867]])

# 加法的第二种写法t.add(x, y)

tensor([[0.4237, 0.8735, 0.9449],[1.7534, 1.3813, 1.5050],[0.5260, 1.1490, 0.7811],[1.4929, 0.8446, 1.1280],[0.3338, 1.5457, 0.8867]])

# 加法的第三种写法：指定加法结果的输出目标为resultresult = t.Tensor(5, 3) # 预先分配空间t.add(x, y, out=result) # 输入到resultresult

tensor([[0.4237, 0.8735, 0.9449],[1.7534, 1.3813, 1.5050],[0.5260, 1.1490, 0.7811],[1.4929, 0.8446, 1.1280],[0.3338, 1.5457, 0.8867]])

print('最初y')print(y)print('第一种加法，y的结果')y.add(x) # 普通加法，不改变y的内容print(y)print('第二种加法，y的结果')y.add_(x) # inplace 加法，y变了print(y)

最初ytensor([[0.3611, 0.6546, 0.0862],[0.8490, 0.9535, 0.6677],[0.4116, 0.7096, 0.0356],[0.9315, 0.0494, 0.8299],[0.0853, 0.8961, 0.3422]])第一种加法，y的结果tensor([[0.3611, 0.6546, 0.0862],[0.8490, 0.9535, 0.6677],[0.4116, 0.7096, 0.0356],[0.9315, 0.0494, 0.8299],[0.0853, 0.8961, 0.3422]])第二种加法，y的结果tensor([[0.4237, 0.8735, 0.9449],[1.7534, 1.3813, 1.5050],[0.5260, 1.1490, 0.7811],[1.4929, 0.8446, 1.1280],[0.3338, 1.5457, 0.8867]])

【注】函数名后面带下划线_ 的函数会修改Tensor本身。例如，x.add_(y)和x.t_()会改变 x，但x.add(y)和x.t()返回一个新的Tensor，而x不变。

# Tensor的选取操作与Numpy类似：这里输出x的第1列（下标从0开始）数据print(x)print(x[:, 1])

tensor([[0.0626, 0.2190, 0.8587],[0.9044, 0.4278, 0.8374],[0.1144, 0.4394, 0.7455],[0.5614, 0.7953, 0.2981],[0.2485, 0.6495, 0.5445]])tensor([0.2190, 0.4278, 0.4394, 0.7953, 0.6495])

Tensor还支持很多操作，包括数学运算、线性代数、选择、切片等等，其接口设计与Numpy极为相似。更详细的使用方法，会在第三章系统讲解。Tensor和Numpy的数组之间的互操作非常容易且快速。对于Tensor不支持的操作，可以先转为Numpy数组处理，之后再转回Tensor。

a = t.ones(5) # 新建一个全1的Tensora

tensor([1., 1., 1., 1., 1.])

b = a.numpy() # Tensor -> Numpyb

array([1., 1., 1., 1., 1.], dtype=float32)

import numpy as npa = np.ones(5)b = t.from_numpy(a) # Numpy->Tensorprint(a)print(b)

[1. 1. 1. 1. 1.]tensor([1., 1., 1., 1., 1.], dtype=torch.float64)

Tensor和numpy对象共享内存，所以他们之间的转换很快，而且几乎不会消耗什么资源。但这也意味着，如果其中一个变了，另外一个也会随之改变。

b.add_(1) # 以`_`结尾的函数会修改自身print(a)print(b) # Tensor和Numpy共享内存

[2. 2. 2. 2. 2.]tensor([2., 2., 2., 2., 2.], dtype=torch.float64)

如果你想获取某一个元素的值，可以使用scalar.item。直接tensor[idx]得到的还是一个tensor: 一个0-dim 的tensor，一般称为scalar.

scalar = b[0]scalar

tensor(2., dtype=torch.float64)

scalar.size() #0-dim

torch.Size([])

scalar.item() # 使用scalar.item()能从中取出python对象的数值

2.0

tensor = t.tensor([2]) # 注意和scalar的区别tensor,scalar

(tensor([2]), tensor(2., dtype=torch.float64))

tensor.size(),scalar.size()

(torch.Size([1]), torch.Size([]))

# 只有一个元素的tensor也可以调用`tensor.item()`tensor.item(), scalar.item()

(2, 2.0)

此外在pytorch中还有一个和np.array 很类似的接口: torch.tensor, 二者的使用十分类似。

tensor = t.tensor([3,4]) # 新建一个包含 3，4 两个元素的tensor

scalar = t.tensor(3)scalar

tensor(3)

old_tensor = tensornew_tensor = old_tensor.clone()new_tensor[0] = 1111old_tensor, new_tensor

(tensor([3, 4]), tensor([1111, 4]))

需要注意的是，t.tensor()或者tensor.clone()总是会进行数据拷贝，新tensor和原来的数据不再共享内存。所以如果你想共享内存的话，建议使用torch.from_numpy()或者tensor.detach()来新建一个tensor, 二者共享内存。

new_tensor = old_tensor.detach()new_tensor[0] = 1111old_tensor, new_tensor

(tensor([1111, 4]), tensor([1111, 4]))

2.autograd: 自动微分

深度学习的算法本质上是通过反向传播求导数，而PyTorch的autograd模块则实现了此功能。在Tensor上的所有操作，autograd都能为它们自动提供微分，避免了手动计算导数的复杂过程。

从0.4起, Variable 正式合并入Tensor, Variable 本来实现的自动微分功能，Tensor就能支持。读者还是可以使用Variable(tensor), 但是这个操作其实什么都没做。建议读者以后直接使用tensor.

要想使得Tensor使用autograd功能，只需要设置tensor.requries_grad=True.

# 为tensor设置 requires_grad 标识，代表着需要求导数# pytorch 会自动调用autograd 记录操作x = t.ones(2, 2, requires_grad=True)# 上一步等价于# x = t.ones(2,2)# x.requires_grad = Truex

tensor([[1., 1.],[1., 1.]], requires_grad=True)

y = x.sum()y

tensor(4., grad_fn=<SumBackward0>)

y.grad_fn

<SumBackward0 at 0x25f3331b4c8>

y.backward() # 反向传播,计算梯度

# y = x.sum() = (x[0][0] + x[0][1] + x[1][0] + x[1][1])# 每个值的梯度都为1x.grad

tensor([[1., 1.],[1., 1.]])

注意：grad在反向传播过程中是累加的(accumulated)，这意味着每一次运行反向传播，梯度都会累加之前的梯度，所以反向传播之前需把梯度清零。

y.backward()x.grad

tensor([[2., 2.],[2., 2.]])

# 以下划线结束的函数是inplace操作，会修改自身的值，就像add_x.grad.data.zero_()

tensor([[0., 0.],[0., 0.]])

y.backward()x.grad

tensor([[1., 1.],[1., 1.]])

3.神经网络

Autograd实现了反向传播功能，但是直接用来写深度学习的代码在很多情况下还是稍显复杂，torch.nn是专门为神经网络设计的模块化接口。nn构建于 Autograd之上，可用来定义和运行神经网络。nn.Module是nn中最重要的类，可把它看成是一个网络的封装，包含网络各层定义以及forward方法，调用forward(input)方法，可返回前向传播的结果。

定义网络

定义网络时，需要继承nn.Module，并实现它的forward方法，把网络中具有可学习参数的层放在构造函数__init__中。如果某一层(如ReLU)不具有可学习的参数，则既可以放在构造函数中，也可以不放，但建议不放在其中，而在forward中使用nn.functional代替。

import torch.nn as nnimport torch.nn.functional as Fclass Net(nn.Module):def __init__(self):# nn.Module子类的函数必须在构造函数中执行父类的构造函数# 下式等价于nn.Module.__init__(self)super(Net, self).__init__()# 卷积层 '1'表示输入图片为单通道, '6'表示输出通道数，'5'表示卷积核为5*5self.conv1 = nn.Conv2d(1, 6, 5) # 卷积层self.conv2 = nn.Conv2d(6, 16, 5) # 仿射层/全连接层，y = Wx + bself.fc1 = nn.Linear(16*5*5, 120) self.fc2 = nn.Linear(120, 84)self.fc3 = nn.Linear(84, 10) # class torch.nn.Linear（in_features，out_features，bias = True ）# 对传入数据应用线性变换：y = A x+ b# 参数：# in_features - 每个输入样本的大小# out_features - 每个输出样本的大小# bias - 如果设置为False，则图层不会学习附加偏差。默认值：Truedef forward(self, x): # 卷积 -> 激活 -> 池化 x = F.max_pool2d(F.relu(self.conv1(x)), (2, 2))x = F.max_pool2d(F.relu(self.conv2(x)), 2) # reshape，‘-1’表示列是自适应x = x.view(x.size()[0], -1) # relu 一种激活函数，f(x)=max(0,x)x = F.relu(self.fc1(x)) x = F.relu(self.fc2(x))x = self.fc3(x) return xnet = Net()print(net)

Net((conv1): Conv2d(1, 6, kernel_size=(5, 5), stride=(1, 1))(conv2): Conv2d(6, 16, kernel_size=(5, 5), stride=(1, 1))(fc1): Linear(in_features=400, out_features=120, bias=True)(fc2): Linear(in_features=120, out_features=84, bias=True)(fc3): Linear(in_features=84, out_features=10, bias=True))

只要在nn.Module的子类中定义了forward函数，backward函数就会自动被实现(利用autograd)。在forward 函数中可使用任何tensor支持的函数，还可以使用if、for循环、print、log等Python语法，写法和标准的Python写法一致。

网络的可学习参数通过net.parameters()返回，net.named_parameters可同时返回可学习的参数及名称。

params = list(net.parameters())print(len(params))

10

for name,parameters in net.named_parameters():print(name,':',parameters.size())

conv1.weight : torch.Size([6, 1, 5, 5])conv1.bias : torch.Size([6])conv2.weight : torch.Size([16, 6, 5, 5])conv2.bias : torch.Size([16])fc1.weight : torch.Size([120, 400])fc1.bias : torch.Size([120])fc2.weight : torch.Size([84, 120])fc2.bias : torch.Size([84])fc3.weight : torch.Size([10, 84])fc3.bias : torch.Size([10])

forward函数的输入和输出都是Tensor。

input = t.randn(1, 1, 32, 32)out = net(input)out.size()

torch.Size([1, 10])

net.zero_grad() # 所有参数的梯度清零out.backward(t.ones(1,10)) # 反向传播

需要注意的是，torch.nn只支持mini-batches，不支持一次只输入一个样本，即一次必须是一个batch。但如果只想输入一个样本，则用 input.unsqueeze(0)将batch_size设为１。例如 nn.Conv2d 输入必须是4维的，形如nSamples×nChannels×Height×WidthnSamples \times nChannels \times Height \times WidthnSamples×nChannels×Height×Width。可将nSample设为1，即1×nChannels×Height×Width1 \times nChannels \times Height \times Width1×nChannels×Height×Width。

4.损失函数

nn实现了神经网络中大多数的损失函数，例如nn.MSELoss用来计算均方误差，nn.CrossEntropyLoss用来计算交叉熵损失。

output = net(input) # 预测值target = t.arange(0,10).view(1,10).float() # 真实值criterion = nn.MSELoss() # 确定损失函数loss = criterion(output, target) # 计算损失loss # loss是个scalar，即 0-dim 的数组

tensor(28.3596, grad_fn=<MseLossBackward>)

如果对loss进行反向传播溯源(使用gradfn属性)，可看到它的计算图如下：

input -> conv2d -> relu -> maxpool2d -> conv2d -> relu -> maxpool2d

-> view -> linear -> relu -> linear -> relu -> linear

-> MSELoss

-> loss

当调用loss.backward()时，该图会动态生成并自动微分，也即会自动计算图中参数(Parameter)的导数。

# 运行.backward，观察调用之前和调用之后的gradnet.zero_grad() # 把net中所有可学习参数的梯度清零print('反向传播之前 conv1.bias的梯度')print(net.conv1.bias.grad)loss.backward()print('反向传播之后 conv1.bias的梯度')print(net.conv1.bias.grad)

反向传播之前 conv1.bias的梯度tensor([0., 0., 0., 0., 0., 0.])反向传播之后 conv1.bias的梯度tensor([ 0.0404, 0.0388, 0.1300, 0.0091, -0.0929, -0.0989])

5.优化器

在反向传播计算完所有参数的梯度后，还需要使用优化方法来更新网络的权重和参数，例如随机梯度下降法(SGD)的更新策略如下：

weight = weight - learning_rate * gradient

手动实现如下：

learning_rate = 0.01

for f in net.parameters():

f.data.sub_(f.grad.data * learning_rate)# inplace 减法

torch.optim中实现了深度学习中绝大多数的优化方法，例如RMSProp、Adam、SGD等，更便于使用，因此大多数时候并不需要手动写上述代码。

import torch.optim as optim#新建一个优化器，指定要调整的参数和学习率optimizer = optim.SGD(net.parameters(), lr = 0.01)# 在训练过程中# 先梯度清零(与net.zero_grad()效果一样)optimizer.zero_grad() # 计算损失output = net(input)loss = criterion(output, target)#反向传播loss.backward()#更新参数optimizer.step()

6.数据加载与预处理

在深度学习中数据加载及预处理是非常复杂繁琐的，但PyTorch提供了一些可极大简化和加快数据处理流程的工具。同时，对于常用的数据集，PyTorch也提供了封装好的接口供用户快速调用，这些数据集主要保存在torchvison中。

torchvision实现了常用的图像数据加载功能，例如Imagenet、CIFAR10、MNIST等，以及常用的数据转换操作，这极大地方便了数据加载，并且代码具有可重用性。

小试牛刀：CIFAR-10分类

下面我们来尝试实现对CIFAR-10数据集的分类，步骤如下:

使用torchvision加载并预处理CIFAR-10数据集定义网络定义损失函数和优化器训练网络并更新网络参数测试网络

CIFAR-10数据加载及预处理

CIFAR-101是一个常用的彩色图片数据集，它有10个类别: ‘airplane’, ‘automobile’, ‘bird’, ‘cat’, ‘deer’, ‘dog’, ‘frog’, ‘horse’, ‘ship’, ‘truck’。每张图片都是3×32×323\times32\times323×32×32，也即3-通道彩色图片，分辨率为32×3232\times3232×32。

import torchvision as tvimport torchvision.transforms as transformsfrom torchvision.transforms import ToPILImageshow = ToPILImage() # 可以把Tensor转成Image，方便可视化

# 第一次运行程序torchvision会自动下载CIFAR-10数据集，# 大约100M，需花费一定的时间，# 如果已经下载有CIFAR-10，可通过root参数指定# 定义对数据的预处理transform = pose([transforms.ToTensor(), # 转为Tensortransforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5)), # 归一化])# 训练集trainset = tv.datasets.CIFAR10(root='/home/cy/tmp/data/', train=True, download=True,transform=transform)trainloader = t.utils.data.DataLoader(trainset, # dataset：包含所有数据的数据集batch_size=4, # batch_size：一批里面所包含的数据的数量shuffle=True, # shuffle：是否打乱数据位置，当为Ture时打乱数据，全部抛出数据后再次dataloader时重新打乱。num_workers=2) # num_workers：使用线程的数量，当为0时数据直接加载到主程序，默认为0。# 测试集testset = tv.datasets.CIFAR10('/home/cy/tmp/data/',train=False, download=True, transform=transform)testloader = t.utils.data.DataLoader(testset,batch_size=4, shuffle=False,num_workers=2)classes = ('plane', 'car', 'bird', 'cat','deer', 'dog', 'frog', 'horse', 'ship', 'truck')

【注】

ToTensor类是实现：Convert a PIL Image or numpy.ndarray to tensor的过程，在PyTorch中常用PIL库来读取图像数据，因此这个方法相当于搭建了PIL Image和Tensor的桥梁。另外要强调的是在做数据归一化之前必须要把PILImage转成Tensor，而其他resize或crop操作则不需要。Normalize类是做数据归一化的，一般都会对输入数据做这样的操作其他参数介绍可以参考这里链接：/p/1ae863c1e66d

举个例子：

transform.ToTensor(),

transform.Normalize((0.5,0.5,0.5),(0.5,0.5,0.5))

以上面代码为例，ToTensor()能够把灰度范围从0-255变换到0-1之间，而后面的transform.Normalize()则把0-1变换到(-1,1).具体地说，对每个通道而言，Normalize执行以下操作：

image=(image-mean)/std

其中mean和std分别通过(0.5,0.5,0.5)和(0.5,0.5,0.5)进行指定。原来的0-1最小值0则变成(0-0.5)/0.5=-1，而最大值1则变成(1-0.5)/0.5=1.

Dataset对象是一个数据集，可以按下标访问，返回形如(data, label)的数据。

(data, label) = trainset[100]print(classes[label])# (data + 1) / 2是为了还原被归一化的数据show((data + 1) / 2).resize((100, 100))

Dataloader是一个可迭代的对象，它将dataset返回的每一条数据拼接成一个batch，并提供多线程加速优化和数据打乱等操作。当程序对dataset的所有数据遍历完一遍之后，相应的对Dataloader也完成了一次迭代。

dataiter = iter(trainloader)images, labels = dataiter.next() # 返回4张图片及标签print(' '.join('%11s'%classes[labels[j]] for j in range(4)))show(tv.utils.make_grid((images+1)/2)).resize((400,100))

定义网络

拷贝上面的LeNet网络，修改self.conv1第一个参数为3通道，因CIFAR-10是3通道彩图。

import torch.nn as nnimport torch.nn.functional as Fclass Net(nn.Module):def __init__(self):super(Net, self).__init__()self.conv1 = nn.Conv2d(3, 6, 5) self.conv2 = nn.Conv2d(6, 16, 5) self.fc1 = nn.Linear(16*5*5, 120) self.fc2 = nn.Linear(120, 84)self.fc3 = nn.Linear(84, 10)def forward(self, x): x = F.max_pool2d(F.relu(self.conv1(x)), (2, 2)) x = F.max_pool2d(F.relu(self.conv2(x)), 2) x = x.view(x.size()[0], -1) x = F.relu(self.fc1(x))x = F.relu(self.fc2(x))x = self.fc3(x) return xnet = Net()print(net)

定义损失函数和优化器(loss和optimizer)

from torch import optimcriterion = nn.CrossEntropyLoss() # 交叉熵损失函数# SGD 就是随机梯度下降# momentum 动量加速,在SGD函数里指定momentum的值即可optimizer = optim.SGD(net.parameters(), lr=0.001, momentum=0.9)

训练网络

所有网络的训练流程都是类似的，不断地执行如下流程：

输入数据前向传播+反向传播更新参数

torch.set_num_threads(int): 设定用于并行化CPU操作的OpenMP线程数

不设置，cpu51%，时间15ms

2的时候，cpu17%,时间15ms变为25ms

4的时候，cpu34%，时间17ms

8的时候，cpu67%

t.set_num_threads(8)for epoch in range(2): running_loss = 0.0for i, data in enumerate(trainloader, 0):# 输入数据inputs, labels = data# 梯度清零optimizer.zero_grad()# forward + backward outputs = net(inputs)loss = criterion(outputs, labels)loss.backward() # 更新参数 optimizer.step()# 打印log信息# loss 是一个scalar,需要使用loss.item()来获取数值，不能使用loss[0]running_loss += loss.item()if i % 2000 == 1999: # 每2000个batch打印一下训练状态print('[%d, %5d] loss: %.3f' \% (epoch+1, i+1, running_loss / 2000))running_loss = 0.0print('Finished Training')

此处仅训练了2个epoch（遍历完一遍数据集称为一个epoch），来看看网络有没有效果。将测试图片输入到网络中，计算它的label，然后与实际的label进行比较。

dataiter = iter(testloader)images, labels = dataiter.next() # 一个batch返回4张图片print('实际的label: ', ' '.join(\'%08s'%classes[labels[j]] for j in range(4)))show(tv.utils.make_grid(images / 2 - 0.5)).resize((400,100))

接着计算网络预测的label：

# 计算图片在每个类别上的分数outputs = net(images)# 得分最高的那个类_, predicted = t.max(outputs.data, 1)print('预测结果: ', ' '.join('%5s'\% classes[predicted[j]] for j in range(4)))

已经可以看出效果，准确率50%，但这只是一部分的图片，再来看看在整个测试集上的效果。

correct = 0 # 预测正确的图片数total = 0 # 总共的图片数# 由于测试的时候不需要求导，可以暂时关闭autograd，提高速度，节约内存with t.no_grad():for data in testloader:images, labels = dataoutputs = net(images)_, predicted = t.max(outputs, 1)total += labels.size(0)correct += (predicted == labels).sum()print('10000张测试集中的准确率为: %d %%' % (100 * correct / total))

10000张测试集中的准确率为: 53 %

训练的准确率远比随机猜测(准确率10%)好，证明网络确实学到了东西。

总结：

对PyTorch的基础介绍至此结束。总结一下，本节主要包含以下内容。

Tensor: 类似Numpy数组的数据结构，与Numpy接口类似，可方便地互相转换。autograd/: 为tensor提供自动求导功能。nn: 专门为神经网络设计的接口，提供了很多有用的功能(神经网络层，损失函数，优化器等)。神经网络训练: 以CIFAR-10分类为例演示了神经网络的训练流程，包括数据加载、网络搭建、训练及测试。

参考书目：《深度学习框架 PyTorch 入门与实战》陈云编著

如果觉得《pytorch初入门学习记录》对你有帮助，请点赞、收藏，并留下你的观点哦！

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。