PyTorch 学习笔记（一）：让 PyTorch 读取你的数据集

栏目: Python · 发布时间: 7年前

内容简介：同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总，行业技术交流作者 | 余霆嵩

加入极市专业CV交流群，与 6000+来自腾讯，华为，百度，北大，清华，中科院 等名企名校视觉开发者互动交流！更有机会与 李开复老师 等大牛群内互动！

同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总，行业技术交流。点击文末“ 阅读原文 ”立刻申请入群~

作者 | 余霆嵩

来源专栏 | PyTorch学习笔记

已获作者原创授权，请勿二次转发

本文截取自一个github上千星的火爆教程—— 《PyTorch 模型训练实用教程》，教程内容主要为在 PyTorch 中训练一个模型所可能涉及到的方法及函数的详解等，本文为作者整理的学习笔记（一）， 后续会继续更新这个系列，欢迎关注。

项目代码： https://github.com/tensor-yu/PyTorch_Tutorial

PyTorch 学习笔记（一）：让 PyTorch 读取你的数据集

想让PyTorch能读取我们自己的数据，首先要了解pytroch读取图片的机制和流程，然后按流程编写代码。

Dataset类

PyTorch读取图片，主要是通过Dataset类，所以先简单了解一下Dataset类。Dataset类作为所有的datasets的基类存在，所有的datasets都需要继承它，类似于C++中的虚基类。

源码如下：

class Dataset(object):

"""An abstract class representing a Dataset.

All other datasets should subclass it. All subclasses should override

``__len__``, that provides the size of the dataset, and ``__getitem__``,

supporting integer indexing in range from 0 to len(self) exclusive.

"""

def __getitem__(self, index):

raise NotImplementedError

def __len__(self):

raise NotImplementedError

def __add__(self, other):

return ConcatDataset([self, other])

这里重点看 getitem函数，getitem接收一个index，然后返回图片数据和标签，这个index通常指的是一个list的index，这个list的每个元素就包含了图片数据的路径和标签信息。

然而，如何制作这个list呢，通常的方法是将图片的路径和标签信息存储在一个txt中，然后从该txt中读取。那么读取自己数据的基本流程就是：1. 制作存储了图片的路径和标签信息的txt 2. 将这些信息转化为list，该list每一个元素对应一个样本 3. 通过getitem函数，读取数据和标签，并返回数据和标签

在训练代码里是感觉不到这些操作的，只会看到通过DataLoader就可以获取一个batch的数据，其实触发去读取图片这些操作的是DataLoader里的iter(self)，后面会详细讲解读取过程。在本小节，主要讲Dataset子类。因此，要让PyTorch能读取自己的数据集，只需要两步：1. 制作图片数据的索引 2. 构建Dataset子类

制作图片数据的索引这个比较简单，就是读取图片路径，标签，保存到txt文件中，这里注意格式就好特别注意的是，txt中的路径，是以训练时的那个py文件所在的目录为工作目录，所以这里需要提前算好相对路径！运行代码 Code/1_data_prepare/1_3_generate_txt.py，即会在/Data/文件夹下面看到 train.txt valid.txt txt中是这样的：

PyTorch 学习笔记（一）：让 PyTorch 读取你的数据集

构建Dataset子类

下面是本实验构建的Dataset子类——MyDataset类：

# coding: utf-8

from PIL import Image

from torch.utils.data import Dataset

class MyDataset(Dataset):

def __init__(self, txt_path, transform = None, target_transform = None):

fh = open(txt_path, 'r')

imgs = []

for line in fh:

line = line.rstrip()

words = line.split()

imgs.append((words[0], int(words[1])))

self.imgs = imgs

self.transform = transform

self.target_transform = target_transform

def __getitem__(self, index):

fn, label = self.imgs[index]

img = Image.open(fn).convert('RGB')

if self.transform is not None:

img = self.transform(img)

return img, label

def __len__(self):

return len(self.imgs)

首先看看初始化，初始化中从我们准备好的txt里获取图片的路径和标签，并且存储在self.imgs，self.imgs就是上面提到的list，其一个元素对应一个样本的路径和标签，其实就是txt中的一行。

初始化中还会初始化transform，transform是一个Compose类型，里边有一个list，list中就会定义了各种对图像进行处理的操作，可以设置减均值，除标准差，随机裁剪，旋转，翻转，仿射变换等操作。

在这里我们可以知道，一张图片读取进来之后，会经过数据处理（数据增强），最终变成输入模型的数据。这里就有一点需要注意，PyTorch的数据增强是将原始图片进行了处理，并不会生成新的一份图片，而是“覆盖”原图，当采用randomcrop之类的随机操作时，每个epoch输入进来的图片几乎不会是一模一样的，这达到了样本多样性的功能。

然后看看核心的 getitem函数：

第一行：self.imgs 是一个list，也就是一开始提到的list，self.imgs的一个元素是一个str，包含图片路径，图片标签，这些信息是从txt文件中读取

第二行：利用Image.open对图片进行读取，img类型为 Image ，mode=‘RGB’

第三行与第四行：对图片进行处理，这个transform里边可以实现减均值，除标准差，随机裁剪，旋转，翻转，放射变换，等等操作，这个放在后面会详细讲解。

当Mydataset构建好，剩下的操作就交给DataLoder，在DataLoder中，会触发Mydataset中的getiterm函数读取一张图片的数据和标签，并拼接成一个batch返回，作为模型真正的输入。下一小节将会通过一个小例子，介绍DataLoder是如何获取一个batch，以及一张图片是如何被PyTorch读取，最终变为模型的输入的。

*延伸阅读

点击左下角 “ 阅读原文 ”， 即可申请加入极市目标跟踪、目标检测、工业检测、人脸方向、视觉竞赛等技术交流群，更有每月大咖直播分享、真实项目需求对接、干货资讯汇总，行业技术交流，一起来让思想之光照的更远吧~

PyTorch 学习笔记（一）：让 PyTorch 读取你的数据集

觉得有用麻烦给个在看啦~

以上所述就是小编给大家介绍的《PyTorch 学习笔记（一）：让 PyTorch 读取你的数据集》，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对码农网的支持！

查看所有标签

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

云计算安全与隐私

Tim Mather、Subra Kumaraswamy、Shahed Latif / 刘戈舟、杨泽明、刘宝旭 / 机械工业出版社华章公司 / 2011-6 / 65.00元

《云计算安全与隐私》可以使你明白当把数据交付给云计算时你所面临的风险，以及为了保障虚拟基础设施和网络应用程序的安全可以采取的行动。本书是由信息安全界知名专家所著，作者在书中给出许多中肯的忠告和建议。本书的读者对象包括：IT职员、信息安全和隐私方面的从业人士、业务经理、服务提供商，以及投资机构等。阅读本书你会了解直到现在还严重匮乏的云计算安全方面的详尽信息。《云计算安全与隐私》主要内容包括：......一起来看看《云计算安全与隐私》这本书的介绍吧!

码农工具