如何从图像列表开始加载数据集 [英] How to load a dataset starting from list of images Pytorch
本文介绍了如何从图像列表开始加载数据集的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我有一个服务可以从另一个服务(我们称其为服务B)接收二进制格式的图像:
from PIL import Image
img_list = []
img_bin = get_image_from_service_B()
image = Image.open(io.BytesIO(img_bin)) # Convert bytes to image using PIL
当使用PIL成功转换图像时,还会将其附加到图像列表中。
img_list.append(image)
当我有足够的图像时,我想使用Pytorch加载我的图像列表,就像它是一个数据集
if img_list.__len__() == 500:
### Load dataset and do a transform operation on the data
在该软件的以前版本中,要求只是从文件夹中检索图像,因此加载所有图像非常简单
my_dataset = datasets.ImageFolder("path/to/images/folder/", transform=transform)
dataset_iterator = DataLoader(my_dataset, batch_size=1)
现在我的问题是如何执行转换并从列表加载数据集。
推荐答案
您只需编写一个自定义数据集:
class MyDataset(torch.utils.data.Dataset):
def __init__(self, img_list, augmentations):
super(MyDataset, self).__init__()
self.img_list = img_list
self.augmentations = augmentations
def __len__(self):
return len(self.img_list)
def __getitem__(self, idx):
img = self.img_list[idx]
return self.augmentations(img)
您现在可以将此自定义数据集插入DataLoader
,即可完成。
这篇关于如何从图像列表开始加载数据集的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文