h5py相关内容

将嵌套的.h5组读入numpy数组

我从朋友那里收到了这个.h5文件,我需要使用其中的数据来做一些工作.所有数据均为数值.这是我第一次使用这类文件.我在这里找到了许多有关阅读这些文件的问题和答案,但是我找不到找到该文件包含的较低级别的组或文件夹的方法.该文件包含两个主文件夹,即X和YX包含一个名为0的文件夹,其中包含两个名为A和B的文件夹.Y包含十个名为1-10的文件夹.我要读取的数据在A,B,1,2,..,10中例如我以 开始 ..
发布时间:2021-04-09 20:13:05 Python

如何在hdf5中压缩列表/嵌套列表

我最近了解了hdf5压缩并正在使用它.在处理巨大文件时,它比.npz/npy有一些优势.我设法尝试了一个小列表,因为有时我会处理具有以下字符串的列表; def write():test_array = ['a1','a2','a1','a2','a1','a2','a1','a2','a1','a2','a1','a2','a1','a2','a1','a2','a1','a2','a1',' ..
发布时间:2021-04-09 19:39:53 其他开发

使用AWS S3 s3fs/boto3读取h5文件

我正在尝试从AWS S3读取h5文件.我在使用s3fs/boto3时遇到以下错误.你能帮我吗?谢谢! import s3fsfs = s3fs.S3FileSystem(anon = False,key ='key',secret ='secret')将fs.open('file',mode ='rb')设为f:h5 = pd.read_hdf(f) TypeError:预期的str,字节 ..
发布时间:2021-04-03 19:28:00 Python

TensorFlow 2.x:无法以h5格式保存经过训练的模型(OSError:无法创建链接(名称已经存在))

我的模型使用预处理的数据来预测客户是私人客户还是非私人客户.预处理步骤使用诸如feature_column.bucketized_column(…),feature_column.embedding_column(…)等步骤. 训练后,我试图保存模型,但是出现以下错误: 文件"h5py_objects.pyx",第54行,位于h5py._objects.with_phil.wrapper ..
发布时间:2021-02-14 20:29:08 AI人工智能

如何保存不同大小的h5py数组?

我将此问题引至此.我之所以做这个新话题,是因为我不太了解那里给出的答案,希望有人可以向我进一步解释. 基本上我的问题就像那里的链接.之前,我使用np.vstack并从中创建h5格式文件.下面是我的示例: import numpy as np import h5py import glob path="/home/ling/test/" def runtest(): data ..
发布时间:2020-11-22 01:42:03 Python

h5py OSError:无法打开文件(未找到文件签名)

对于使用h5py时收到的错误,我有些困惑.我正在尝试应用python脚本来循环遍历位于不同目录中的h5py文件集.例如,第一组h5py文件位于 Reduced/rho = 0.75/2/Data/snapshots 当我运行 精简版子目录中的python脚本 时 减少/test_h5py 使用以下python脚本 import h5py import numpy a ..
发布时间:2020-11-22 01:42:01 Python

如何压缩保存在hdf5中的数据?

我正在使用python 2.7读取视频并将其存储在hdf5中.这是我的代码 import h5py import skvideo.datasets import skvideo.io videodata = skvideo.io.vread('./v_ApplyEyeMakeup_g01_c01.avi') with h5py.File('./video.hdf5','w') as f: ..
发布时间:2020-11-22 01:40:59 Python

如何使用h5py编辑h5文件?

有关使用h5py覆盖数组的问题未能解决我的问题. 我要编辑VGG16模型的数组值. f = h5py.File('C:/Users/yash/.keras/models/vgg16_weights_tf_dim_ordering_tf_kernels_2.h5', mode = 'a') ab = list(h5py.AttributeManager.keys(f)) print(list( ..
发布时间:2020-11-22 01:39:55 Python

从HDF5的组中获取多个数据集

我正在比较两个不同的hdf5文件,以确保它们匹配.我想在hdf5文件中创建一个包含该组中所有数据集的列表,以便可以循环遍历所有数据集,而不必手动输入它们.我似乎找不到办法做到这一点.目前,我正在使用以下代码获取数据集: tdata21 = ft['/PACKET_0/0xeda9_data_0004'] 组的名称位于"PACKET_0"组中.排列完所有数据集后,我将在此循环中比较数据集中 ..
发布时间:2020-11-22 01:39:51 Python

H5PY-如何存储许多不同尺寸的2D数组

我想使用Python将收集的数据(来自计算机模拟)组织到hdf5文件中. 我测量了多个时间步长内某个空间区域内所有原子的位置和速度[x,y,z,vx,vy,vz].当然,原子数随时间步长而变化. 一个最小的示例如下: [ [ [x1,y1,z1,vx1,vy1,vz1], [x2,y2,z2,vx2,vy2,vz2] ], [ [x1,y1,z1,vx1,vy1,vz1], [x2,y ..
发布时间:2020-11-22 01:39:47 Python

如何将pandas DataFrame和numpy数组合并到H5中

我希望生成一个H5文件file.h5,其中包含一个pandas DataFrame和一个numpy数组. 举例来说,假设我们将数组array和DataFrame df定义为: import numpy as np import pandas as pd array = np.array([0,1]) data = {'col': [2,3, 4]} df = pd.DataFram ..
发布时间:2020-11-22 01:39:45 Python

h5py写一个hdf文件,有关尺寸的问题

我创建了一个句柄为fw的新文件. fw.create_dataset('grp1/grp2/grp2/varname',data=arr) 在此命令之前创建组. arr是具有以下内容的numpy array 尺寸(2,3). 文件创建成功.但是,尺寸被命名为phony_0, 和phony_1.如何将它们更改为m和n? 通常,一个人如何在一个组内创建维度,然后进行关联 变量吗? ..
发布时间:2020-11-22 01:38:43 Python

TensorFlow 2.x:使用嵌入列时无法以h5格式加载经过训练的模型(ValueError:形状(101、15)和(57218、15)不兼容)

经过长时间的来回,我设法保存了模型(请参见我的问题ValueError: You are trying to load a weight file containing 1 layers into a model with 0 layers. 将顺序更改为功能性API后,出现以下错误: ValueError: Cannot assign to variable dense_featur ..
发布时间:2020-11-22 01:38:40 AI人工智能

在python中访问SVHN数据集中的数据

我试图从包含digitStruct.mat文件的tar.gz文件中提取数据. 我使用了以下代码片段: train_dataset = h5py.File('./train/digitStruct.mat') 我想从该对象本身访问bbox和名称详细信息. 例如: train_dataset[0] 应输出如下内容: {'boxes': [{'height': 219.0, ' ..
发布时间:2020-11-22 01:38:38 Python

如何在hdf5文件中创建可变长度的列?

我正在使用h5py包为我的训练集创建HDF5文件. 我想创建具有可变长度的第一列.例如,[1,2,3]作为列中的第一个条目,[1,2,3,4,5]作为列中的第二个条目,依此类推,将同一数据集中的其他5列保留在数据类型为int的HDF5文件中,且长度固定,即1. /p> 我尝试了以下代码语句来解决这种情况: dt = h5py.special_dtype(vlen=np.dtype(' ..
发布时间:2020-11-22 01:38:35 其他开发

我该如何解决3D规则网格插值问题

我是python新用户.我有一个h5文件,它是固定红移下的重力势能快照.我已经阅读了python中的h5文件,现在我想编写一个代码,该代码将通过使用三线性插值来给出给定值(x,y,z)的重力势能值.你们任何人都可以帮助我做到这一点吗?出于您的考虑,下面给出了代码: In [1]: import numpy as np In [2]: import h5py In [3]: from sc ..
发布时间:2020-11-22 01:37:33 Python

如何加快从压缩的HDF5文件读取的速度

我在SSD上存储了几个大的HDF5文件(lzf压缩文件大小为10–15 GB,未压缩大小为20–25 GB).将此类文件中的内容读取到RAM中以进行进一步处理,每个文件大约需要2分钟.在此期间,仅使用了一个内核(但达到了100%).因此,我猜想CPU上运行的减压部分是瓶颈,而不是SSD的IO吞吐量. 在我的程序开始时,它将多个此类文件读取到RAM中,这需要相当长的时间. 我想通过利用更多的内 ..
发布时间:2020-11-22 01:37:29 Python

如何在Python中循环遍历HDF5组,从而根据掩码删除行?

我有一个HDF5文件,其中包含许多不同的组,所有这些组都具有相同的行数.我还有一个布尔掩码,用于保留或删除行.我想遍历HDF5文件中的所有组,并根据掩码删除行. 推荐的方法以递归方式访问所有组是visit(callable),但是我不知道如何将蒙版传递给可调用对象. 这里有一些代码希望演示我想做的事,但是那行不通: def apply_mask(name, *args): ..
发布时间:2020-11-22 01:37:26 Python

插入许多HDF5数据集非常慢

将许多数据集插入组中时,速度会急剧下降. 我发现减速点与名称的长度和数据集的数量成正比.较大的数据集确实需要花费更长的时间插入,但并不会影响减速发生的时间. 下面的示例夸大了名称的长度,只是为了说明要点,而无需等待很长时间. Python 3 HDF5版本1.8.15(1.10.1变得更慢) h5py版本:2.6.0 示例: import numpy as np ..
发布时间:2020-11-22 01:37:25 Python

如何使用pytables或h5py将数据集对象复制到其他hdf5文件?

我选择了特定的hdf5数据集,并希望将其复制到新的hdf5文件中.我可以找到一些有关在两个文件之间进行复制的教程,但是如果您刚刚创建了一个新文件,又想将数据集复制到该文件,该怎么办?我以为下面的方法行得通,但事实并非如此.有没有简单的方法可以做到这一点? >>> dic_oldDataset['old_dataset'] ..
发布时间:2020-11-22 01:36:20 Python