h5py相关内容

读取.h5文件速度极慢

我的数据以.h5格式存储。我使用数据生成器来拟合模型,它非常慢。下面提供了我的代码片段。 def open_data_file(filename, readwrite="r"): return tables.open_file(filename, readwrite) data_file_opened = open_data_file(os.path.abspath("../dat ..
发布时间:2022-09-05 16:12:20 Python

如何在阅读文本文件时纠正列之间的空格?

我想从文本文件中读取数据并将其写入hdf5格式。但不知何故,在数据文件的中间,列之间的空格消失了。small part of the file数据如下: Generated by trjconv : P/L=1/400 t= 0.00000 11214 1P1 aP1 1 80.48 35.36 4.25 2P1 aP1 2 37.4 ..
发布时间:2022-09-05 16:00:09 Python

将可变长度序列写入复合数组

我使用的是带有h5py的复合数据类型,其中一些元素是可变长度数组。我找不到一种方法来设置这个项目。下面的MWE展示了6种不同的方法(顺序索引--无论如何在h5py中都不起作用)、融合索引、列/行的读取-修改-提交),这两种方法都不起作用。 正确的方式是什么?为什么将整数列表写入int32列表时,h5py显示为Cannot change data-type for object array? ..
发布时间:2022-09-05 15:46:30 其他开发

Python h5py-为什么我收到广播错误?

我正在尝试读取一个.h5文件data.h5,它有两个数据集,即‘data’和‘METADATA’。‘metaData’包含一个大小为157x1的字典,如下所示: 然后,我尝试编写一个新的.h5文件,它包含3列:字典中每个变量的编号、名称(字典的第一列)和单位(字典的最后一列)。代码如下: import numpy as np import h5py as h5 hdf = h5.Fi ..
发布时间:2022-09-05 15:28:40 Python

如何在h5文件中分层写入大的多个数组?

假设我有10000个系统。对于每个系统,我都有两个数据集:对于每个数据集,我都有x、y和y_err数组。如何使用h5py或pandas将所有系统的数据放到一个h5文件中?下面给出了详细说明。 Systems=np.arange(10000) for sys in Systems: x1,y1,y1_err=np.random.rand(100),np.random.rand(100 ..
发布时间:2022-09-05 15:16:50 Python

H5py:如何在HDF5组和数据集上使用key()循环

print(list(file.keys())) 当我运行此代码时,我得到: T00000000,T00000001,T00000002,T00000003, ... ,T00000474 现在,我分析了T00000000,但我想用for循环扫描它们。我做不到,因为这是一根线。有没有办法做到这一点? 推荐答案 可以,您可以使用Split()方法。 如果字符串是&qu ..
发布时间:2022-09-05 14:45:48 Python

如何检索存储字符串的HDF5数据集

我正在使用下面的命令创建H5数据集,该数据集使用dtype作为S10来存储字符串数组。 create_dataset(dset_name, (0,) , dtype='S10', maxshape=None, chunks=True) 它将数据正确存储在hdf5文件的组中。我甚至可以在HDF5查看器中看到正确的数据。但是,当我使用group.keys()时,我看不到数据集。数据集的图标也 ..
发布时间:2022-09-05 14:24:57 Python

如何命名HDF5数据集中的列?

我用h5py做了一个数据集: f = h5py.File("experimentReadings.hdf5", "w") dset = f.create_dataset("physics", (5,4), dtype='f') 我有一个变量名列表:namesList = ['height', 'mass', 'velocity', 'gravity']。 我希望这些变量名成为dse ..
发布时间:2022-09-05 13:48:04 Python

如何在hdf5文件系统中创建组的属性并访问它们?

我想在hdf5文件中创建两个组。第一组/h5mdgroup description和/颗粒/脂质组group2 description。前者仅由一个直接属性‘Version’(=1.0)和两个组Creator和Author及其属性组成,因此这里没有数据集。 在/粒子/脂质组中,唯一缺少的部分是盒组box group description。最小的信息是两个属性:维度(=3)和边界条件,例如, ..
发布时间:2022-09-05 12:39:22 Python

使用HDF5追加仿真数据

我当前多次运行模拟,希望保存这些模拟的结果,以便可以将其用于可视化。 模拟运行100次,每个模拟生成大约100万个数据点(即100万集的100万个值),我现在想高效地存储这些数据点。每一集的目标都是在所有100个模拟中生成每个值的平均值。 我的main文件如下: # Defining the test simulation environment def test_simulat ..
发布时间:2022-04-06 22:18:11 Python

为什么我必须在析构函数中调用MPI.Finalize()?

我目前正在尝试理解mpi4py。我设置mpi4py.rc.initialize = False和mpi4py.rc.finalize = False是因为我不明白为什么我们需要自动初始化和结束。默认行为是在导入MPI时调用MPI.Init()。我认为这是因为对于每个级别,都在运行Python解释器的一个实例,每个实例都将运行整个脚本,但这只是猜测。归根结底,我喜欢直截了当地说。 现在这引入了 ..
发布时间:2022-03-10 23:48:59 Python

h5py写入:如何高效地将数百万个.npy数组写入.hdf5文件?

我必须将大图像的子样本存储为.npy大小为(20,20,5)的数组。为了在训练分类模型时统一采样,我正在寻找一种有效的方法来存储近1000万个子样本,这样就可以做到这一点。 如果我将它们存储为整个图像,则训练期间的采样不能代表分布。我有存储空间,但尝试存储那么多小文件时会用完inode。h5py/写入hdf5文件是解决我问题的自然答案,但是这个过程非常慢。运行一个程序一天半的时间不足以编写所 ..
发布时间:2022-03-01 18:08:56 Python

来自多个 HDF5 文件/数据集的链数据集

h5py(通过 HDF5)为在磁盘上持久化数据集提供的好处和简单的映射是非常出色的.我对一组文件进行了一些分析,并将结果存储到一个数据集中,每个文件一个.在这一步结束时,我有一组包含二维数组的 h5py.Dataset 对象.数组的列数相同,但行数不同,即 (A,N)、(B,N)、(C,N) 等. 我现在想将这些多个 2D 数组作为单个数组 2D 数组进行访问.也就是说,我想将它们按需读取为 ..
发布时间:2022-01-21 13:13:06 Python

IOError:无法读取数据(无法打开目录) - 缺少 gzip 压缩过滤器

我以前从未使用过 HDF5 文件,开始时我收到了一些示例文件.我一直在使用 h5py 查看所有基础知识,查看这些文件中的不同组、它们的名称、键、值等等.一切正常,直到我想查看保存在组中的数据集.我得到了他们的 .shape 和 .dtype,但是当我尝试通过索引访问随机值时(例如 grp["dset"][0]),我收到以下错误: IOError Traceback(最近一次调用最后一次) ..
发布时间:2022-01-10 21:41:16 服务器开发