h5py - IT屋-程序员软件开发技术分享社区

读取.h5文件速度极慢

我的数据以.h5格式存储。我使用数据生成器来拟合模型，它非常慢。下面提供了我的代码片段。 def open_data_file(filename, readwrite="r"): return tables.open_file(filename, readwrite) data_file_opened = open_data_file(os.path.abspath("../dat ..

发布时间：2022-09-05 16:12:20 python generator hdf5 h5py pytables Python

如何在hdf5文件的多个组之间拆分数据？

我有一个类似以下内容的数据： Generated by trjconv : P/L=1/400 t= 0.00000 11214 1P1 aP1 1 80.48 35.36 4.25 2P1 aP1 2 37.45 3.92 3.96 11210LI aLI11210 61.61 19.15 3.25 1121 ..

发布时间：2022-09-05 16:08:11 python hdf5 h5py hdf Python

如何在阅读文本文件时纠正列之间的空格？

我想从文本文件中读取数据并将其写入hdf5格式。但不知何故，在数据文件的中间，列之间的空格消失了。small part of the file数据如下： Generated by trjconv : P/L=1/400 t= 0.00000 11214 1P1 aP1 1 80.48 35.36 4.25 2P1 aP1 2 37.4 ..

发布时间：2022-09-05 16:00:09 python hdf5 h5py Python

从gromacs文件中读取数据并将其写入hdf5文件格式

我正在尝试逐行读取.gro文件中的数据，并希望将其写入.h5文件格式的数据。但获取TypeError："No conversion path ford type: type(' ..

发布时间：2022-09-05 15:53:18 python hdf5 h5py Python

将可变长度序列写入复合数组

我使用的是带有h5py的复合数据类型，其中一些元素是可变长度数组。我找不到一种方法来设置这个项目。下面的MWE展示了6种不同的方法(顺序索引--无论如何在h5py中都不起作用)、融合索引、列/行的读取-修改-提交)，这两种方法都不起作用。正确的方式是什么？为什么将整数列表写入int32列表时，h5py显示为Cannot change data-type for object array？ ..

发布时间：2022-09-05 15:46:30 hdf5 h5py 其他开发

Python h5py-为什么我收到广播错误？

我正在尝试读取一个.h5文件data.h5，它有两个数据集，即‘data’和‘METADATA’。‘metaData’包含一个大小为157x1的字典，如下所示：然后，我尝试编写一个新的.h5文件，它包含3列：字典中每个变量的编号、名称(字典的第一列)和单位(字典的最后一列)。代码如下： import numpy as np import h5py as h5 hdf = h5.Fi ..

发布时间：2022-09-05 15:28:40 python numpy unicode hdf5 h5py Python

如何在h5文件中分层写入大的多个数组？

假设我有10000个系统。对于每个系统，我都有两个数据集：对于每个数据集，我都有x、y和y_err数组。如何使用h5py或pandas将所有系统的数据放到一个h5文件中？下面给出了详细说明。 Systems=np.arange(10000) for sys in Systems: x1,y1,y1_err=np.random.rand(100),np.random.rand(100 ..

发布时间：2022-09-05 15:16:50 python pandas dataframe hdf5 h5py Python

H5py：如何在HDF5组和数据集上使用key()循环

print(list(file.keys())) 当我运行此代码时，我得到： T00000000,T00000001,T00000002,T00000003, ... ,T00000474 现在，我分析了T00000000，但我想用for循环扫描它们。我做不到，因为这是一根线。有没有办法做到这一点？推荐答案可以，您可以使用Split()方法。如果字符串是&qu ..

发布时间：2022-09-05 14:45:48 python numpy hdf5 h5py Python

为什么h5py在向数据集中添加3个可变长度的字符串时会抛出错误？

我正在尝试使用h5py(Python3)设置和写入HDF5数据集，该数据集包含复合对象的一维数组。每个复合对象由三个长度可变的字符串属性组成。 with h5py.File("myfile.hdf5", "a") as file: dt = np.dtype([ ("label", h5py.string_dtype(encoding=' ..

发布时间：2022-09-05 14:34:51 python numpy hdf5 h5py Python

如何检索存储字符串的HDF5数据集

我正在使用下面的命令创建H5数据集，该数据集使用dtype作为S10来存储字符串数组。 create_dataset(dset_name, (0,) , dtype='S10', maxshape=None, chunks=True) 它将数据正确存储在hdf5文件的组中。我甚至可以在HDF5查看器中看到正确的数据。但是，当我使用group.keys()时，我看不到数据集。数据集的图标也 ..

发布时间：2022-09-05 14:24:57 python hdf5 h5py hdf Python

属性错误：'；数据集'；对象没有属性'；值'；

我在使用程序包读取hdf5文件时遇到此错误： dataset.value 错误： Traceback (most recent call last): File "train.py", line 163, in train(0, False, args.gpu_list, args.model_path) File "train.py", line ..

发布时间：2022-09-05 14:17:29 hdf5 h5py 其他开发

如何将我自己的类对象存储到hdf5中？

我创建了一个类来保存我研究的实验结果(我是一名EE博士生)，就像 class Trial: def __init__(self, subID, triID): self.filePath = '' # file path of the folder self.subID = -1 # int self.triID = -1 ..

发布时间：2022-09-05 13:55:56 python numpy hdf5 h5py Python

如何命名HDF5数据集中的列？

我用h5py做了一个数据集： f = h5py.File("experimentReadings.hdf5", "w") dset = f.create_dataset("physics", (5,4), dtype='f') 我有一个变量名列表：namesList = ['height', 'mass', 'velocity', 'gravity']。我希望这些变量名成为dse ..

发布时间：2022-09-05 13:48:04 python hdf5 h5py Python

如何将属性添加到作为组存储在HDF5文件中的 pandas 数据帧？

我有一个多维 pandas 数据帧，如下所示： import numpy as np import pandas as pd iterables = [['bar', 'baz', 'foo', 'qux'], ['one', 'two']] mindex = pd.MultiIndex.from_product(iterables, names=['first', 'second']) d ..

发布时间：2022-09-05 13:36:24 python pandas hdf5 h5py Python

如何在hdf5文件系统中创建组的属性并访问它们？

我想在hdf5文件中创建两个组。第一组/h5mdgroup description和/颗粒/脂质组group2 description。前者仅由一个直接属性‘Version’(=1.0)和两个组Creator和Author及其属性组成，因此这里没有数据集。在/粒子/脂质组中，唯一缺少的部分是盒组box group description。最小的信息是两个属性：维度(=3)和边界条件，例如， ..

发布时间：2022-09-05 12:39:22 python hdf5 h5py Python

使用HDF5追加仿真数据

我当前多次运行模拟，希望保存这些模拟的结果，以便可以将其用于可视化。模拟运行100次，每个模拟生成大约100万个数据点(即100万集的100万个值)，我现在想高效地存储这些数据点。每一集的目标都是在所有100个模拟中生成每个值的平均值。我的main文件如下： # Defining the test simulation environment def test_simulat ..

发布时间：2022-04-06 22:18:11 python plot simulation hdf5 h5py Python

为什么我必须在析构函数中调用MPI.Finalize()？

我目前正在尝试理解mpi4py。我设置mpi4py.rc.initialize = False和mpi4py.rc.finalize = False是因为我不明白为什么我们需要自动初始化和结束。默认行为是在导入MPI时调用MPI.Init()。我认为这是因为对于每个级别，都在运行Python解释器的一个实例，每个实例都将运行整个脚本，但这只是猜测。归根结底，我喜欢直截了当地说。现在这引入了 ..

发布时间：2022-03-10 23:48:59 python mpi h5py mpi4py hdf Python

h5py写入：如何高效地将数百万个.npy数组写入.hdf5文件？

我必须将大图像的子样本存储为.npy大小为(20，20，5)的数组。为了在训练分类模型时统一采样，我正在寻找一种有效的方法来存储近1000万个子样本，这样就可以做到这一点。如果我将它们存储为整个图像，则训练期间的采样不能代表分布。我有存储空间，但尝试存储那么多小文件时会用完inode。h5py/写入hdf5文件是解决我问题的自然答案，但是这个过程非常慢。运行一个程序一天半的时间不足以编写所 ..

发布时间：2022-03-01 18:08:56 python numpy bigdata hdf5 h5py Python

来自多个 HDF5 文件/数据集的链数据集

h5py(通过 HDF5)为在磁盘上持久化数据集提供的好处和简单的映射是非常出色的.我对一组文件进行了一些分析，并将结果存储到一个数据集中，每个文件一个.在这一步结束时，我有一组包含二维数组的 h5py.Dataset 对象.数组的列数相同，但行数不同，即 (A,N)、(B,N)、(C,N) 等. 我现在想将这些多个 2D 数组作为单个数组 2D 数组进行访问.也就是说，我想将它们按需读取为 ..

发布时间：2022-01-21 13:13:06 python arrays numpy dataset h5py Python

IOError:无法读取数据(无法打开目录) - 缺少 gzip 压缩过滤器

我以前从未使用过 HDF5 文件，开始时我收到了一些示例文件.我一直在使用 h5py 查看所有基础知识，查看这些文件中的不同组、它们的名称、键、值等等.一切正常，直到我想查看保存在组中的数据集.我得到了他们的 .shape 和 .dtype，但是当我尝试通过索引访问随机值时(例如 grp["dset"][0])，我收到以下错误: IOError Traceback(最近一次调用最后一次) ..

发布时间：2022-01-10 21:41:16 python linux hdf5 anaconda h5py 服务器开发

h5py相关内容