hdf相关内容

如何检索存储字符串的HDF5数据集

我正在使用下面的命令创建H5数据集,该数据集使用dtype作为S10来存储字符串数组。 create_dataset(dset_name, (0,) , dtype='S10', maxshape=None, chunks=True) 它将数据正确存储在hdf5文件的组中。我甚至可以在HDF5查看器中看到正确的数据。但是,当我使用group.keys()时,我看不到数据集。数据集的图标也 ..
发布时间:2022-09-05 14:24:57 Python

如何使用HDF文件(固定格式,多个密钥)作为 pandas 数据帧?

我得到了一个使用PANDA创建的20 GB HDF5文件,但不幸的是,它是以固定格式(而不是表)编写的,每一列都写为一个单独的键。这对于快速加载一个功能非常有效,但它不支持方便的面向表格的过程(例如,统计分析或绘图)。 尝试将文件作为一个整体加载时出现以下错误: ValueError: key must be provided when HDF5 file contains multi ..
发布时间:2022-09-05 14:20:52 Python

在Java中读取流媒体中的HDF5

我想读取一些几GB的HDF5流。为了便于移植,我还想继续使用原生Java。 我尝试过Java HDF对象包和Java HDF5接口(JHI5),但这些都是一些JNI解决方案(如果找不到更好的选择,我可能会重新考虑)。 https://github.com/jamesmudd/jhdf是本机Java库,但不支持切片或流,因此不适用于大文件。 本机Java中是否有更多选项? 编辑: ..
发布时间:2022-09-05 13:11:28 Java开发

为什么我必须在析构函数中调用MPI.Finalize()?

我目前正在尝试理解mpi4py。我设置mpi4py.rc.initialize = False和mpi4py.rc.finalize = False是因为我不明白为什么我们需要自动初始化和结束。默认行为是在导入MPI时调用MPI.Init()。我认为这是因为对于每个级别,都在运行Python解释器的一个实例,每个实例都将运行整个脚本,但这只是猜测。归根结底,我喜欢直截了当地说。 现在这引入了 ..
发布时间:2022-03-10 23:48:59 Python

可以从 C 或 Fortran 读取 .Rdata 文件格式吗?

我正在编写一些关于 C 的 R 扩展(要从 R 调用的 C 函数). 我的代码需要同时使用 2 个不同的数据集计算统计数据,并且我需要使用所有可能的配对组合来执行此操作.然后,我需要所有这些统计数据(非常大的数组)来继续 C 端的计算.这些文件非常大,通常约为 40GB,这就是我的问题. 要在 R 调用的 C 上执行此操作,首先我需要加载 R 中的所有数据集以将它们传递给 C 函数调用 ..
发布时间:2022-01-14 10:09:32 其他开发

从Python读取3D HDF的特定Z组件切片

有人知道如何修改以下代码,以便我可以在Python中读取3D hdf数据的特定z分量切片吗?从所附图像中可以看到,z值范围从0到160,我只想绘制'80'.尺寸为400x160x160.这是我的代码. import h5handler as h5h h5h.manager.setPath('E:\data\Data5', False) for i in np.arange(0,1,500 ..
发布时间:2020-06-18 18:33:30 Python

查询HDF存储

我创建了一个hd5文件 hdf=pandas.HDFStore(pfad) hdf.append('df', df, data_columns=True) 我有一个包含numpy.datetime64值的列表,这些值称为expirations,并尝试将hd5表的一部分读取到数据帧中,该数据帧的值在expiration列中的expirations [1]和expirations [0]之间 ..
发布时间:2020-06-18 18:33:27 Python

如何使用此R函数拼接相同的HDF文件?

一个文件夹中有1000多个MODIS HDF图像: M:\join 他们的名字告诉我们哪些文件必须镶嵌在一起. 例如,在以下文件中, 2009090 意味着这三个图像必须镶嵌在一起: MOD05_L2.A2009090.0420.051.2010336084010 MOD05_L2.A2009090.0555.051.2010336100338 MOD05_L2.A20090 ..
发布时间:2020-06-18 18:33:21 其他开发

熊猫to_hdf成功,但随后read_hdf失败

熊猫to_hdf成功,但是当我使用自定义对象作为列标题时,read_hdf失败(我使用自定义对象,因为我需要在其中存储其他信息). 有什么办法可以使这项工作成功吗?还是仅仅是Pandas错误或PyTables错误? 作为一个例子,下面,我将首先显示一个使用字符串列标题的DataFrame foo,并且所有内容在to_hdf/read_hdf上都可以正常工作,然后将foo更改为使用自定义 ..
发布时间:2020-06-18 18:33:19 Python

HDFql使用表

我对HDFql的可用性有疑问: HDFql是否支持创建行类型不同的表? 如何将数据追加到表中? 如何遍历表格的行? 我要创建的表将具有1到2 ^ n行的任何内容,并且无法事先确定. 解决方案 以下是有关您有关 HDFql 的问题的一些信息a>: 如果通过"对行具有不同类型的表创建HDFql支持",则表示HDFql支持复合数据类型,但答案尚无. (编辑:因为现在支持HD ..
发布时间:2020-06-18 18:33:17 其他开发

比较H5文件

我经常不得不比较hdf文件.我可以通过二进制diff(即使内部的实际数字相同也可以告诉我文件是不同的)或通过使用h5dump将内容转储到txt文件中并比较两者的内容来实现文件(也很烦人). 我想知道是否有更聪明的方法可以做到这一点,也许是h5或HDFView或Panoply之类的软件的功能. 解决方案 也许 ..
发布时间:2020-06-18 18:33:11 其他开发

确定熊猫HDF文件中DataFrame的格式

有一个HDF文件'file.h5',保存到其中的pandas DataFrame(或系列)的键名是'df'.如何确定"df"以哪种格式(即“固定"或“表格")保存到文件中? 谢谢您的帮助! 解决方案 有点晚了,但也许有人会觉得有用. 您可以解析 HDFStore.info() . table格式的对象的类型为appendable: >>> print(h5_table.i ..
发布时间:2020-06-18 18:33:09 Python

C/C ++ HDF5读取字符串属性

我的一位同事使用labview将ASCII字符串作为属性写入HDF5文件中.我可以看到该属性存在,并且可以读取,但是无法打印. 该属性是,如HDF Viewer中所示: 日期= 2015 \ 07 \ 09 所以“日期"是它的名字. 我正在尝试使用此代码读取属性 hsize_t sz = H5Aget_storage_size(dateAttribHandler); ..
发布时间:2020-06-18 18:33:04 C/C++开发

图像另存为HDF5彩色

我目前正在开发将文本文件和jpg图像转换为HDF5-Format的程序.用HDFView 3.0打开后,图像似乎只保存为灰度. hdf = h5py.File("Sample.h5") img = Image.open("Image.jpg") data = np.asarray((img), dtype="uint8") hdf.create_dataset("Photos/Image 1 ..
发布时间:2020-06-18 18:33:01 Python