hdf5相关内容

列出HDF5组中的数据集

我决定使用其分层结构将数据存储在HDF5中,而不是依赖于文件系统. 不幸的是,我遇到了性能问题. 我的数据格式如下: 我有大约70个顶级组,分别对应于日期,每个组包含大约8000个数据集. 我想查看每天的数据集数量的列表: for date in hdf5.keys(): print(len(hdf5[date])) 每次迭代需要2秒以上的时间,我感到有些沮丧. 另外, ..
发布时间:2020-11-22 19:14:57 Python

熊猫HDFStore:查询不匹配的字符串时速度较慢

我的问题是,当我尝试查找DataFrame中不包含的字符串(存储在hdf5文件中)时,需要很长时间才能完成查询.例如: 我有一个包含2 * 10 ^ 9行的df.它存储在HDF5文件中.我有一个名为"code"的字符串列,它被标记为"data_column"(因此已被索引). 当我搜索数据集中存在的代码(store.select('df','code = valid_code'))时, ..
发布时间:2020-11-22 19:13:53 Python

管理HDF5对象参考

我正在尝试为街景门牌号码(SVHN)数据集加载Mat文件 http://带有以下代码的python中的ufldl.stanford.edu/housenumbers/ import h5py labels_file = './sv/train/digitStruct.mat' f = h5py.File(labels_file) struct= f.values() names = stru ..
发布时间:2020-11-22 19:13:40 Python

如何将大型多维数组部分写入HDF5文件?

我在C#中使用HDF5DotNet,并且有一个非常大的阵列(几个GB),我想将其写入HDF5文件.它太大了,无法将整个内容存储在内存中,因此我一次要生成它的各个区域并想将它们写出,但是当读出时,它仍然看起来像一个大数组.我知道HDF5可以做到这一点,但是.NET API的文档很少. 我写了一些简短的示例代码,其中包含一个5 x 3的数组,其中填充了值1..15: const int R ..
发布时间:2020-11-22 19:13:38 C#/.NET

熊猫HDF5选择非自然名称列上的位置

在我持续不断的大熊猫/HDF5问题热潮中,我遇到了以下问题: 我有一系列非自然的命名列(nb:由于充分的理由,负数是“系统" id等),通常不会出现问题: fact_hdf.select('store_0_0', columns=['o', 'a-6', 'm-13']) 但是,我的select语句确实覆盖了它: >>> fact_hdf.select('store_0_0' ..
发布时间:2020-11-22 19:12:31 Python

C扩展(HDF5)中的IO绑定线程的GIL

我有一个采样应用程序,它每秒获取一次 250,000 个样本,将它们缓冲在内存中,并最终附加到pandas提供的HDFStore上.总的来说,这很棒.但是,我有一个线程可以运行并不断清空数据采集设备( DAQ ),它需要定期运行.大约一秒钟的偏差往往会弄坏东西.以下是观察到的时序的极端情况. Start表示DAQ读取开始,Finish表示完成读,IO表示HDF写入(DAQ和IO都发生在单独的线程中 ..
发布时间:2020-11-22 19:12:27 Python

HDF5库错误

我正在使用以下 1)VS 2010 C ++ 2)调试Win 32 3)从这里开始的图书馆 http://www.hdfgroup.org/HDF5/release/obtain5.html 基本上,我下载了Windows(32位)编译器:CMake VS 2010 C,C ++,IVF 12,RWDI并安装了它.我试图在我的C ++应用程序中包含示例代码,然后遇到以下问题 ..
发布时间:2020-11-22 19:12:26 C/C++开发

如何将hdf5添加到Qt项目?

情况: 我需要在我的qt项目中添加一个库(以我的情况为HDF5). 我知道如何为自己的目的编写足够的c ++代码,但是我对.pro文件一无所知.当我尝试使用Google搜索我的问题或添加库的一般指南时,我发现了很多答案,但是却一无所知,因为它们需要的知识比我多.他们说诸如“到处编译",“将其添加到系统中",“在目录xyz中使用qmake"之类的东西.有人可以回答这个问题吗,这样一个只懂 ..
发布时间:2020-11-22 19:11:23 C/C++开发

hdf5设计人员是否解决了与打开.hdf5文件有关的损坏问题?

我正在运行一个代码,该代码将.hdf5文件作为输入(由模拟生成),然后对其进行分析并生成一些统计信息,并通过运行命令行进行绘制:python3 Collector.py在Fedora 21 Linux的Konsole外壳程序中.在工作目录中的两个分别名为gizmo和utilities的文件夹中,我有很多.py例程. snapshot_index.hdf5文件是从另一台计算机上转移的(使用globu ..
发布时间:2020-11-22 19:11:19 Python

如何在Keras中将多个NumPy数组提供给深度学习网络?

我有大约13个NumPy数组存储为文件,这些文件在磁盘上大约需要24 GB.每个文件都针对一个主题,并且由两个数组组成:一个包含输入数据(二维矩阵列表,行表示连续时间),另一个包含数据标签. 我的最终目标是将所有数据提供给我在Keras中编写的深度学习网络,以对新数据进行分类.但是我不知道如何在不耗尽内存的情况下做到这一点. 我已经阅读了Keras的数据生成器,但是找不到适合我的情况的 ..
发布时间:2020-11-22 19:11:11 Python

如何通过C或C ++ API获得HDF5数据集的名称?

我正在尝试使用C ++ API读取HDF5数据集的名称.对于H5::Attribute对象,有一个getName()方法.但是,我看不到用于H5:DataSet对象的类似getName()方法. 理想情况下,我想这样做: void Dump(H5::DataSet& ds) { cout ..
发布时间:2020-11-22 19:11:08 C/C++开发

如何在python中知道HDF5数据集名称

我想将HDF5文件读入Python并进行一些编码工作. 要在python环境中访问HDF5文件中的数据,您需要HDF5文件的数据集名称.但是,我不知道如何找到数据集名称,我想寻求帮助. def select_HDF_file(self): filename2 = QFileDialog.getOpenFileName(self.dlg, "Select output f ..
发布时间:2020-11-22 19:11:04 Python

在C ++中将HDF5文件读取到动态数组

由于堆栈的大小限制,我正在尝试将大型3D hdf5文件读取到动态数组中.我尝试了几种不同的方法,但由于分段错误而失败.下面是显示我的问题的示例代码.我非常感谢您的帮助! //This example was based on several examples which came in the c++ examples directory of the hdf5 package. #if ..
发布时间:2020-11-22 19:11:01 C/C++开发

将几个hdf5文件合并到一个pytable中

我有几个hdf5文件,每个文件都具有相同的结构.我想通过某种方式合并hdf5文件来从其中创建一个pytable. 我的意思是,如果file1中的数组的大小为x,file2中的数组的大小为y,则pytable中的结果数组的大小将为x + y,首先包含来自file1的所有条目,然后包含所有来自file2的条目. 解决方案 此操作的方式在某种程度上取决于您拥有的数据类型.数组和CArray ..
发布时间:2020-11-22 19:10:57 其他开发

R hdf5数据集写错了吗?

当我执行以下代码时,我的“预测变量"数据集将正确填充: library(rhdf5) library(forecast) library(sltl) library(tseries) fid ..
发布时间:2020-11-22 19:10:53 其他开发

对于python,请安装hdf5/netcdf4

在Linux Mint 17.1上执行此操作. 当我尝试时: pip install hdf5 我收到错误 "Could not find a version that satisfies the requirement hdf5 (from versions: ) No matching distribution found for hdf5" 从长远来看,我正在尝 ..
发布时间:2020-11-22 19:10:49 Python

hdf5文件转换为pandas dataframe

我下载了一个存储在.h5文件中的数据集. 我只需要保留某些列,并能够处理其中的数据. 为此,我尝试将其加载到pandas数据框中.我尝试使用: pd.read_hdf(path) 但是我得到:No dataset in HDF5 file. 我在SO上找到了答案(将HDF5文件读取到熊猫带有条件的DataFrame ),但我不需要条件,答案添加了有关文件编写方式的条件,但我不 ..
发布时间:2020-11-22 19:10:46 Python

HDF5/C ++中存在测试组

我正在打开一个现有的HDF5文件来附加数据;我要确保存在名为/A的组以用于后续访问.我正在寻找一种有条件的创建/A的简便方法(如果不存在,则创建并返回新组,或者返回现有组).一种方法是测试/A存在.我怎样才能有效地做到这一点? 根据API文档,我可以执行以下操作: H5::H5File h5file(filename,H5F_ACC_RDWR); H5::H5Group grp; tr ..
发布时间:2020-11-22 19:10:42 C/C++开发