hdf5相关内容

从HDF5文件删除信息

我意识到某个SO用户以前曾问过这个问题但在2009年被问到,我希望能够获得更多关于HDF5的知识,或者较新的版本已解决了该特定问题.在这里重述有关我自己的问题的问题; 我有一个来自大型几何图形的巨大的节点和元素文件,并且已经从中检索了我需要的所有有用信息.因此,在Python中,我试图保留原始文件,但删除不需要的信息,并为其他来源填写更多信息.例如,我有一个不需要的节点数据集.但是,我需要保 ..
发布时间:2020-11-22 19:10:39 Python

Python-快速HDF5时间序列数据查询

我需要对HDF5数据库中特定时间范围内的时间序列数据进行大量连续查询(数据以秒为单位,并不总是“连续的",我只知道开始和结束时间).因此,我想知道是否有比我当前代码更快的解决方案,它受import pandas as pd from pandas import HDFStore store = HDFStore(pathToStore) dates = pd.date_range(start=st ..
发布时间:2020-11-22 19:10:31 Python

在具有500e6行的hdf5 pytable中查找重复项

问题 我有一个很大的数据集(> 500e6行),已将其放入pytables数据库中. 假设第一列是ID,第二列是每个ID的计数器.每个ID计数器组合必须是唯一的.我要查找的500e6行中有一个非唯一行. 作为初学者,我已经做了类似的事情: index1 = db.cols.id.create_index() index2 = db.cols.counts.create_in ..
发布时间:2020-11-22 19:10:26 Python

无法重新安装适用于Python 2.7的PyTables

除2.7之外,我还将安装Python 2.7.当再次为2.7安装PyTables时,出现此错误- 找到已安装的numpy 1.5.1软件包. ..错误::找不到本地HDF5安装. 您可能需要明确说明本地HDF5标头和 可以通过设置HDF5_DIR环境来找到库 变量或使用--hdf5命令行选项. 我对HDF的安装不清楚.我再次下载-并将其复制到/usr/local/hdf5目录.并尝试按 ..
发布时间:2020-11-22 19:10:22 Python

HDF5存储开销

我正在将大量的小型数据集写入HDF5文件,结果文件大小大约是我对所放入数据的幼稚制表所期望的10倍.我的数据按层次结构进行组织,如下所示: group 0 -> subgroup 0 -> dataset (dimensions: 100 x 4, datatype: float) -> dataset (dimensions: 100, dataty ..
发布时间:2020-11-22 19:10:20 其他开发

PyTables读取随机子集

是否可以从HDF5中读取行的随机子集(通过pyTables或最好是pandas)?我有一个非常大的数据集,其中包含一百万行,但只需要几千个样本就可以进行分析.那么从压缩的HDF文件中读取数据呢? 解决方案 使用HDFStore文档为 0.13支持通过构造索引进行随机访问 In [26]: df = DataFrame(np.random.randn(100,2),columns=[' ..
发布时间:2020-11-22 19:10:16 Python

将字典保存到文件(numpy和Python 2/3友好)

我想在Python中进行分层键值存储,这基本上可以归结为将字典存储到文件中.我的意思是任何类型的字典结构,都可能包含其他字典,numpy数组,可序列化的Python对象等等.不仅如此,我还希望它存储经过空间优化的numpy数组,并在Python 2和3之间很好地发挥作用. 下面是我知道的方法.我的问题是此列表中缺少什么,还有没有其他方法可以躲避我所有的违规者? Python的pickl ..
发布时间:2020-11-22 19:10:14 Python

在python3中使用h5py发现密钥

在python2.7中,我可以分析hdf5个文件密钥的使用情况 $ python >>> import h5py >>> f = h5py.File('example.h5', 'r') >>> f.keys() [u'some_key'] 但是,在python3.4中,我得到了一些不同的东西: $ python3 -q >>> import h5py >>> f = h5py.F ..
发布时间:2020-11-22 19:10:12 其他开发

JNI表现

我们的主程序是用Java编写的,但是从存储中提取数据的代码是用C编写的.我需要从提取的数据中构建一个HDF5文件.使用JNI调用C代码以获取数据,然后从Java构建HDF5文件还是从C代码构建HDF5,会更好吗? 我对JNI或C经验很少. 我们的主要标准之一就是性能.使用JNI会对性能造成多少影响? 解决方案 函数调用边界是“缓慢的",因此,如果您对本机例程进行了多次调用,则性 ..
发布时间:2020-11-22 19:09:10 其他开发

如何使用C ++ API在HDF5文件中创建多值属性

编辑开始 我正在尝试基于本机类型(float,int ...)创建"pair,triplet或n-uplet"属性: 成对的浮点数,三元组的浮点数,n-uplet of floats属性 int对,int三元组,int属性的n-uplet 我不是要创建“数组"属性,我不是要创建“复合"属性 编辑结束 我正在尝试基于本机类型(float,int ...)创建一个属性, ..
发布时间:2020-11-22 19:08:55 C/C++开发

在Windows上使用Intel fortran的HDF5

我想使用Visual Studio 2010在Windows 7上使用intel fortran 2011编译的fortran90程序创建一个HDF5数据集 我可以使用预构建的二进制文件还是如何构建新的二进制文件 解决方案 我的成功归功于High Performance Mark: 这就是我所做的(不确定是否一切必要): 下载并安装cmake 下载并安装HDF5 [Windo ..
发布时间:2020-11-22 19:08:51 其他开发

如何在Windows 10上安装HDF5版本1.10.5

我正在使用pycharm 2019.2,尝试运行此代码时出现以下错误: import nltk import numpy import tflearn import tensorflow import random import json from nltk.stem.lancaster import LancasterStemmer stemmer = LancasterStemmer( ..
发布时间:2020-11-22 19:07:48 其他开发

我可以将自己的类对象存储到hdf5中吗?

我有一个这样的课程: class C: def __init__(self, id, user_id, photo): self.id = id self.user_id = user_id self.photo = photo 我需要创建数百万个此类对象. id和user_id一样是一个整数,但是photo是一个布尔数组, ..
发布时间:2020-11-22 19:07:46 Python

使用pytables或pandas删除表或节点后,释放hdf5磁盘内存

我正在将HDFStore与pandas/pytables一起使用. 删除表或对象后,hdf5文件大小保持不变.以后,当添加其他对象来存储时,似乎会重用此空间,但是如果浪费了大空间,这可能是个问题. 我在pandas或pytables API中都没有找到可用于恢复hdf5内存的命令. 您知道有什么机制可以改善hdf5文件中的数据管理吗? 解决方案 请参见这里 您需要p ..
发布时间:2020-11-22 19:07:42 Python

HDF5 rowmajor或colmajor

是否可以知道以HDF5格式存储的矩阵是RowMajor还是ColMajor?例如,当我保存八度音阶中的矩阵并将其内部存储为ColMajor时,当我在将矩阵存储在RowMajor中的C代码中读取它们时,需要对它们进行转置. 解决方案 HDF5以行主要顺序存储数据: HDF5使用C存储约定,假定最后列出的维度是变化最快的维度,而第一个列出的维度是变化最快的维度. 摘自《 HDF5用 ..
发布时间:2020-11-22 19:07:41 其他开发

R和HDF5故障

我正在尝试将hdf5加载到R中并遇到一些问题.以下是我配置环境的步骤: 在Mac OS X 10.6上 R 2.10.0(x64) 通过MacPorts安装的 hdf5 1.8.3 来自CRAN的 hdf5_1.6.9.tar.gz 我怀疑我所遇到的问题与我的HDF5版本和R模块期望的版本不兼容有关.为了完整起见,这是我安装R模块的方式: R CMD安装--configure ..
发布时间:2020-11-22 19:06:38 其他开发

保存在hdf5save中会创建一个不可读的文件

我正在尝试使用R将数组另存为HDF5文件,但是没有运气. 要尝试诊断问题,我运行了example(hdf5save).这样成功创建了一个HDF5文件,我可以使用h5dump轻松阅读该文件. 当我然后手动运行R代码时,我发现它不起作用.我运行的代码与示例脚本中运行的代码完全相同(除了更改文件名以避免覆盖外).这是代码: (m ..
发布时间:2020-11-22 19:05:34 其他开发