pandasql相关内容

在多个条件下合并数据帧 - 不是特别针对相等的值

首先,对不起,如果这有点冗长,但我想完整描述我遇到的问题以及我已经尝试过的内容. 我正在尝试在多个条件下将两个数据帧对象连接(合并)在一起.如果要满足的条件都是“等于"运算符,我知道如何执行此操作,但是,我需要使用 LESS THAN 和 MORE THAN. 数据框代表遗传信息:一个是基因组中的突变列表(称为 SNP),另一个提供有关基因在人类基因组上的位置的信息.对这些执行 df. ..
发布时间:2021-12-27 22:27:22 Python

Pandas - 对 Na 以外的值使用“填充"

有没有办法对不是 NaN 的值使用 ffill 方法? 我的数据框中有 NaN,但我使用 添加了这些 NaN addNan = sample['colA'].replace(['A'], 'NaN') 这就是我的 DataFrame,df 的样子 ColA ColB ColC ColDB A C南巴阿C D D A南 A A B 我正在尝试使用 ffill 填充这些 NaN ,因此 ..
发布时间:2021-06-07 18:40:00 Python

使用pd.read_sql()从oracle数据库中提取大数据(> 500万条记录),使sql执行非常缓慢

最初尝试使用pd.read_sql(). 然后我尝试使用sqlalchemy,查询对象,但是这些方法都不是有用,因为sql可以长时间执行,并且永无止境. 我尝试使用提示. 我猜问题出在下面:Pandas在背景.使用cx_Oracle,我们无法影响"arraysize"参数因此将被使用,即始终使用默认值100太小了. CODE:将熊猫作为pd导入导入Configuration.Sett ..
发布时间:2021-04-27 20:48:27 其他开发

如何正确实现在sqlite3的可变LIKE语句中使用的索引?

我正在尝试在两个表之间进行一些模糊匹配. 一个是我在本地存储的表(9,000行),称为表A.另一个存储为sqlite db(200万+行csv),称为表B. 基本上,我想将表A中的"CompanyNames"列与表B中的"CurrentEntityNames"列进行匹配,并使用它来将表B联接到表A. 我目前能够遍历LIKE语句,并传递如下所示的参数: (myNames只是表A中的Compan ..
发布时间:2020-07-02 05:27:05 数据库

如何使用并行插入语句在MySQL表中插入大熊猫数据框?

我正在一个项目中,我必须编写一个具有数百万行和约25列(大多数为数字类型)的数据框.我正在使用 Pandas DataFrame转换为SQL函数将数据帧转储到Mysql表中.我发现此函数创建了一个Insert语句,该语句可以一次插入多行.这是一个好方法,但是MySQL限制了使用此方法可以构建的查询的长度. 有没有一种方法可以将其并行插入同一张表中,从而加快处理速度? 解决方案 您可以 ..
发布时间:2020-07-02 05:27:00 数据库

在PandaSQL中使用用户输入变量

我正在尝试在已有的数据帧上使用pandaSQL,我想知道是否存在使用变量的方法,或者是否存在另一种使用变量的方法.我想要做的是将用户输入设置为变量,然后尝试在SQL语句中使用它.我想在输入时显示该形状的每个实例.我正在尝试以下方法: variable1 = input("Enter shape here: ") print pysqldf("SELECT imageNum FROM df W ..
发布时间:2020-05-24 04:28:32 Python

在多种条件下合并DataFrames-并非专门针对相等的值

首先,很抱歉,如果这有点冗长,但是我想完整地描述一下我遇到的问题以及已经尝试过的事情. 我试图在多个条件下将两个数据框对象连接(合并)在一起.如果要满足的条件都是“等于"运算符,我知道该怎么做,但是,我需要使用LESS THAN和MORE THAN. 数据框代表遗传信息:一个是基因组中的突变列表(称为SNP),另一个是有关人类基因组中基因位置的信息.在这些文件上执行df.head()会 ..
发布时间:2020-05-09 00:19:56 Python