pandasql - IT屋-程序员软件开发技术分享社区

Pandas中的GROUP BY AND SUM不丢失列

发布时间：2022-02-26 21:08:24 python python-3.x pandas pandas-groupby pandasql Python

在多个条件下合并数据帧 - 不是特别针对相等的值

首先，对不起，如果这有点冗长，但我想完整描述我遇到的问题以及我已经尝试过的内容. 我正在尝试在多个条件下将两个数据帧对象连接(合并)在一起.如果要满足的条件都是“等于"运算符，我知道如何执行此操作，但是，我需要使用 LESS THAN 和 MORE THAN. 数据框代表遗传信息:一个是基因组中的突变列表(称为 SNP)，另一个提供有关基因在人类基因组上的位置的信息.对这些执行 df. ..

发布时间：2021-12-27 22:27:22 python pandas merge pandasql Python

Pandas - 对 Na 以外的值使用“填充"

有没有办法对不是 NaN 的值使用 ffill 方法? 我的数据框中有 NaN，但我使用添加了这些 NaN addNan = sample['colA'].replace(['A'], 'NaN') 这就是我的 DataFrame，df 的样子 ColA ColB ColC ColDB A C南巴阿C D D A南 A A B 我正在尝试使用 ffill 填充这些 NaN ，因此 ..

发布时间：2021-06-07 18:40:00 python pandas dataframe nan pandasql Python

使用pd.read_sql()从oracle数据库中提取大数据(> 500万条记录)，使sql执行非常缓慢

最初尝试使用pd.read_sql(). 然后我尝试使用sqlalchemy，查询对象，但是这些方法都不是有用，因为sql可以长时间执行，并且永无止境. 我尝试使用提示. 我猜问题出在下面:Pandas在背景.使用cx_Oracle，我们无法影响"arraysize"参数因此将被使用，即始终使用默认值100太小了. CODE:将熊猫作为pd导入导入Configuration.Sett ..

发布时间：2021-04-27 20:48:27 python-2.7 cx-oracle pandasql 其他开发

如何正确实现在sqlite3的可变LIKE语句中使用的索引?

我正在尝试在两个表之间进行一些模糊匹配. 一个是我在本地存储的表(9,000行)，称为表A.另一个存储为sqlite db(200万+行csv)，称为表B. 基本上，我想将表A中的"CompanyNames"列与表B中的"CurrentEntityNames"列进行匹配，并使用它来将表B联接到表A. 我目前能够遍历LIKE语句，并传递如下所示的参数: (myNames只是表A中的Compan ..

发布时间：2020-07-02 05:27:05 sqlite indexing sqlalchemy sql-like pandasql 数据库

如何使用并行插入语句在MySQL表中插入大熊猫数据框?

我正在一个项目中，我必须编写一个具有数百万行和约25列(大多数为数字类型)的数据框.我正在使用 Pandas DataFrame转换为SQL函数将数据帧转储到Mysql表中.我发现此函数创建了一个Insert语句，该语句可以一次插入多行.这是一个好方法，但是MySQL限制了使用此方法可以构建的查询的长度. 有没有一种方法可以将其并行插入同一张表中，从而加快处理速度? 解决方案您可以 ..

发布时间：2020-07-02 05:27:00 mysql pandas pandasql 数据库

在PandaSQL中使用用户输入变量

我正在尝试在已有的数据帧上使用pandaSQL，我想知道是否存在使用变量的方法，或者是否存在另一种使用变量的方法.我想要做的是将用户输入设置为变量，然后尝试在SQL语句中使用它.我想在输入时显示该形状的每个实例.我正在尝试以下方法: variable1 = input("Enter shape here: ") print pysqldf("SELECT imageNum FROM df W ..

发布时间：2020-05-24 04:28:32 pandas dataframe pandasql Python

Pandas IO SQL和具有多个结果集的存储过程

所以我在本地sql服务器上存储了proc，这将返回多个数据集/表通常，在python/pyodbc中，我将使用 cursor.nextset() subset1 = cursor.fetchall() cursor.nextset() subset2 = cursor.fetchall() 我希望利用ps.io.sql.read_sql并将具有多个结果集的存储过程返回到数据帧中， ..

发布时间：2020-05-24 04:23:04 python sql-server pandas stored-procedures pandasql 数据库

用列名而不是索引转置的熊猫数据框会引发ValueError

我正在尝试在转置数据框后在json中显示实际的列名，下面的代码适用于sql中的LIMIT 3，但是如果尝试LIMIT 5有什么想法的话会失败? from pandasql import * pysqldf = lambda q: sqldf(q, globals()) q1 = """ SELECT beef as beef, veal as veal, pork as pork, l ..

发布时间：2020-05-24 04:10:23 pandas python-3.6 pandasql Python

Python Pandas to_sql，如何用主键创建表?

我想用Pandas的to_sql函数创建一个具有主键的MySQL表(在mysql表中具有主键通常是一种好习惯)，如下所示: group_export.to_sql(con = db, name = config.table_group_export, if_exists = 'replace', flavor = 'mysql', index = False) 但这会创建一个没有任何主键 ..

发布时间：2020-05-14 20:28:05 python mysql pandas primary-key pandasql 数据库

在多种条件下合并DataFrames-并非专门针对相等的值

首先，很抱歉，如果这有点冗长，但是我想完整地描述一下我遇到的问题以及已经尝试过的事情. 我试图在多个条件下将两个数据框对象连接(合并)在一起.如果要满足的条件都是“等于"运算符，我知道该怎么做，但是，我需要使用LESS THAN和MORE THAN. 数据框代表遗传信息:一个是基因组中的突变列表(称为SNP)，另一个是有关人类基因组中基因位置的信息.在这些文件上执行df.head()会 ..

发布时间：2020-05-09 00:19:56 python pandas merge pandasql Python

将类似的行合并到python数据框中的一行

我有一些数据框如下，我想做的是将相同的 “yyyymmdd”和“hr”的行组合成一行。（有几行具有相同的“yyyymmdd”和“hr”） yyyymmdd hr ariel cat kiki mmax vicky gaolie shiu nick ck 10 2015-12-27 9 0 0 0 0 0 0 23 0 181 2015-12-27 10 0 0 0 0 0 0 ..

发布时间：2017-03-26 04:46:49 python sql pandas dataframe pandasql Python

pandasql相关内容