pandas 数据框左合并,无需重新索引 [英] Pandas dataframe left merge without reindexing

查看:132
本文介绍了 pandas 数据框左合并,无需重新索引的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

想知道是否有更直观的方法来合并数据框架

Wondering if there's a more intuitive way to merge dataframes

In[140]: df1 = pd.DataFrame(data=[[1,2],[3,4],[10,4],[5,6]], columns=['A','B'], index=[1,3,5,7])
In[141]: df1
Out[141]: 
    A  B
1   1  2
3   3  4
5  10  4
7   5  6

In[142]: df2 = pd.DataFrame(data=[[1,5],[3,4],[10,3],[5,2]], columns=['A','C'], index=[0,2,4,6])
In[143]: df2
Out[143]: 
    A  C
0   1  5
2   3  4
4  10  3
6   5  2

我想要的合并应该是这样的

My desired merged should look like this

    A  B  C
1   1  2  5
3   3  4  4
5  10  4  3
7   5  6  2

关键是保留原始左数据框索引。

左合并不起作用,因为它重新索引

The key is to retain the origin left dataframe index.
Left merge does not work because it reindexes

In[150]: pd.merge(df1, df2, how='left', on='A')
Out[150]: 
    A  B  C
0   1  2  5
1   3  4  4
2  10  4  3
3   5  6  2

经过一些试验和错误,这种方式是有效的,但是想知道是否有更直观的方式来实现相同的。

After some trial and error, figured out this way that works but wonder if there's a more intuitive way to achieve the same.

In[151]: pd.merge(df1, df2, how='outer', on=['A'], right_index=True)
Out[151]: 
    A  B  C
1   1  2  5
3   3  4  4
5  10  4  3
7   5  6  2


推荐答案

pd.merge(df1, df2, how='outer', on=['A'], right_index=True)

看起来对我有点奇怪。它说,让我们在列A上加入两个表,还可以在左侧表中加入右表的索引。我想知道为什么这样做。

looks a little weird to me. It says let's join two tables on column A and also the index of the right table with nothing on the left table. I wonder why this works.

我会这样做:

In [27]: df1['index'] = df1.index
In [28]: df2['index'] = df2.index
In [33]: df_merge = pd.merge(df1, df2, how='left', on=['A'])
In [34]: df_merge
Out[34]:
    A  B  index_x  C  index_y
0   1  2        1  5        1
1   3  4        3  4        2
2  10  4        5  3        3
3   5  6        7  2        4

In [35]: df_merge = df_merge[['A', 'B', 'C', 'index_x']]

In [36]: df_merge
Out[36]:
    A  B  C  index_x
0   1  2  5        1
1   3  4  4        3
2  10  4  3        5
3   5  6  2        7

[4 rows x 4 columns]

In [37]: df_merge.set_index(['index_x'])
Out[37]:
          A  B  C
index_x
1         1  2  5
3         3  4  4
5        10  4  3
7         5  6  2

这篇关于 pandas 数据框左合并,无需重新索引的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆