合并两个数据帧会在R中创建额外的行 [英] merging two dataframes creates extra rows in R

查看:39
本文介绍了合并两个数据帧会在R中创建额外的行的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我有两个数据帧。

a=包含数千个不同天气事件观测的原始数据集。6000个OBS。

   STATE       EVTYPE
1     AL WINTER STORM
2     AL      TORNADO
3     AL    TSTM WIND
4     AL    TSTM WIND
5     AL    TSTM WIND
6     AL         HAIL
7     AL    HIGH WIND
8     AL    TSTM WIND
9     AL    TSTM WIND
10    AL    TSTM WIND

b=字典表,其中包含大多数天气事件的标准拼写。500个OB。

    EVTYPE    evmatch
71         DUST DEVEL DUST DEVIL
72         DUST DEVIL DUST DEVIL
73         DUST DEVIL DUST DEVIL
74         DUST STORM DUST STORM
75        EARLY FROST       <NA>
76         EARLY RAIN       <NA>

evtype将两者合并为df_new

library(dplyr)
df_new <- left_join(a, b, by = c("EVTYPE"))
STATE       EVTYPE           evmatch
1     AL WINTER STORM      WINTER STORM
2     AL      TORNADO           TORNADO
3     AL    TSTM WIND THUNDERSTORM WIND
4     AL    TSTM WIND THUNDERSTORM WIND
5     AL    TSTM WIND THUNDERSTORM WIND
6     AL         HAIL              HAIL
7     AL    HIGH WIND         HIGH WIND
8     AL    TSTM WIND THUNDERSTORM WIND
9     AL    TSTM WIND THUNDERSTORM WIND
10    AL    TSTM WIND THUNDERSTORM WIND
11    AL   HEAVY RAIN        HEAVY RAIN
12    AL  FLASH FLOOD       FLASH FLOOD
13    AL    TSTM WIND THUNDERSTORM WIND
14    AL   HEAVY RAIN        HEAVY RAIN
15    AL    TSTM WIND THUNDERSTORM WIND

当我连接这两个数据集时,我得到的数据集的OB比原来的要多。

a有6,000个OB,df_new有69400个。

如何合并这两个数据集,以使生成的DF与原始数据帧相同。

上下文:

原始数据集对于同一天气事件有多个打字/拼写,即dust develdust devil

为了运行分析,每个观察都需要标准拼写。例如,我无法对dust devil运行分析,因为同一事件的多个观察具有不同的拼写。

我创建了一个"字典",每个事件类型都有官方拼写,即dust develdust devil都是dust deviltstm wind都是thunderstorm wind

我想在原始数据集中添加一列,以显示每个天气事件的正确拼写。

但是,我的结果数据集有额外的行。

推荐答案

您的b表有重复项,请将b替换为unique(b),这样就可以了。

df_new <- left_join(a, unique(b))

"LEFT JOIN"只是表示将使用中的所有行,即使它们在b中没有匹配项。如果他们在b中有多个匹配项,您将在df_new中获得其他行。

有关详细信息,请参阅此内容:

https://stat545-ubc.github.io/bit001_dplyr-cheatsheet.html#left_joinsuperheroes-publishers

这篇关于合并两个数据帧会在R中创建额外的行的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆