在OpenRefine中组合第x列到第n列 [英] Combine column x to n in OpenRefine

查看:10
本文介绍了在OpenRefine中组合第x列到第n列的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我有一个具有未知列数的表,并且我需要合并某个点之后的所有列。请考虑以下事项:

| A  | B  | C | D | E |
|----|----|---|---|---|
| 24 | 25 | 7 |   |   |
| 12 | 3  | 4 |   |   |
| 5  | 5  | 5 | 5 |   |
A-C列是已知的,并且其中的信息是正确的。但是,D列到N列(从D开始的未知数量的列)需要组合,因为它们都是同一字符串的一部分。如何在OpenRefine中合并未知数量的列?

由于某些列可能有空单元格(字符串的长度可能不同),我还需要忽略空单元格。

推荐答案

有两个步骤的方法,适用于您。

从要合并的第一列(本例中为D列)中,选择转置->将列中的单元格转置为行

系统将要求您设置一些选项。您需要选择‘From Column’D和‘To Column’N,然后选择转置为一列,为该列指定一个名称,确保选中了‘Ignore Blank Cells’(忽略空白单元格)选项(默认情况下应选中)。然后单击"转置"。

您将获得以前在列D-N中显示的值。例如

| A  | B  | C | D | E | F |
|----|----|---|---|---|---|
| 1  | 2  | 3 | 4 | 5 | 6 |

转置为:

| A  | B  | C | new |
|----|----|---|-----|
| 1  | 2  | 3 | 4   |
|    |    |   | 5   |
|    |    |   | 6   |
然后,您可以使用‘new’列头的下拉菜单来选择 编辑单元格->联接多值单元格

系统将询问您要使用什么字符来分隔连接的单元格中的字符。可能在您的用例中,您可以删除连接字符并合并不带任何连接字符的单元格。这将为您提供:

| A  | B  | C | new |
|----|----|---|-----|
| 1  | 2  | 3 | 456 |

这篇关于在OpenRefine中组合第x列到第n列的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆