列出数据框中每一列的唯一值 [英] list unique values for each column in a data frame

查看:77
本文介绍了列出数据框中每一列的唯一值的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

假设您有一个很大的 csv格式的输入文件。您想知道每列中出现的不同值。

Suppose you have a very large input file in "csv" format. And you want to know the different values that occur in each column. How would you do that?

例如。

column1    column2    column3    column4
----------------------------------------
value11    value12    value13    value14
value21    value22    value23    value24
...
valueN1    valueN2    valueN3    valueN4

所以我希望输出为:

column1具有以下值:value11,value21,... valueN1 。但我不必再看到相同值的重复发生。我只需要了解我的数据的全部含义。

column1 has these values: value11, value21, ...valueN1. but I don't need to see reoccurrences of the same value. I need this just to get an idea of what my data is all about.

推荐答案

在读取<$后,让 dat 作为数据框c $ c> csv 文件,您可以这样做

Let dat be your data frame after reading in the csv file, you can do

ulst <- lapply(dat, unique)

如果您还想知道每个列的唯一值的数量,请

If you further want to know the number of unique values for each column, do

k <- lengths(ulst)

这篇关于列出数据框中每一列的唯一值的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆