列出数据框中每一列的唯一值 [英] list unique values for each column in a data frame
本文介绍了列出数据框中每一列的唯一值的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
假设您有一个很大的 csv格式的输入文件。您想知道每列中出现的不同值。
Suppose you have a very large input file in "csv" format. And you want to know the different values that occur in each column. How would you do that?
例如。
column1 column2 column3 column4
----------------------------------------
value11 value12 value13 value14
value21 value22 value23 value24
...
valueN1 valueN2 valueN3 valueN4
所以我希望输出为:
column1具有以下值:value11,value21,... valueN1
。但我不必再看到相同值的重复发生。我只需要了解我的数据的全部含义。
column1 has these values: value11, value21, ...valueN1
. but I don't need to see reoccurrences of the same value. I need this just to get an idea of what my data is all about.
推荐答案
在读取<$后,让 dat
作为数据框c $ c> csv 文件,您可以这样做
Let dat
be your data frame after reading in the csv
file, you can do
ulst <- lapply(dat, unique)
如果您还想知道每个列的唯一值的数量,请
If you further want to know the number of unique values for each column, do
k <- lengths(ulst)
这篇关于列出数据框中每一列的唯一值的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文