dataframe 第453页 - IT屋-程序员软件开发技术分享社区

如何使用tcltk将数据框保存为CSV到用户选择的位置

我有一个名为 Fail 的数据框。我想在用户选择的位置将失败另存为CSV。下面是我发现的一些示例代码，但我不知道如何将 Fail 加入其中。 require（tcltk） fileName if（！nchar（fileName））{ tkmessageBox（message =“No文件被选中！“） } else { tkmessageBox（message = paste ..

发布时间：2017-02-24 19:35:29 r csv save dataframe Office

Python pandas：输出数据帧到带有整数的csv

我有一个 pandas.DataFrame ，我希望导出到CSV文件。然而，pandas似乎写一些值为 float 而不是 int 类型。建立资料框架： df = pandas.DataFrame（columns = ['a'，'b'，'c'，'d']，index = ['x'，'y'，'z']，dtype = int） x = pandas.Series（[10,10,10]，i ..

发布时间：2017-02-24 19:31:34 python csv dataframe pandas Python

计算dataframe中列的摘要统计信息

我有一个以下表单的数据框架（例如） shopper_num，is_martian，number_of_items，count_pineapples，birth_country，tranpsortation_method 1，FALSE，0,0，MX， 2，FALSE，1,0，MX， 3，FALSE，0,0，MX， 4，FALSE， 22,0，MX， 5，FALSE，0,0，MX ..

发布时间：2017-02-24 19:29:27 python csv pandas dataframe Python

如何将两列合并到由两个或更多不同csv文件组成的数据帧中的新列中？

我有几个csv文件都用日期命名，对于所有这些文件，我想在每个文件中创建一个新列，其中包含放置在一起的其他两列的数据。然后，我想将它们组合成一个大数据框，并只选择其中两个列。这里有一个例子：说我有两个数据框架： abcabc x 1 2 3 x 3 2 1 y 2 3 1 y 2 1 3 然后我想在其中的每一个中创建一个新列d： abcdabcd x ..

发布时间：2017-02-24 18:23:21 r csv dataframe multiple-columns Office

如何从文件中删除rownames

我有一个像这样的文件。 “Locations”“X9442”“X5997” “1”“cg00000957”0.87 0.86 “2”“cg00001349”0.78 0.78 “3”“cg00001583”0.06 0.08 “4”“cg00002028”0.01 0.01 我想删除行名称，如下所示： “地点”“X9442”“X5997” “cg000009 ..

发布时间：2017-02-24 18:18:48 r csv dataframe rowname Office

python - 使用具有大csv的pandas结构（iterate和chunksize）

我有一个大的csv文件，大约600mb与1100万行，我想创建统计数据，如枢轴，直方图，图形等。显然试图只是为了正常阅读： df = pd.read_csv（'Check400_900.csv'，sep ='\t'）不工作，所以我发现iterate和chunksize在一个类似的职位，所以我使用 df = pd.read_csv（'Check1_900.csv' ..

发布时间：2017-02-24 18:10:12 python csv pandas dataframe bigdata Python

将来自大型csv文件的小随机样本加载到R数据框中

要处理的csv文件不适合内存。解决方案你也可以只做一些基本的统计数据 perl -ne'print if（rand（） subset.txt 这不一定会给你2万行。（这里它会占用大约.01或总行数的1％）。但是，它会真的很快，你会有一个很好的副本的两个文件在你的目录。然后，您可以加载较小的文件到R，但你想要的。 ..

发布时间：2017-02-24 17:47:03 r csv random dataframe bigdata Office

在读取文件时指定行名称

我有一个包含行名称的 .txt 文件。如果你使用 read.table（）方法，你可以使用）（或其中一个，例如 read.csv（）），那么很容易修复是更改调用： read.table（file =“foo.txt”，row.names = 1，....）其中 .... 是您需要/使用的其他参数。 row.names 参数接受从中获取行名称的数据文件的列号。它不需要 ..

发布时间：2017-02-24 17:35:18 r csv dataframe rowname Office

在数据帧的所选列中包含NA（缺失）值的行子集

我们有一个来自CSV文件的数据框。数据框 DF 具有包含观察值的列和包含测量日期的列（ VaR2 ）已采取。如果未记录日期，则CSV文件包含缺少数据的值 NA 。 Var1 Var2 10 2010/01/01 20 NA 30 2010/03/01 我们想使用subset命令定义一个新的数据框架 new_DF ，这样它只包含有 NA'的值（ VaR2 ）。在 ..

发布时间：2017-02-24 17:18:42 r csv dataframe subset na Office

pandas的DataFrame输出结束csv

我想知道如何将新的DataFrame数据添加到现有csv文件的末尾？ to_csv没有提到这样的功能。先谢谢你。解决方案您可以使用 to_csv .python.org / 2 / library / functions.html＃open“rel =”noreferrer“>以追加模式开启： with open（file_name，'a'）as f： df.to_csv（f ..

发布时间：2017-02-24 16:49:18 python csv pandas dataframe Python

我有一个 data.table 不是很大（2 GB），但由于某种原因 write.csv 花费很长时间写出来（我从来没有真正完成等待），似乎使用了大量的RAM来做它。我尝试将 data.table 转换为 data.frame ，尽管这不应该做任何事情，因为 data.table extends data.frame 。有谁遇到这个？更重要的是，如果你使用 Ctrl - C 停止它，R似乎不会回忆 ..

发布时间：2017-02-24 16:07:18 r file-io csv dataframe data.table Office

如何使分隔符在read_csv中更灵活wrt空格？

我需要使用存储在文件中的数据创建数据框。为此，我想使用 read_csv 方法。然而，分离器不是很规则。一些列由制表符（ \t ）分隔，其他由空格分隔。此外，一些列可以由2或3或更多个空格分隔，甚至由空格和制表符的组合（例如3个空格，两个制表符，然后1个空格）分隔。有没有办法告诉熊猫正确处理这些文件？顺便说一句，如果我使用Python，我没有这个问题。我使用：用于文件中的行 ..

发布时间：2017-02-24 15:47:58 python csv pandas dataframe whitespace Python

Pandas将数据帧写入CSV文件

我有一个大熊猫的数据框，我想写一个CSV文件。我这样做使用： df.to_csv（'out.csv'）得到错误： UnicodeEncodeError： 'ascii'编解码器不能编码字符u'\\\α'在位置20：序数不在范围内（128）有没有办法容易解决这个问题（即我的数据框中有unicode字符）？并且有一种方法写入一个制表符分隔文件，而不 ..

发布时间：2017-02-24 15:26:12 python csv pandas dataframe Python

什么是最快的方式上传一个大的csv文件在笔记本中使用python熊猫？

我正在尝试上传一个csv文件，大小为250MB。基本上是4百万行和6列的时间序列数据（1min）。通常的过程是： location = r'C：\Users\Name\Folder_1\Folder_2\file .csv' df = pd.read_csv（location）此过程大约需要20分钟!!!。非常初步我已经探索了以下选项以块的形式上传， ..

发布时间：2017-02-24 15:05:56 python csv pandas dataframe Python

使用styles和css更改pandas dataframe html表python中的文本颜色

我有一个pandas数据框架： arrays = [['Midland'，'Midland'，'Hereford'赫尔福德'，'霍布斯'，'霍布斯'，'儿童'，'童女'，'里斯'，'里斯'， '圣安吉洛，'圣安吉洛']，，'WRF'，'MOS'，'WRF'，'MOS'，'WRF'，'MOS'，'WRF'，'MOS'，'WRF'，'MOS']] tuples = list zip（* ..

发布时间：2017-01-19 23:41:38 python html css pandas dataframe 前端开发

pandas：带有条件格式的HTML输出

我尝试格式化表格，以便每个列中的数据都根据其值格式化为样式（类似于电子表格程序中的条件格式）。如何使用HTML格式化程序在大熊猫中实现？典型的用例是在表中突出显示重要的值。例如：相关p值 0 0.5 0.1 1 0.1 0.8 2 0.9 * 0.01 * pandas允许为HTML输出定义自定义格式化程序 - ：将pandas导入为pd ..

发布时间：2017-01-19 23:21:04 python html css dataframe pandas 前端开发

R计数相似行的数据帧的出现

我有以下格式的数据称为DF（这只是一个简化的示例）： eval.num ，eval.count，fitness，fitness.mean，green.h.0，green.v.0，offset.0 random 1 1 1500 1500 100 120 40 232342 2 2 1000 1250 100 120 40 11843 3 3 1250 1250 100 120 ..

发布时间：2017-01-12 18:49:30 r count duplicates dataframe 其他开发

Python / Pandas：计算每行中丢失/ NaN的数量

我有一个包含大量行的数据集。一些值是NaN，像这样：在[91]：df Out [91]： 1 3 1 1 1 1 3 1 1 1 2 3 1 1 1 1 1 NaN NaN NaN 1 3 1 1 1 1 1 1 1 我想计算每个字符串中NaN值的数量， this：在[91]：list = 在[9 ..

发布时间：2017-01-12 18:32:15 pandas count row dataframe nan Python

任何人都知道如何获取列中的每个元素的计数自我

例如，这是我的数据 mydata v 1 1 2 1 3 2 4 2 5 2 6 3 $ b b 有任何可以生成向量或列的函数。 v count 1 1 2 2 1 2 3 2 3 4 2 3 5 2 3 6 3 1 我尝试了 sum（）的方法，但失败了 mydata $ counts ..

发布时间：2017-01-12 17:50:53 r count dataframe 其他开发

如何修改一个“单元”中的值，的大熊猫数据框？

我有一个非常简单的问题。我想改变一个给定的列中的一个给定的行的pandas数据帧的值。我尝试以下列方式： df ['column3']。loc [this_date] = val 因此，我收到以下警告： SettingWithCopyWarning：尝试在来自DataFrame的切片的副本上设置值我对此警告的解释是，使用列名（'column3'） ..

发布时间：2017-01-06 23:57:02 python pandas copy dataframe Python

dataframe相关内容