dataframe相关内容

在大熊猫数据框中找到条纹

我有一个大熊猫数据框如下: 时间优胜者失败者 1 AB 0 2 CB 0 3 DB 1 4 EB 0 5 FA 0 6 GA 0 7 HA 0 8 IA 1 每行都是匹配结果。第一列是比赛的时间,第二列和第三列包含赢家/输家,第四列是匹配中的一个统计。 我想检测条纹 预期结果应如下所示: 时间优胜者失败者条纹 1 ..
发布时间:2017-03-26 01:22:15 Python

如何填写(date-)data.frame中的空白?

我有一个带有日期列的data.frame。这些日期可能会发生多次,但也可以是零时间: 日期值 1 2013-01-01 5 2 2013-01-01 3 3 2013-01-03 3 4 2013-01-04 3 5 2013-01-04 1 6 2013 -01-06 1 如何填写这个数据框架中的日期间隔,所以我得到以下? 日期值 1 20 ..
发布时间:2017-03-26 01:22:02 其他开发

按年拆分数据

我有这样的数据: ID ATTRIBUTE START END 1 A 01-01-2000 15- 03-2010 1 B 05-11-2001 06-02-2002 2 B 01-02-2002 08-05-2008 2 B 01-06-2008 01-07- 2008 我现在想计算每年具有特定属性的不同ID的数量。 结果可能如下所示: ..
发布时间:2017-03-26 01:21:50 其他开发

Python大熊猫:读取Excel文件时如何指定数据类型?

我正在使用 pandas.read_excel()函数将一个excel文件导入大熊猫数据框。 其中一列是表的主键:它是所有数字,但它作为文本存储(Excel单元格左上角的小绿色三角形证实了这一点)。 但是,当我将文件导入熊猫数据框时,列将作为浮点数导入。这意味着,例如,'0614'成为614. 导入列时是否有方法指定数据类型?我理解这是可能导入CSV文件,但找不到任何东西在 re ..
发布时间:2017-03-26 01:21:38 Python

python pandas用数字替换数据帧中的字符串

有没有使用映射功能或更好地替换整个数据框中的值? 我只知道如何执行系列映射。 p> 我想在'tesst'和'set'列中替换一个数字 的字符串,例如set = 1,test = 2 以下是我的数据集示例:(原始数据集非常大) ds_r 受访者品牌引擎国家意识感知_知道_3年龄tesst设置 0一个沃尔沃p毛1 0 1 23集集 1 b沃尔沃无毛0 0 1 45集集 ..
发布时间:2017-03-26 01:21:15 Python

Pandas DataFrame存储列表为字符串:如何转换回列表?

我有一个 n -by- m Pandas DataFrame df 定义如下。 (我知道这不是最好的方法,对于我在实际代码中要做的事情,这是有道理的,但是这个帖子的TMI是正确的,所以只要我说这个方法适用于我的特定情况。) >>> df = DataFrame(columns = ['col1']) >>> df.append(Series([None]),ignore_index = Tr ..
发布时间:2017-03-26 01:20:52 Python

修改大R数据框时,内存不足

我有一个大的数据框架,大约有900MB的RAM。然后我试图修改它: dataframe [[17]] [37544] = 0 似乎使R使用超过3G ram和R抱怨“错误:不能分配大小3.0 Mb的向量”,(I我在一个32位机器上。) 我发现这样更好: dataframe [37544,17] = 0 但是R的占用仍然翻了一番,有一段时 ..
发布时间:2017-03-26 01:20:27 其他开发

如何将OpenDocument电子表格转换为大熊猫DataFrame?

Python图书馆大熊猫可以阅读Excel电子表格并将它们转换为 pandas.DataFrame 与 pandas.read_excel(file)命令。在引擎盖下,它使用 xlrd 库,其中不支持 ods文件。 ods文件是否有相当于 pandas.read_excel 的文件?如果没有,我如何为打开文档格式化的电子表格(ods文件)做同样的操作? ODF由LibreOffice和Ope ..
发布时间:2017-03-26 01:19:29 Python

对R中的数据帧中的每一行应用一个函数

可能重复: 如何将函数应用于R中的矩阵(或数据帧)的每一行, a> R - 如何使用df的每一行中的多个参数从每行数据帧上调用类似应用的函数 我想对数据框中的每一行应用一个函数,但是,R默认将其应用于每一列。如何强制它否则? > a = as.data.frame(list(c(1,2,3),c(10,0,6)),header = T) > a c.1..2..3。 c ..
发布时间:2017-03-26 01:18:54 其他开发

累积和百分比列?

我有一个 DataFrame 这样: df : fruit val1 val2 0 orange 15 3 1 apple 10 13 2芒果5 5 如何让熊猫给我累积的总和百分比列只有 val1 ? 所需输出: df_with_cumsum : fruit val1 val2 cum_sum cum_perc 0 ..
发布时间:2017-03-26 01:18:43 Python

创建一个零填充的熊猫数据框架

$ p 我已经使用了: zero_data = np.zeros(shape =(len(data),len(feature_list))) d = pd.DataFrame(zero_data,columns = feature_list) 有更好的方法吗? 解决方案 您可以尝试这样: d = pd.DataFrame(0, index = np ..
发布时间:2017-03-26 01:18:31 Python

如何检查熊猫中是否存在列

有没有办法检查Pandas DataFrame中是否存在列? 假设我有以下DataFrame: >>>将大熊猫导入为pd >>>从随机导入randint >>>> df = pd.DataFrame({'A':xrange(10)中的x的[randint(1,9)], 'B':[randint(1,9)* 10 for x in xrange )], 'C':[randint(1, ..
发布时间:2017-03-26 01:18:19 Python