series相关内容
假设我有以下 pandas DataFrame: df = pd.DataFrame({'name': ['Johnny', 'Brad'], 'rating': [1.0, 0.9]}) 我希望将rating列从小数转换为字符串百分比(例如1.0到'100%')。以下各项工作正常: def decimal_to_percent_string(row): return '{
..
我正在进行Excel图表自动化。当我尝试向上移动LegendEntry(Series)对象时,我找不到MS site中的任何相关API方法。手动方式如下:选择图表>右键>选择数据...选择一个图例条目>单击按钮上移。我怎么才能用VBA做到这一点?提前谢谢您。 推荐答案 这里有另一种方法 Sub Sample() Dim ws As Worksheet Dim ob
..
我使用Pandas包生成了一个流量序列: data = np.array(data) index = date_range(time_start[0],time_end[0],freq='30S') s = Series(data, index=index) 示例的输出如下所示: 2013-07-02 10:04:30 13242.0 2013-07-02 10:05:00
..
我想检查数据帧中的每一列是否只包含数字。我怎样才能找到它。 推荐答案 您可以使用to_numeric和强制错误进行检查: pd.to_numeric(df['column'], errors='coerce').notnull().all() 对于所有列,您可以遍历列或仅使用apply df.apply(lambda s: pd.to_numeric(s, errors
..
这是我的代码: for col in df: if col.startswith('event'): df[col].fillna(0, inplace=True) df[col] = df[col].map(lambda x: re.sub("D","",str(x))) 我有0到10个事件列“Event_0,Event_1,...” 当我用此代
..
我正在尝试向pd.DataFrame内的每个pd.Series添加一个自定义属性。具体地说,我得到了一个CSV,其中间歇性地将颜色代码嵌入到列标题中。我希望在绘制图表之前将这些内容预先处理成一个属性,并将默认颜色分配给其他未指定的列。 但在其核心部分,我只需要在Series中的某个位置添加一个定制属性,就像您在任何其他Python对象上可能做的那样。简化示例: >>> import pan
..
我有一个DataFrame A B C 0 1 2 3 1 2 3 3 2 3 2 1 我需要在 pandas DataFrame中创建一个新列,其中‘yes’或‘no’随机填充此列。 A B C NEW 0 1 2 3 yes 1 2 3 3 no 2 3 2 1 no 使用随机选项会导致每一行都有相
..
使用类似对象类型的列创建(或加载)DataFrame很容易,如下所示: [In]: pdf = pd.DataFrame({ "a": [1, 2, 3], "b": [4, 5, 6], "c": [7, 8, 9],
..
我有一个名为SOURCE的列,它包含数百行文本。 问题是,其中一些可以组合在一起,我正在努力在 pandas 数据帧中做到这一点。以下是我的代码: df.source.replace({ df.source.str.startswith('share', na=False): 'sharePet', df.sourc
..
我可以理解为什么str.startswith()不处理正则表达式: col1 0 country 1 Country i.e : df.col1.str.startswith('(C|c)ountry') 它返回所有值FALSE: col1 0 False 1 False 推荐答案 Series.str.startswith不接受正则表达式,因为它的
..
我尝试将数据框转换为序列,但显示以下错误。我使用Pandas.Series(Dataframe)->将Dataframe转换为Series 我想要第一张图像格式的输出 推荐答案 请尝试以下方法从提到的数据中获取系列对象(假设data是您正在使用的DataFrame) series = pd.Series(data['Sales'], index=data.index)
..
我有两个不同长度的序列,我试图根据索引找到这两个序列的交集,其中索引是一个字符串。希望最终结果是一个包含基于公共字符串索引的交叉点元素的系列。 有什么想法吗? 推荐答案 pandas 索引有一个可以使用的intersection method。如果您有两个系列s1和s2,则 s1.index.intersection(s2.index) 或,相当于: s1.ind
..
这可能很简单,但我找不到解释,这经常发生在我身上。 我正在尝试从列Rate1E中选择超过3.5的值,并查看Pandas DataFrameenergy中符合上述条件的选定行的其余行。我之前有人给了我一个答案,现在简单地改成了如下文字: energy = energy.loc[energy[:, 'Rate1E'] >= 3.5] print(energy.loc[:, 'Rate1E'])
..
我有以下df: import pandas as pd from datetime import datetime, timedelta df = pd.DataFrame([ ["A", "2018-08-03"], ["B", "2018-08-20"] ]) df.columns = ["Item", "Date"] 我想为我的df的每一行获得一周
..
我有一个这样的 pandas 数据框。其中索引为pd.DatetimeIndex,列为时间序列。 x_1 x_2 x_3 2020-08-17 133.23 2457.45 -4676 2020-08-18 -982 -6354.56 -245.657 2020-08-19 5678.642 245.2786 2461.785 2020-08-20 -2394 154.34 -735
..
我有一个DataFrame: 名称 年龄 0 保罗 25 1 约翰 27 2 账单 23 我知道如果我输入: df[['name']] = df[['age']] 我会得到以下信息: 名称 年龄 0 25 25 1 27 27 2 23 23 但我希望命令得到相同的结果: df.loc[:, ['name']] = df.loc[:, ['age
..
有没有一种方法可以计算一列中布尔值的出现次数,而不必遍历DataFrame? 做类似的事情 df[df["boolean_column"]==False]["boolean_column"].sum() 将不起作用,因为False的值为0,因此零和将始终返回0。 显然,您可以通过循环遍历列并检查来计算出现的次数,但我想知道是否有一种蟒蛇式的方法来做到这一点。 推荐答案
..
我有如下所示的数据帧 df = pd.DataFrame({'person_id': [101,101,101,101,202,202,202], 'login_date':['5/7/2013 09:27:00 AM','09/08/2013 11:21:00 AM','06/06/2014 08:00:00 AM','06/06/2014
..
我正在尝试使用Pandas(0.23.3)计算Series对象的滚动自相关 设置示例: dt_index = pd.date_range('2018-01-01','2018-02-01', freq = 'B') data = np.random.rand(len(dt_index)) s = pd.Series(data, index = dt_index) 创建窗口大小为5的
..
在比较两个系列时,我遇到了 pandas 的意外行为.我想知道这是故意的还是错误的. 假设我: 将 pandas 导入为 pdx = pd.Series([1, 1, 1, 0, 0, 0], index=['a', 'b', 'c', 'd', 'e', 'f'], name='价值')y = pd.Series([0, 2, 0, 2, 0, 2], index=['c', 'f',
..