data-analysis 第8页 - IT屋-程序员软件开发技术分享社区

如何转换在SQL Server中编写的脚本以计算Postgresql的优势比？

在SQL Server中，我编写了以下脚本，以将测试组的概率除以对照组的概率来计算优势比。脚本如下： -从模型中计算优势比，选择a.column1，a。 uvs作为testuvs。 b.uvs作为controluvs ，[odds] =当b.uvs> 0然后a.puvs / b.puvs时的情况，否则null结束进入control_probabilties中的unique_visito ..

发布时间：2020-05-30 01:57:28 sql postgresql data-analysis 其他开发

PostgreSQL中使用R的非线性回归模型

背景我有1900年至2009年之间加拿大全境的气候数据（温度，降水量，积雪深度）。我写了一个基本的网站，最简单的页面允许用户选择类别和城市。然后，他们返回一个非常简单的报告（没有参数和计算部分）： Web应用程序的主要目的是提供一个简单的用户界面，以便公众可以有意义的方式浏览数据。（数字列表对公众没有意义，也没有提供太少的网站许多输入。）该应用程序的第二个目的是为气候学家和其他科学 ..

发布时间：2020-05-29 22:11:25 postgresql r statistics data-analysis 其他开发

如何减少基于另一列的数据框colunm值

我有一个这样的数据框. 我正在尝试删除出现在子字符串列中的字符串. Main substring Sri playnig well cricket cricket sri went out NaN Ram is in NaN Ram went to UK,US UK,US 我 ..

发布时间：2020-05-24 04:15:20 python string pandas dataframe data-analysis Python

Python-将数据框内的数据取出到另一个单元中

这是具有14列的数据帧的单个单元格中的数据.单元格是列的元素.有45k +这种细胞，手动操作真是个地狱. 一个单元格数据我想对此单元格做三件事: 将带有地址，状态，邮政编码的文本部分移动到另一列；删除单元格的钩子()；分开2列经度和纬度. 怎么可能? 解决方案下面是一个简单有效的示例，其中包含2个数据点: text1 = """30881 EKLU ..

发布时间：2020-05-24 04:15:08 python pandas dataframe data-science data-analysis Python

如果特定行在python的数据框中具有重复的值，如何删除整列

我有一个这样的数据框， df, Name City 0 sri chennai 1 pedhci pune 2 bahra pune 在“城市"列中有重复项. 我尝试过: df["City"].drop_duplicates() 但是它只给出特定的列. 我想要的输出应该是 output ..

发布时间：2020-05-24 04:07:29 python pandas dataframe data-analysis Python

熊猫计算每月平均值

我创建了以下数据框: availability = pd.DataFrame(propertyAvailableData).set_index("createdat") monthly_availability = availability.fillna(value=0).groupby(pd.TimeGrouper(freq='M')) 这给出了以下输出 ..

发布时间：2020-05-24 04:04:12 python pandas data-analysis Python

如何根据熊猫中的条件映射两行不同的数据框

我有两个数据框 df1， Names one two three Sri is a good player Ravi is a mentor Kumar is a cricketer player df2， values sri NaN sri, is kumar,cricketer player 我正在尝试在df1中获取包含df2中所有项目的行 ..

发布时间：2020-05-24 04:00:49 python pandas dataframe data-analysis Python

数据列值未更改为浮动

我有一个数据框， df, Name Stage Description 0 sri 1 sri is one of the good singer in this two 1 nan 2 thanks for reading 2 ram 1 ram is two of the good cricket ..

发布时间：2020-05-24 03:56:15 python pandas dataframe data-analysis Python

如何在数据列中拆分值并将其添加到带有pandas中条件的新列中

我有一个df， name Value Sri is a cricketer Sri,is Ram player Ram Ravi is a singer is cricket and foot is ball and,is,foot 和一个列表 my_lis ..

发布时间：2020-05-24 03:55:30 python pandas dataframe data-analysis Python

如何用熊猫中的字典键替换列值

我有一个df， A B one six two seven three level five one 和词典 my_dict={1:"one,two",2:"three,four"} 我想用my_dict keys()替换df.A 我想要的输出是 A B 1 six 1 seven 2 level ..

发布时间：2020-05-24 03:54:59 python pandas dataframe data-analysis Python

匹配来自两个不同数据帧的键

我有两个数据框， df1, Name Stage Description key 0 Sri 1 Sri is one of the good singer in this two one 1 NaN 2 Thanks for reading ..

发布时间：2020-05-24 03:54:05 python pandas dataframe data-analysis Python

Python Pandas-如何格式化和拆分列中的文本?

我在如下所示的数据框中有一组字符串 ID TextColumn 1 This is line number one 2 I love pandas, they are so puffy 3 [This $tring is with specia| characters, yes it is!] A.我想格式化此字符串以消除所有特殊字符 B.格式化后，我想获得一个唯一单词的列表(空格是唯一 ..

发布时间：2020-05-24 03:39:31 python pandas text-mining data-analysis Python

在python中使用熊猫检索数据列上的匹配单词数

我有一个df， Name Description Ram Ram is one of the good cricketer Sri Sri is one of the member Kumar Kumar is a keeper 和一个列表， my_list = [“一个"，“好"，“拉维"，“球"] 我正在尝试从my_list中获取具有至少一个关键字的行 ..

发布时间：2020-05-24 03:37:36 python pandas dataframe data-analysis Python

如何从熊猫数据框中提取列表或字典中的非NA值

我有这样的df， df AAA BBB CCC 0 4 10 100 1 5 20 50 2 6 30 -30 3 7 40 -50 df_mask = pd.DataFrame({'AAA' : [True] * 4, 'BBB' : [False] * 4,'CCC' : [True,False] * 2}) 而df.where( ..

发布时间：2020-05-24 03:36:34 python pandas dataframe data-analysis Python

使用ggplot和pandas在Python中绘制事件密度

我正在尝试可视化这种形式的数据: timestamp senderId 0 735217 106758968942084595234 1 735217 114647222927547413607 2 735217 106758968942084595234 3 735217 106758968942084595234 4 ..

发布时间：2020-05-24 03:28:42 python pandas data-analysis python-ggplot Python

将日期时间对象按小时排序到Pandas数据框，然后使用Matplotlib可视化为直方图

我需要按小时将观看者分类为直方图.我有一些使用Matplotlib进行操作的经验，但是我找不到按小时对日期进行排序最实用的方法. 首先，我从JSON文件中读取数据，然后将两种相关的数据类型存储在pandas Dataframe中，如下所示: data = pd.read_json('data/data.json') session_duration = pd.to_datetime( ..

发布时间：2020-05-24 03:21:09 python pandas matplotlib data-science data-analysis Python

熊猫-Groupby并创建新的DataFrame?

这是我的情况- In[1]: data Out[1]: Item Type 0 Orange Edible, Fruit 1 Banana Edible, Fruit 2 Tomato Edible, Vegetable 3 Laptop Non Edible, Electroni ..

发布时间：2020-05-24 03:15:16 python pandas grouping data-analysis Python

pandas.DF()中的列是否单调增加?

我可以使用is_monotonic方法检查pandas.DataFrame()的索引是否单调增加.但是，我想检查列值之一是否严格增加value(float/integer)? In [13]: my_df = pd.DataFrame([1,2,3,5,7,6,9]) In [14]: my_df Out[14]: 0 0 1 1 2 2 3 3 5 4 7 5 6 6 ..

发布时间：2020-05-24 03:10:20 python pandas data-analysis Python

熊猫:将datetime时间戳转换为白天还是晚上?

我正在尝试根据时间戳列表确定白天还是黑夜.如果我仅检查7:00 AM到6:00 PM之间的时间以将其分类为“白天"，否则将其分类为“夜晚"，是否正确?就像我在下面的代码中所做的一样.我不确定这一点，因为有时甚至是下午6点以后的一天，所以使用python区分白天还是晚上的准确方法是什么? sample data: (timezone= utc/zulutime) timestamps ..

发布时间：2020-05-24 03:08:29 python pandas data-analysis python-datetime Python

直方图与python拟合

我一直在冲浪，但是没有找到执行以下操作的正确方法. 我用matplotlib完成了直方图: hist, bins, patches = plt.hist(distance, bins=100, normed='True') 从图中可以看出，分布或多或少是指数分布(泊松分布).考虑到我的hist和bins数组，如何做最合适的? 更新我正在使用以下方法: x = n ..

发布时间：2020-05-24 02:56:14 python pandas matplotlib scipy data-analysis Python

data-analysis相关内容