data-analysis相关内容

如何转换在SQL Server中编写的脚本以计算Postgresql的优势比?

在SQL Server中,我编写了以下脚本,以将测试组的概率除以对照组的概率来计算优势比。脚本如下: -从模型 中计算优势比,选择a.column1,a。 uvs作为testuvs。 b.uvs作为controluvs ,[odds] =当b.uvs> 0然后a.puvs / b.puvs时的情况,否则null结束 进入control_probabilties中的unique_visito ..
发布时间:2020-05-30 01:57:28 其他开发

PostgreSQL中使用R的非线性回归模型

背景 我有1900年至2009年之间加拿大全境的气候数据(温度,降水量,积雪深度)。我写了一个基本的网站,最简单的页面允许用户选择类别和城市。然后,他们返回一个非常简单的报告(没有参数和计算部分): Web应用程序的主要目的是提供一个简单的用户界面,以便公众可以有意义的方式浏览数据。 (数字列表对公众没有意义,也没有提供太少的网站许多输入。)该应用程序的第二个目的是为气候学家和其他科学 ..
发布时间:2020-05-29 22:11:25 其他开发

Python-将数据框内的数据取出到另一个单元中

这是具有14列的数据帧的单个单元格中的数据.单元格是列的元素.有45k +这种细胞,手动操作真是个地狱. 一个单元格数据 我想对此单元格做三件事: 将带有地址,状态,邮政编码的文本部分移动到另一列; 删除单元格的钩子(); 分开2列经度和纬度. 怎么可能? 解决方案 下面是一个简单有效的示例,其中包含2个数据点: text1 = """30881 EKLU ..
发布时间:2020-05-24 04:15:08 Python

熊猫计算每月平均值

我创建了以下数据框: availability = pd.DataFrame(propertyAvailableData).set_index("createdat") monthly_availability = availability.fillna(value=0).groupby(pd.TimeGrouper(freq='M')) 这给出了以下输出 ..
发布时间:2020-05-24 04:04:12 Python

将日期时间对象按小时排序到Pandas数据框,然后使用Matplotlib可视化为直方图

我需要按小时将观看者分类为直方图.我有一些使用Matplotlib进行操作的经验,但是我找不到按小时对日期进行排序最实用的方法. 首先,我从JSON文件中读取数据,然后将两种相关的数据类型存储在pandas Dataframe中,如下所示: data = pd.read_json('data/data.json') session_duration = pd.to_datetime( ..
发布时间:2020-05-24 03:21:09 Python

pandas.DF()中的列是否单调增加?

我可以使用is_monotonic方法检查pandas.DataFrame()的索引是否单调增加.但是,我想检查列值之一是否严格增加value(float/integer)? In [13]: my_df = pd.DataFrame([1,2,3,5,7,6,9]) In [14]: my_df Out[14]: 0 0 1 1 2 2 3 3 5 4 7 5 6 6 ..
发布时间:2020-05-24 03:10:20 Python

熊猫:将datetime时间戳转换为白天还是晚上?

我正在尝试根据时间戳列表确定白天还是黑夜.如果我仅检查7:00 AM到6:00 PM之间的时间以将其分类为“白天",否则将其分类为“夜晚",是否正确?就像我在下面的代码中所做的一样.我不确定这一点,因为有时甚至是下午6点以后的一天,所以使用python区分白天还是晚上的准确方法是什么? sample data: (timezone= utc/zulutime) timestamps ..
发布时间:2020-05-24 03:08:29 Python

直方图与python拟合

我一直在冲浪,但是没有找到执行以下操作的正确方法. 我用matplotlib完成了直方图: hist, bins, patches = plt.hist(distance, bins=100, normed='True') 从图中可以看出,分布或多或少是指数分布(泊松分布).考虑到我的hist和bins数组,如何做最合适的? 更新 我正在使用以下方法: x = n ..
发布时间:2020-05-24 02:56:14 Python