panel-data - IT屋-程序员软件开发技术分享社区

具有行业特定效果的池化OLS(Reghdfe)

我有一个8年来多家公司的面板数据集，我正在尝试使用具有行业特定影响的汇集OLS，并使用`reghdfe‘命令来控制类别变量(NAICS Industry Code)。 reghdfe DV IV control variables i.year, absorb(NAICS Industry Code) 这是使用该命令的正确方法吗？在变量中使用i.year正确吗？还是应该将其添加到吸收的变量中 ..

发布时间：2022-08-12 09:00:28 stata panel-data 其他开发

R中的空间面板回归：SPGM的误差

我对下面显示的空间回归代码有一个问题(代码示例)。在运行回归后，我得到以下错误 Error in listw %*% as.matrix(ywithin) : Cholmod error 'X and/or Y have wrong dimensions' at file ../MatrixOps/cholmod_sdmult.c, line 90 当我从回归中删除空间维度时，回归 ..

发布时间：2022-05-29 23:07:09 r spatial panel-data 其他开发

合并不同长度的长格式数据框并转换为宽格式

由于time变量(不平衡面板数据)：，我想合并不同长度的长格式数据帧： set.seed(63) #function to create a data frame that includes id, time and x func1 ..

发布时间：2022-05-07 16:41:45 r time-series data-manipulation data-cleaning panel-data 其他开发

如何确定(复杂的)面板图案？

我的问题与现有关于this one等状态论的讨论密切相关。我想提出一个新的问题，因为我想看看更复杂的面板图案，而不是连续咒语的数量。假设给定一组公司，我想查看该公司在购买一些land > 0房地产之前有多少年没有房地产land == 0。或者，更复杂的是，公司的房地产低于某一水平的年限land ..

发布时间：2022-04-11 21:15:23 stata panel-data 其他开发

在R中计算R内、R之间或整体R平方

我从Stata迁移到R(plm package)是为了研究面板模型计量经济学。在STATA中，随机效果等面板模型通常会报告内部、之间和总体的R平方。 plm随机效应模型中报告的R平方对应于内部R平方。那么，有没有办法使用plm package中的plm package来得到总体的R平方和之间的R平方？参见R和Stata的相同示例： library(plm) library(fore ..

发布时间：2022-04-11 19:53:17 r stata panel-data plm 其他开发

豪斯曼类型试验在R

我一直使用R的PLM程序包对面板数据进行分析。此包中用于在“固定效应”或“随机效应”模型之间进行选择的重要测试之一称为豪斯曼类型。类似的测试也适用于STATA。这里的要点是，STATA要求先估计固定效应，然后再估计随机效应。然而，我没有在“PLM”包中看到任何这样的限制。所以，我想知道“plm”包是否先有默认的“固定效果”，然后是“随机效果”。为了供您参考，我在下面提到了我在进行分析时遵循的Sta ..

发布时间：2022-04-11 19:48:30 r stata plm panel-data 其他开发

面板数据R中多重共线性的检验

我正在使用R中的plm包运行拼板数据回归，希望控制解释变量之间的多重共线性。我知道vif()-包中有vif()函数，但据我所知，它不能处理拼板数据输出。 plm可以执行其他诊断，如单位根测试，但我找不到计算多重共线性的方法。有没有办法计算与vif类似的测试，或者我可以只将每个变量视为一个时间序列，省略面板信息而使用car包运行测试？我不能透露数据，但该问题应该与所有面板数据模 ..

发布时间：2022-02-26 19:02:43 r regression plm panel-data 其他开发

R中var-covar矩阵的高效计算

我正在寻找通过 t, t-1 等随时间t 的单个测量计算(自动)协方差矩阵的效率增益.> 在数据矩阵中，每一行代表一个人，每一列代表每月的测量值(列按时间顺序排列).类似于以下数据(尽管有更多的协方差). #模拟数据set.seed(1)周期下面是我想出的(丑陋的)代码来获得测量/滞后测量的协方差矩阵.运行大约需要 4 秒.我确信通过移动到 data.table，多思考而不依赖循环，我可以 ..

发布时间：2022-01-07 23:34:27 r performance statistics data.table panel-data 其他开发

在 R 中的不平衡面板数据中创建滞后变量

我想创建一个变量，其中包含一个组中前一年的变量值. id 日期值1 1 1992 4.12 1 不适用 4.53 1 1991 3.34 1 1990 5.35 1 1994 3.06 2 1992 3.27 2 1991 5.2 value_lagged 在组中缺少前一年时应该丢失 - 因为它是组中的第一个日期(如第 4、7 行)，或者因为在数据(如第 5 行).此外，当缺少当前时间(如第 ..

发布时间：2021-12-23 12:35:09 r data.table dplyr panel-data 其他开发

如何在 R 中创建这个变量?

考虑以下使用 R 的测试数据集: testdat 前 4 个变量是我所拥有的，int 是我想要创建的变量.它类似于 treat 和 state 之间的交互，但会在第 8-10 行中包含 1，这是不希望的.本质上，我只希望在 treat 期间 state 发生变化时进行交互，否则不想要.关于如何创建此内容的任何想法(尤其是对于具有一百万个观测值的大规模数据集)? 编辑:为了澄清为什么我想要 ..

发布时间：2021-09-16 18:46:47 r variables panel-data 其他开发

在 R 中生成滞后时间序列横截面变量

我是 R 新用户.我有一个时间序列横截面数据集，虽然我已经找到了在 R 中滞后时间序列数据的方法，但我还没有找到创建滞后时间序列横截面变量的方法，以便我可以在我的分析中使用它们. 解决方案以下是将 lag() 函数与 zoo(和面板系列数据)结合使用的方法: >图书馆(PLM)>图书馆(动物园)>数据(“产品")>dnow x.Date ..

发布时间：2021-09-07 20:32:10 r time-series panel-data plm 其他开发

子集一个不平衡的面板数据集在 R 中至少有 2 个连续观察

我在 R 中有一个不平衡的面板数据集.以下将作为示例: dt dt命名年份1 一个 20012 一 20023 一个 20034 乙 20005 B 20026 C 20007 C 20018 C 2003 现 ..

发布时间：2021-09-01 18:34:55 r subset panel-data 其他开发

分组时间序列(面板)数据的交叉验证

我使用面板数据:随着时间的推移，我观察了许多单位(例如人)；对于每个单元，我都有相同固定时间间隔的记录. 在将数据拆分为训练集和测试集时，我们需要确保两个集是不相交的并且顺序，即训练集中的最新记录应该在测试中最早的记录之前设置(例如参见此博文). 是否有针对面板数据进行交叉验证的标准 Python 实现? 我试过 Scikit-Learn 的 TimeSeriesSplit，不能 ..

发布时间：2021-07-16 20:04:50 python-3.x scikit-learn time-series cross-validation panel-data 其他开发

R中具有二元因变量的面板数据

是否可以使用具有二元因变量的面板数据集在 R 中进行回归?我熟悉将 glm 用于 logit 和 probit，将 plm 用于面板数据，但不确定如何将两者结合起来.是否有任何现有的代码示例? 编辑如果我能弄清楚如何提取 plm() 在进行回归时使用的矩阵，也会很有帮助.例如，您可以使用 plm 来处理固定效应，或者您可以使用适当的虚拟变量创建一个矩阵，然后通过 glm() 运行它. ..

发布时间：2021-07-07 18:50:29 r regression panel-data plm 其他开发

线性模型面板OLS:带星星的回归输出

我正在使用 linearmodels 包来估计 Panel-OLS.举个例子: 将 numpy 导入为 np从 statsmodels.datasets 导入 grunfeld数据 = grunfeld.load_pandas().datadata.year = data.year.astype(np.int64)# MultiIndex, entity - 时间data = data.set_ ..

发布时间：2021-07-07 18:50:12 python python-3.x regression panel-data linearmodels Python

Python + Pandas 的差异

我正在尝试执行差异中的差异(使用面板数据和固定效果)使用 Python 和 Pandas 进行分析.我没有经济学背景，我只是想过滤数据并运行我被告知的方法.但是，据我所知，我了解到基本的 diff-in-diffs 模型如下所示: 即，我正在处理一个多变量模型. 这里是一个简单的 R 示例: https:///thetarzan.wordpress.com/2011/06/20/ ..

发布时间：2021-06-13 20:30:51 python pandas regression least-squares panel-data Python

R中的逻辑单元固定效应模型

我正在尝试使用R估算面板数据的逻辑单元固定效应模型.我的因变量是二进制的，并且在两年中每天针对13个位置进行测量.该模型的目的是根据x预测特定日期和位置的y值. 零 ..

发布时间：2021-05-30 20:55:23 r logistic-regression panel-data 其他开发

在R:lme4 :: glmer中为逻辑混合模型中的重复测量指定随机效应

我正在寻找反馈，以确定如何正确指定随机效应以说明重复测量设计中的相关性，但是具有多个相关性级别(包括每个预测变量组合的纵向数据 ).结果是二进制的，因此我将拟合逻辑混合模型.我打算使用 lme4 包中的 glmer()函数.如果您想知道这些数据是如何产生的，那么一个例子就是眼动仪:人们的眼睛被“跟踪"到了眼睛.持续30秒，例如在不同级别的预测器下，确定它们是否看着屏幕上的某个对象(因此产生二进制结 ..

发布时间：2021-05-30 19:43:12 r logistic-regression lme4 mixed-models panel-data 其他开发

在R摘要中获取变量的子集

使用 summary时函数在R中，我可以在那里传递一个选项以仅显示变量的子集吗? 在我的示例中，我进行了面板回归，我有几个解释变量，并且有许多虚拟变量，这些变量的系数我不想显示.我想有一种简单的方法可以做到这一点，但是在功能文档中找不到.谢谢解决方案它在文档中，但是您必须为 summary.plm print 方法>.参数是 subset .如以下示例所示使用它: 库(plm ..

发布时间：2021-05-29 21:01:42 r linear-regression summary panel-data plm 其他开发

plm函数错误:“名称"属性[343]的长度必须与向量[0]的长度相同

我正在使用"plm"功能通过以下代码运行面板回归: test_reg = plm(y〜x1 + x2 + x3 + x4 * x7 + x5 * x7 + x6 * x7 + x8 + x9 + x10 + x11，DATA，index = c("year"，"id“)，模型="内“)摘要(test_reg) 然后我得到以下错误: 名称错误(y) ..

发布时间：2021-05-04 20:46:10 r error-handling regression panel-data 其他开发

panel-data相关内容