panel-data相关内容
我有一个8年来多家公司的面板数据集,我正在尝试使用具有行业特定影响的汇集OLS,并使用`reghdfe‘命令来控制类别变量(NAICS Industry Code)。 reghdfe DV IV control variables i.year, absorb(NAICS Industry Code) 这是使用该命令的正确方法吗?在变量中使用i.year正确吗?还是应该将其添加到吸收的变量中
..
我对下面显示的空间回归代码有一个问题(代码示例)。在运行回归后,我得到以下错误 Error in listw %*% as.matrix(ywithin) : Cholmod error 'X and/or Y have wrong dimensions' at file ../MatrixOps/cholmod_sdmult.c, line 90 当我从回归中删除空间维度时,回归
..
由于time变量(不平衡面板数据): ,我想合并不同长度的长格式数据帧: set.seed(63) #function to create a data frame that includes id, time and x func1
..
我的问题与现有关于this one等状态论的讨论密切相关。我想提出一个新的问题,因为我想看看更复杂的面板图案,而不是连续咒语的数量。 假设给定一组公司,我想查看该公司在购买一些land > 0房地产之前有多少年没有房地产land == 0。 或者,更复杂的是,公司的房地产低于某一水平的年限land
..
我从Stata迁移到R(plm package)是为了研究面板模型计量经济学。在STATA中,随机效果等面板模型通常会报告内部、之间和总体的R平方。 plm随机效应模型中报告的R平方对应于内部R平方。那么,有没有办法使用plm package中的plm package来得到总体的R平方和之间的R平方? 参见R和Stata的相同示例: library(plm) library(fore
..
我一直使用R的PLM程序包对面板数据进行分析。此包中用于在“固定效应”或“随机效应”模型之间进行选择的重要测试之一称为豪斯曼类型。类似的测试也适用于STATA。这里的要点是,STATA要求先估计固定效应,然后再估计随机效应。然而,我没有在“PLM”包中看到任何这样的限制。所以,我想知道“plm”包是否先有默认的“固定效果”,然后是“随机效果”。为了供您参考,我在下面提到了我在进行分析时遵循的Sta
..
我正在使用R中的plm包运行拼板数据回归,希望控制解释变量之间的多重共线性。 我知道vif()-包中有vif()函数,但据我所知,它不能处理拼板数据输出。 plm可以执行其他诊断,如单位根测试,但我找不到计算多重共线性的方法。 有没有办法计算与vif类似的测试,或者我可以只将每个变量视为一个时间序列,省略面板信息而使用car包运行测试? 我不能透露数据,但该问题应该与所有面板数据模
..
我正在寻找通过 t, t-1 等随时间t 的单个测量计算(自动)协方差矩阵的效率增益.> 在数据矩阵中,每一行代表一个人,每一列代表每月的测量值(列按时间顺序排列).类似于以下数据(尽管有更多的协方差). #模拟数据set.seed(1)周期 下面是我想出的(丑陋的)代码来获得测量/滞后测量的协方差矩阵.运行大约需要 4 秒.我确信通过移动到 data.table,多思考而不依赖循环,我可以
..
我想创建一个变量,其中包含一个组中前一年的变量值. id 日期值1 1 1992 4.12 1 不适用 4.53 1 1991 3.34 1 1990 5.35 1 1994 3.06 2 1992 3.27 2 1991 5.2 value_lagged 在组中缺少前一年时应该丢失 - 因为它是组中的第一个日期(如第 4、7 行),或者因为在数据(如第 5 行).此外,当缺少当前时间(如第
..
考虑以下使用 R 的测试数据集: testdat 前 4 个变量是我所拥有的,int 是我想要创建的变量.它类似于 treat 和 state 之间的交互,但会在第 8-10 行中包含 1,这是不希望的.本质上,我只希望在 treat 期间 state 发生变化时进行交互,否则不想要.关于如何创建此内容的任何想法(尤其是对于具有一百万个观测值的大规模数据集)? 编辑:为了澄清为什么我想要
..
我是 R 新用户.我有一个时间序列横截面数据集,虽然我已经找到了在 R 中滞后时间序列数据的方法,但我还没有找到创建滞后时间序列横截面变量的方法,以便我可以在我的分析中使用它们. 解决方案 以下是将 lag() 函数与 zoo(和面板系列数据)结合使用的方法: >图书馆(PLM)>图书馆(动物园)>数据(“产品")>dnow x.Date
..
我在 R 中有一个不平衡的面板数据集.以下将作为示例: dt dt命名年份1 一个 20012 一 20023 一个 20034 乙 20005 B 20026 C 20007 C 20018 C 2003 现
..
我使用面板数据:随着时间的推移,我观察了许多单位(例如人);对于每个单元,我都有相同固定时间间隔的记录. 在将数据拆分为训练集和测试集时,我们需要确保两个集是不相交的并且顺序,即训练集中的最新记录应该在测试中最早的记录之前设置(例如参见此博文). 是否有针对面板数据进行交叉验证的标准 Python 实现? 我试过 Scikit-Learn 的 TimeSeriesSplit,不能
..
是否可以使用具有二元因变量的面板数据集在 R 中进行回归?我熟悉将 glm 用于 logit 和 probit,将 plm 用于面板数据,但不确定如何将两者结合起来.是否有任何现有的代码示例? 编辑 如果我能弄清楚如何提取 plm() 在进行回归时使用的矩阵,也会很有帮助.例如,您可以使用 plm 来处理固定效应,或者您可以使用适当的虚拟变量创建一个矩阵,然后通过 glm() 运行它.
..
我正在使用 linearmodels 包来估计 Panel-OLS.举个例子: 将 numpy 导入为 np从 statsmodels.datasets 导入 grunfeld数据 = grunfeld.load_pandas().datadata.year = data.year.astype(np.int64)# MultiIndex, entity - 时间data = data.set_
..
我正在尝试执行差异中的差异(使用面板数据和固定效果)使用 Python 和 Pandas 进行分析.我没有经济学背景,我只是想过滤数据并运行我被告知的方法.但是,据我所知,我了解到基本的 diff-in-diffs 模型如下所示: 即,我正在处理一个多变量模型. 这里是一个简单的 R 示例: https:///thetarzan.wordpress.com/2011/06/20/
..
我正在尝试使用R估算面板数据的逻辑单元固定效应模型.我的因变量是二进制的,并且在两年中每天针对13个位置进行测量.该模型的目的是根据x预测特定日期和位置的y值. 零
..
我正在寻找反馈,以确定如何正确指定随机效应以说明重复测量设计中的相关性,但是具有多个相关性级别(包括每个预测变量组合的纵向数据 ).结果是二进制的,因此我将拟合逻辑混合模型.我打算使用 lme4 包中的 glmer()函数.如果您想知道这些数据是如何产生的,那么一个例子就是眼动仪:人们的眼睛被“跟踪"到了眼睛.持续30秒,例如在不同级别的预测器下,确定它们是否看着屏幕上的某个对象(因此产生二进制结
..
使用 summary时 函数在R中,我可以在那里传递一个选项以仅显示变量的子集吗? 在我的示例中,我进行了面板回归,我有几个解释变量,并且有许多虚拟变量,这些变量的系数我不想显示.我想有一种简单的方法可以做到这一点,但是在功能文档中找不到.谢谢 解决方案 它在文档中,但是您必须为 summary.plm print 方法>.参数是 subset .如以下示例所示使用它: 库(plm
..
我正在使用"plm"功能通过以下代码运行面板回归: test_reg = plm(y〜x1 + x2 + x3 + x4 * x7 + x5 * x7 + x6 * x7 + x8 + x9 + x10 + x11,DATA,index = c("year","id“),模型="内“)摘要(test_reg) 然后我得到以下错误: 名称错误(y)
..