廣義估計方程式¶
廣義估計方程式為面板資料、叢集資料或重複測量資料估計廣義線性模型,當觀察值在叢集內可能相關,但在叢集間不相關時。它支援與廣義線性模型 (GLM) 相同的單參數指數族估計。
請參閱模組參考以了解指令和引數。
範例¶
以下範例使用癲癇發作的資料,來說明在叢集內具有可交換相關性的 Poisson 迴歸。
In [1]: import statsmodels.api as sm
In [2]: import statsmodels.formula.api as smf
In [3]: data = sm.datasets.get_rdataset('epil', package='MASS').data
In [4]: fam = sm.families.Poisson()
In [5]: ind = sm.cov_struct.Exchangeable()
In [6]: mod = smf.gee("y ~ age + trt + base", "subject", data,
...: cov_struct=ind, family=fam)
...:
In [7]: res = mod.fit()
In [8]: print(res.summary())
GEE Regression Results
===================================================================================
Dep. Variable: y No. Observations: 236
Model: GEE No. clusters: 59
Method: Generalized Min. cluster size: 4
Estimating Equations Max. cluster size: 4
Family: Poisson Mean cluster size: 4.0
Dependence structure: Exchangeable Num. iterations: 2
Date: Thu, 03 Oct 2024 Scale: 1.000
Covariance type: robust Time: 16:09:51
====================================================================================
coef std err z P>|z| [0.025 0.975]
------------------------------------------------------------------------------------
Intercept 0.5730 0.361 1.589 0.112 -0.134 1.280
trt[T.progabide] -0.1519 0.171 -0.888 0.375 -0.487 0.183
age 0.0223 0.011 1.960 0.050 2.11e-06 0.045
base 0.0226 0.001 18.451 0.000 0.020 0.025
==============================================================================
Skew: 3.7823 Kurtosis: 28.6672
Centered skew: 2.7597 Centered kurtosis: 21.9865
==============================================================================
在 Wiki 上可以找到數個 GEE 使用範例的筆記本:GEE 的 Wiki 筆記本
參考文獻¶
KY Liang 和 S Zeger。「使用廣義線性模型的縱向資料分析」。Biometrika (1986) 73 (1): 13-22。
S Zeger 和 KY Liang。「離散和連續結果的縱向資料分析」。Biometrics Vol. 42, No. 1 (Mar., 1986), pp. 121-130
A Rotnitzky 和 NP Jewell (1990)。「叢集相關資料的半參數廣義線性模型中,迴歸參數的假設檢定」,Biometrika, 77, 485-497。
Xu Guo 和 Wei Pan (2002)。「GEE 中分數檢定的小樣本效能」。http://www.sph.umn.edu/faculty1/wp-content/uploads/2012/11/rr2002-013.pdf
LA Mancl LA, TA DeRouen (2001)。一個具有改善小樣本特性的 GEE 共變異數估計值。Biometrics. 2001 Mar;57(1):126-34。
模組參考¶
模型類別¶
|
使用廣義估計方程式的邊際迴歸模型。 |
|
使用 GEE 的名義反應邊際迴歸模型。 |
|
使用 GEE 的序數反應邊際迴歸模型 |
|
使用二次推論函數 (QIF) 擬合迴歸模型。 |
結果類別¶
|
此類別總結使用 GEE 的邊際迴歸模型擬合結果。 |
|
使用 GEE 擬合的迴歸模型之估計邊際效果。 |
|
QIF 迴歸的結果類別 |
相依性結構¶
目前已實作的相依性結構如下
|
相關性和共變異數結構的基本類別。 |
|
一階自迴歸工作相依性結構。 |
|
可交換工作相依性結構。 |
|
估計具序數或名義資料之 GEE 的全域勝算比。 |
|
獨立工作相依性結構。 |
|
一種巢狀的工作相依結構。 |
分佈族群¶
分佈族群與 GLM 的相同,目前實作的有
|
單參數指數族群的父類別。 |
|
二項式指數族群分佈。 |
|
伽瑪指數族群分佈。 |
|
高斯指數族群分佈。 |
|
反高斯指數族群。 |
|
負二項式指數族群(對應於 NB2)。 |
|
泊松指數族群。 |
|
Tweedie 族群。 |
連結函數¶
連結函數與 GLM 的相同,目前實作的有以下這些。並非所有連結函數都適用於每個分佈族群。可用的連結函數列表可以通過以下方式取得
>>> sm.families.family.<familyname>.links
|
單參數指數族群的通用連結函數。 |
|
使用 scipy.stats 分佈的 CDF |
|
互補對數-對數轉換 |
|
對數轉換 |
|
logit 轉換 |
|
負二項式連結函數 |
|
冪轉換 |
|
柯西 (標準柯西 CDF) 轉換 |
|
恆等轉換 |
逆轉換 |
|
逆平方轉換 |
|
|
概率單位 (標準常態 CDF) 轉換 |