廣義估計方程式

廣義估計方程式為面板資料、叢集資料或重複測量資料估計廣義線性模型,當觀察值在叢集內可能相關,但在叢集間不相關時。它支援與廣義線性模型 (GLM) 相同的單參數指數族估計。

請參閱模組參考以了解指令和引數。

範例

以下範例使用癲癇發作的資料,來說明在叢集內具有可交換相關性的 Poisson 迴歸。

In [1]: import statsmodels.api as sm

In [2]: import statsmodels.formula.api as smf

In [3]: data = sm.datasets.get_rdataset('epil', package='MASS').data

In [4]: fam = sm.families.Poisson()

In [5]: ind = sm.cov_struct.Exchangeable()

In [6]: mod = smf.gee("y ~ age + trt + base", "subject", data,
   ...:               cov_struct=ind, family=fam)
   ...: 

In [7]: res = mod.fit()

In [8]: print(res.summary())
                               GEE Regression Results                              
===================================================================================
Dep. Variable:                           y   No. Observations:                  236
Model:                                 GEE   No. clusters:                       59
Method:                        Generalized   Min. cluster size:                   4
                      Estimating Equations   Max. cluster size:                   4
Family:                            Poisson   Mean cluster size:                 4.0
Dependence structure:         Exchangeable   Num. iterations:                     2
Date:                     Thu, 03 Oct 2024   Scale:                           1.000
Covariance type:                    robust   Time:                         16:09:51
====================================================================================
                       coef    std err          z      P>|z|      [0.025      0.975]
------------------------------------------------------------------------------------
Intercept            0.5730      0.361      1.589      0.112      -0.134       1.280
trt[T.progabide]    -0.1519      0.171     -0.888      0.375      -0.487       0.183
age                  0.0223      0.011      1.960      0.050    2.11e-06       0.045
base                 0.0226      0.001     18.451      0.000       0.020       0.025
==============================================================================
Skew:                          3.7823   Kurtosis:                      28.6672
Centered skew:                 2.7597   Centered kurtosis:             21.9865
==============================================================================

在 Wiki 上可以找到數個 GEE 使用範例的筆記本:GEE 的 Wiki 筆記本

參考文獻

  • KY Liang 和 S Zeger。「使用廣義線性模型的縱向資料分析」。Biometrika (1986) 73 (1): 13-22。

  • S Zeger 和 KY Liang。「離散和連續結果的縱向資料分析」。Biometrics Vol. 42, No. 1 (Mar., 1986), pp. 121-130

  • A Rotnitzky 和 NP Jewell (1990)。「叢集相關資料的半參數廣義線性模型中,迴歸參數的假設檢定」,Biometrika, 77, 485-497。

  • Xu Guo 和 Wei Pan (2002)。「GEE 中分數檢定的小樣本效能」。http://www.sph.umn.edu/faculty1/wp-content/uploads/2012/11/rr2002-013.pdf

  • LA Mancl LA, TA DeRouen (2001)。一個具有改善小樣本特性的 GEE 共變異數估計值。Biometrics. 2001 Mar;57(1):126-34。

模組參考

模型類別

GEE(endog, exog, groups[, time, family, ...])

使用廣義估計方程式的邊際迴歸模型。

NominalGEE(endog, exog, groups[, time, ...])

使用 GEE 的名義反應邊際迴歸模型。

OrdinalGEE(endog, exog, groups[, time, ...])

使用 GEE 的序數反應邊際迴歸模型

QIF(endog, exog, groups[, family, ...])

使用二次推論函數 (QIF) 擬合迴歸模型。

結果類別

GEEResults(model, params, cov_params, scale)

此類別總結使用 GEE 的邊際迴歸模型擬合結果。

GEEMargins(results, args[, kwargs])

使用 GEE 擬合的迴歸模型之估計邊際效果。

QIFResults(model, params, cov_params, scale)

QIF 迴歸的結果類別

相依性結構

目前已實作的相依性結構如下

CovStruct([cov_nearest_method])

相關性和共變異數結構的基本類別。

Autoregressive([dist_func, grid])

一階自迴歸工作相依性結構。

可交換()

可交換工作相依性結構。

GlobalOddsRatio(endog_type)

估計具序數或名義資料之 GEE 的全域勝算比。

Independence([cov_nearest_method])

獨立工作相依性結構。

Nested([cov_nearest_method])

一種巢狀的工作相依結構。

分佈族群

分佈族群與 GLM 的相同,目前實作的有

Family(link, variance[, check_link])

單參數指數族群的父類別。

Binomial([link, check_link])

二項式指數族群分佈。

Gamma([link, check_link])

伽瑪指數族群分佈。

Gaussian([link, check_link])

高斯指數族群分佈。

InverseGaussian([link, check_link])

反高斯指數族群。

NegativeBinomial([link, alpha, check_link])

負二項式指數族群(對應於 NB2)。

Poisson([link, check_link])

泊松指數族群。

Tweedie([link, var_power, eql, check_link])

Tweedie 族群。

連結函數與 GLM 的相同,目前實作的有以下這些。並非所有連結函數都適用於每個分佈族群。可用的連結函數列表可以通過以下方式取得

>>> sm.families.family.<familyname>.links

連結()

單參數指數族群的通用連結函數。

CDFLink([dbn])

使用 scipy.stats 分佈的 CDF

CLogLog()

互補對數-對數轉換

Log()

對數轉換

Logit()

logit 轉換

NegativeBinomial([alpha])

負二項式連結函數

Power([power])

冪轉換

Cauchy()

柯西 (標準柯西 CDF) 轉換

Identity()

恆等轉換

InversePower()

逆轉換

InverseSquared()

逆平方轉換

Probit([dbn])

概率單位 (標準常態 CDF) 轉換


最後更新:2024 年 10 月 03 日