沙盒

此沙盒包含由於各種原因尚未準備好納入 statsmodels 本身的程式碼。它包含來自舊 stats.models 程式碼的模組,這些模組尚未經過測試、驗證和更新以符合新的 statsmodels 結構:Cox 生存模型、具有重複測量的混合效應模型、廣義加性模型和公式框架。沙盒還包含目前正在開發的程式碼,直到它符合 statsmodels 的模式或經過充分測試為止。

所有沙盒模組都必須明確匯入,以表明它們尚未成為 statsmodels 核心的一部分。沙盒程式碼的品質和測試差異很大。

範例

sandbox.examples 資料夾中有一些範例。其他範例直接包含在模組中以及沙盒的子資料夾中。

模組參考

時間序列分析 tsa

在這部分中,我們開發對時間序列分析有用的模型和函數。大多數模型和函數已移至 statsmodels.tsa

移動視窗統計

大多數移動視窗統計,如滾動平均值、動差(最高 4 階)、最小值、最大值、平均值和變異數,都涵蓋在 Pandas 中 移動(滾動)統計/動差 的函數中。

movstat.movorder(x[, order, windsize, lag])

移動順序統計

movstat.movmean(x[, windowsize, lag])

移動視窗平均值

movstat.movvar(x[, windowsize, lag])

移動視窗變異數

movstat.movmoment(x, k[, windowsize, lag])

非中心動差

迴歸與變異數分析

以下兩個變異數分析函數已針對平衡單向變異數分析的 NIST 測試資料進行完整測試。anova_oneway 的模式與 scipy.stats 中的單向變異數分析函數相同,但對於尺度不良的問題具有更高的精確度。anova_ols 產生與單向變異數分析相同的結果,但使用 OLS 模型類別。它也針對 NIST 測試進行驗證,但在最差的尺度情況下會有一些問題。它顯示如何使用 statsmodels 在三行中執行簡單的變異數分析,並且最好也將其視為一個配方。

anova_oneway(y, x[, seq])

anova_ols(y, x)

以下是使用虛擬變數和使用 OLS 產生變異數分析結果的輔助函數。由於它們是為特定的用途而編寫的,因此最好將它們視為配方。這些函數最終將被重寫或重新組織。

try_ols_anova.data2dummy(x[, returnall])

將類別陣列轉換為虛擬變數,預設會刪除最後一個類別的虛擬變數,僅使用 ravel,僅限 1 維

try_ols_anova.data2groupcont(x1, x2)

建立虛擬連續變數

try_ols_anova.data2proddummy(x)

從二維陣列的 2 個欄位建立乘積虛擬變數

try_ols_anova.dropname(ss, li)

從字串清單中刪除名稱,要刪除的名稱位於以空格分隔的清單中,不會變更原始清單

try_ols_anova.form2design(ss, data)

將字串公式轉換為資料字典

以下是群組統計的輔助函數,其中群組由標籤陣列定義。先前群組的限定註解也適用於此群組函數。

try_catdata.cat2dummy(y[, nonseq])

try_catdata.convertlabels(ys[, indices])

將基於多個變數或字串標籤的標籤轉換為唯一的索引標籤 0,1,2,...,nk-1,其中 nk 是不同標籤的數量

try_catdata.groupsstats_1d(y, x, labelsunique)

使用 ndimage 獲取快速平均值和變異數

try_catdata.groupsstats_dummy(y, x[, nonseq])

try_catdata.groupstatsbin(factors, values)

使用 np.bincount,假設因子/標籤為整數

try_catdata.labelmeanfilter(y, x)

try_catdata.labelmeanfilter_nd(y, x)

try_catdata.labelmeanfilter_str(ys, x)

除了這些函數之外,sandbox 回歸仍然包含幾個範例,這些範例說明了 statsmodels 回歸模型的使用。

迴歸方程組與聯立方程組

以下用於擬合方程組模型。儘管返回的參數已驗證為準確,但此程式碼仍處於非常實驗性的階段,並且在將模型添加到主程式碼庫之前,模型的使用方式很可能會發生重大變化。

SUR(sys[, sigma, dfk])

表面不相關迴歸

Sem2SLS(sys[, indep_endog, instruments])

聯立方程組的兩階段最小平方法

雜項

描述性統計列印

descstats.sign_test(samp[, mu0])

符號檢定

descstats.descstats(data[, cols, axis])

列印一個或多個變數的描述性統計資料。

原始 stats.models

這些都沒有完全運作。cox 和 mixed 使用公式框架。

使用 EM 演算法的重複測量混合效應模型

statsmodels.sandbox.mixed

Cox 比例風險模型

statsmodels.sandbox.cox

廣義可加模型

statsmodels.sandbox.gam

公式

statsmodels.sandbox.formula


上次更新:2024 年 10 月 03 日