沙盒¶
此沙盒包含由於各種原因尚未準備好納入 statsmodels 本身的程式碼。它包含來自舊 stats.models 程式碼的模組,這些模組尚未經過測試、驗證和更新以符合新的 statsmodels 結構:Cox 生存模型、具有重複測量的混合效應模型、廣義加性模型和公式框架。沙盒還包含目前正在開發的程式碼,直到它符合 statsmodels 的模式或經過充分測試為止。
所有沙盒模組都必須明確匯入,以表明它們尚未成為 statsmodels 核心的一部分。沙盒程式碼的品質和測試差異很大。
範例¶
sandbox.examples 資料夾中有一些範例。其他範例直接包含在模組中以及沙盒的子資料夾中。
模組參考¶
時間序列分析 tsa
¶
在這部分中,我們開發對時間序列分析有用的模型和函數。大多數模型和函數已移至 statsmodels.tsa
。
移動視窗統計¶
大多數移動視窗統計,如滾動平均值、動差(最高 4 階)、最小值、最大值、平均值和變異數,都涵蓋在 Pandas 中 移動(滾動)統計/動差 的函數中。
|
移動順序統計 |
|
移動視窗平均值 |
|
移動視窗變異數 |
|
非中心動差 |
迴歸與變異數分析¶
以下兩個變異數分析函數已針對平衡單向變異數分析的 NIST 測試資料進行完整測試。anova_oneway
的模式與 scipy.stats 中的單向變異數分析函數相同,但對於尺度不良的問題具有更高的精確度。anova_ols
產生與單向變異數分析相同的結果,但使用 OLS 模型類別。它也針對 NIST 測試進行驗證,但在最差的尺度情況下會有一些問題。它顯示如何使用 statsmodels 在三行中執行簡單的變異數分析,並且最好也將其視為一個配方。
|
|
|
以下是使用虛擬變數和使用 OLS 產生變異數分析結果的輔助函數。由於它們是為特定的用途而編寫的,因此最好將它們視為配方。這些函數最終將被重寫或重新組織。
|
將類別陣列轉換為虛擬變數,預設會刪除最後一個類別的虛擬變數,僅使用 ravel,僅限 1 維 |
|
建立虛擬連續變數 |
從二維陣列的 2 個欄位建立乘積虛擬變數 |
|
|
從字串清單中刪除名稱,要刪除的名稱位於以空格分隔的清單中,不會變更原始清單 |
|
將字串公式轉換為資料字典 |
以下是群組統計的輔助函數,其中群組由標籤陣列定義。先前群組的限定註解也適用於此群組函數。
|
|
|
將基於多個變數或字串標籤的標籤轉換為唯一的索引標籤 0,1,2,...,nk-1,其中 nk 是不同標籤的數量 |
|
使用 ndimage 獲取快速平均值和變異數 |
|
|
|
使用 np.bincount,假設因子/標籤為整數 |
除了這些函數之外,sandbox 回歸仍然包含幾個範例,這些範例說明了 statsmodels 回歸模型的使用。
迴歸方程組與聯立方程組¶
以下用於擬合方程組模型。儘管返回的參數已驗證為準確,但此程式碼仍處於非常實驗性的階段,並且在將模型添加到主程式碼庫之前,模型的使用方式很可能會發生重大變化。
|
表面不相關迴歸 |
|
聯立方程組的兩階段最小平方法 |
雜項¶
描述性統計列印¶
|
符號檢定 |
|
列印一個或多個變數的描述性統計資料。 |
原始 stats.models¶
這些都沒有完全運作。cox 和 mixed 使用公式框架。
使用 EM 演算法的重複測量混合效應模型
statsmodels.sandbox.mixed
Cox 比例風險模型
statsmodels.sandbox.cox
廣義可加模型
statsmodels.sandbox.gam
公式
statsmodels.sandbox.formula