卡方適合度檢定計算機(χ² Goodness of Fit)
卡方適合度檢定(χ² Goodness of Fit Test)由 Pearson (1900) 提出,係檢驗觀察類別分佈係咪同預設理論分佈相符嘅標準工具。χ² = Σ (O_i − E_i)² / E_i;自由度 df = 類別數 − 1 − 已估計參數數 k。本工具支援均勻、比例同直接期望次數三種輸入模式,並按 Cochran 規則自動提示低期望值警告。
Presets
Check inputs: observed counts must be ≥ 2 non-negative numbers; expected (if given) must match observed in length.
Results
χ² statistic
—
Degrees of freedom
—
p-value
—
Conclusion (upper-tail test)
—
| # | Observed O | Expected E | (O−E)² / E |
|---|
Pearson χ² upper-tail test; p-value via P(χ²_df > statistic). Approximation improves with larger expected counts (Cochran: each cell ≥ 5).
Formula
χ² = Σ_i (O_i − E_i)² / E_i;df = k − 1 − (已估計參數);p 值 = P(χ²_df > 觀察 χ²)(regularized incomplete gamma 計算)
- · 原假設 H₀:觀察分佈同理論分佈一致。p < α 拒絕 H₀(觀察顯著偏離理論);p ≥ α 不拒絕(觀察符合理論)。
- · Cochran (1954) 規則:每個期望次數 E_i ≥ 5 時 χ² 近似最可靠。如有 E_i < 5,建議:(1) 合併稀疏類別;(2) 用 Fisher 精確檢定(小樣本 2×2);(3) 用 Monte-Carlo / permutation 模擬抽樣分佈。
- · df 嘅扣減:純 goodness-of-fit k=0;擬合 Poisson 速率 k=1;擬合 Normal(μ, σ) k=2。擬合多嘅參數 = df 越少 = 同樣 χ² 對應 p 值越大(更難拒絕)。
- · Mendel (1866) 豌豆 9:3:3:1 經典案例:observed = (315, 108, 101, 32) on n = 556,χ² ≈ 0.470、df = 3、p ≈ 0.925 — 強烈支持遺傳比例假設。Fisher (1936) 後來質疑 Mendel 數據「過於完美」(p 值集中喺 0.95+ 異乎尋常)— 但呢個係資料蒐集疑問,唔影響 χ² 檢定方法本身。
- · 同 z 檢定 / t 檢定唔同:卡方檢定處理「類別計數」而非「連續測量值」。如果你想比較兩個比例(例如 A 組 click rate 52 % vs B 組 48 %),可以用:(1) 卡方 2×2(呢個工具)、(2) z 檢定 for two proportions、(3) Fisher 精確檢定。三者大樣本下結論一致;小樣本選 Fisher。
- · p 值由本工具用 regularized upper incomplete gamma function Q(df/2, χ²/2) 計算(Numerical Recipes 第 3 版 §6.2),準確度遠超統計實務需要(< 1e-12 across df ≥ 1)。
- · 參考:Pearson (1900) Philosophical Magazine 50;Cochran (1954) Biometrics 10(4);Mendel (1866) Versuche über Pflanzenhybriden;Numerical Recipes 3rd ed., §6.2。
Frequently asked
幾時用單尾、幾時用雙尾?
χ² 適合度檢定本身永遠係「上尾測試」(upper-tail),p 值 = P(χ²_df > 觀察值)。原因:χ² 統計量永遠 ≥ 0,越大代表偏離理論越多。喺零假設下,χ² 集中喺細嘅一邊(接近 df),所以「太大」就拒絕。「雙尾」概念對 χ² 適合度檢定唔適用,因為冇方向性 — 偏離本身唔分「太多」定「太少」,只係「偏離」。但如果你做 χ² test for variance(H₀: σ² = σ₀²),呢個係 separate test、屬於雙尾,要分別計上尾同下尾兩個 p 值。本工具係 goodness-of-fit 版本,預設上尾。
期望值 E_i < 5 真係咁嚴重嗎?我嘅樣本就係細。
Cochran (1954) 規則並唔係硬性禁止,而係「卡方近似失準」嘅提醒。實證研究(如 Hutchinson 1979、Slakter 1965)顯示:(1) 全部 E_i ≥ 5:χ² 近似同精確抽樣分佈非常吻合,p 值幾乎冇偏差;(2) 部分 E_i 喺 1–5:p 值偏差小,可接受但保留 ~10% 不確定性;(3) 多個 E_i < 1:偏差顯著,p 值可能高估 / 低估幾倍,唔可靠。實務應對:(1) 合併稀疏類別至每組 ≥ 5;(2) 用 Fisher 精確(特別係 2×2 表)— R 嘅 chisq.test() 預設用 Monte-Carlo 模擬 + 警告;(3) Yates 連續性校正(2×2 表,每格細時)— 但會過度保守。對於日常 A/B 測試 n > 500,呢個規則通常自動滿足,唔需擔心。
卡方檢定 vs G 檢定 / Likelihood Ratio Test 點選?
兩者大樣本下答案幾乎一樣,但 G = 2 · Σ O_i · ln(O_i / E_i) 嘅理論基礎係 likelihood ratio,喺現代統計裡較受推薦(Sokal & Rohlf《Biometry》第 4 版傾向 G)。實務區別:(1) χ² 接受度更廣,CFA / 醫學期刊 / SPSS 預設皆用 χ²;(2) G 同 likelihood / information theory 框架(如 AIC、BIC、Mutual Information)數學上更一致 — 學機器學習 / 資訊論常見;(3) 兩者喺低期望值時都失準,但 G 可加 Williams 校正令小樣本表現好啲;(4) 計算上 G 對 O_i = 0 嘅處理需要 0·ln(0) = 0 嘅約定,χ² 較簡單。建議:報告同行常用 χ²;嚴謹學術研究額外列 G 值;機器學習 / 資訊論場景用 G(同 KL divergence 同形式)。
Related tools
百分比計算機
百分比、加減百分比、變化率三合一。
最大公因數/最小公倍數計算機
輸入 2 至 6 個正整數,即時得出最大公因數(HCF/GCD)同最小公倍數(LCM),並列出輾轉相除法步驟。
平均數計算機(平均/中位/眾數)
輸入一組數字,同時計到平均數、中位數、眾數、極差,連同標準差、方差同總和。
一元二次方程式解算機
輸入 ax² + bx + c = 0 嘅三個係數,即時得到實根或複根、判別式同頂點。
密碼強度(位元熵)計算機
輸入密碼,估算位元熵、暴力破解所需時間同強度等級。所有計算喺瀏覽器內完成。
科學記號 ↔ 十進制轉換
輸入十進制數字或者科學記號,得到對方表示方式同有效數字、數量級等資訊。
排列組合(nPr / nCr)計算機
計排列 P(n,r)、組合 C(n,r) 同階乘 n!,常用於概率、抽獎、密碼組合題目。
標準差/方差計算機
輸入一組數字,計平均值、中位數、樣本/總體方差同標準差,附逐步公式。
三角形計算機(SSS / SAS / ASA)
由 3 邊、2 邊 1 角或 2 角 1 邊解三角形其餘部分、面積同周長(正/餘弦定律)。
畢氏定理計算機
已知直角三角形任意兩邊(兩條直角邊或一條直角邊加斜邊),即時求第三邊、面積、周長同兩個非直角嘅角度。
圓形計算機(半徑/直徑/周長/面積)
輸入半徑、直徑、周長或面積任一個,即時計另外三個 — 設計、工程、家居皆用得着。
羅馬數字轉換器
阿拉伯數字(1–3999)與羅馬數字 (I, V, X, L, C, D, M) 雙向換算 — 適用於排版、書名章節、考試補習。
直線斜率與方程計算機(由兩點求 y = mx + b)
輸入兩個點 (x₁, y₁) 同 (x₂, y₂),即時計斜率、y 截距、直線方程、兩點距離同中點 — 初中、高中數學常用。
生日悖論計算機
輸入人數 n,即時計算房間入面至少兩人同一個生日嘅機率 — 經典生日問題。
對數計算機(log / ln / log₂ / 任意底)
計算 logₐ(x) — 自動顯示自然對數 ln、常用對數 log₁₀、二進對數 log₂ 同自訂底,並列出換底公式步驟。
Z 分數(標準分)計算機
輸入觀測值、平均數同標準差,計 Z 分數同對應嘅常態分布百分位/概率。
螢幕像素密度(PPI)計算機
輸入解析度同對角線吋數,計螢幕嘅像素密度(PPI)、實際闊/高、點距同總像素。
香港六合彩中獎機率計算機
輸入注數同揀號方式(單式/複式/膽拖),計到頭獎、二獎到安慰獎嘅實際中獎機率。
小數轉分數計算機
輸入小數(包括循環小數),即刻轉換做最簡分數同混合分數。
球體體積與表面積計算機
輸入球體嘅半徑、直徑、表面積或者體積,即刻計返其餘三個量,加埋大圓周長同大圓面積。
圓柱體積與表面積計算機
輸入半徑同高,計算圓柱體體積 (π r²h)、側面積、底面積同總表面積。
排列 nPr 計算機
輸入 n 同 r,計算 nPr(有順序揀 r 個項目嘅排列數),同 n! / r! 比較。
質因數分解計算機
輸入任何 2 至 10¹² 嘅正整數,即時分解成質因數連乘式,並列出所有正因數同因數和。
幾何平均數計算機
輸入一組正數,計算幾何平均(n 個數之積開 n 次方),同對應嘅算術平均一齊比較 — 適合年化回報率、成長率同比率。
費氏數列計算機(第 n 項)
輸入 0 至 1500 嘅整數 n,即時用 BigInt 計到 F(n)、F(n−1)、相鄰比例(收斂到黃金比例 φ),同前 30 項完整序列。
骰子點數機率計算機
揀骰子數量、骰面(d4/d6/d8/d10/d12/d20)同目標點數,計算掟到該總和、最少/最多嘅機率。
等差數列計算機
輸入首項 a、公差 d 同項數 n,計算第 n 項 aₙ 同前 n 項總和 Sₙ = n/2·(2a + (n − 1)d)。
抽樣調查樣本數計算機
輸入信心水平、誤差範圍同預期比例(可選母體大小),計算問卷調查所需樣本數。
等比數列求和計算機
輸入首項 a、公比 r 同項數 n,計算等比數列前 n 項之和;公比小於 1 時亦可計算無限項之和。
圓錐體積與表面積計算機
輸入底半徑與高度,即時得出圓錐體積、斜高、側面積、底面積、總表面積。
音名頻率計算機
輸入音名(C、C♯、D…)、八度同調音標準 A4 (預設 440 Hz),用 f = A4 × 2^((n − 69)/12) 算頻率 (Hz)、波長同 MIDI 編號。
線性插值計算機(內插/外推)
輸入兩個已知點 (x₁, y₁) 同 (x₂, y₂),再輸入目標 x,即時用 y = y₁ + (x − x₁)(y₂ − y₁)/(x₂ − x₁) 估算對應嘅 y;自動標示內插同外推。
梯形面積計算機
輸入梯形上底、下底同高度,即時計算面積、中位線同周長(已知斜邊或角度時)。
二項分布機率計算機
輸入試驗次數 n、單次成功機率 p 同想要嘅成功次數 k,計算 P(X = k)、P(X ≤ k)、P(X ≥ k) 同分布嘅平均、標準差。
皮爾遜相關係數計算機
貼上兩組數據(X 同 Y),計算皮爾遜相關係數 r、決定係數 r²、最佳擬合直線斜率同截距、樣本均值同標準差。
平均數信賴區間 (CI) 計算機
輸入樣本平均、樣本標準差、樣本大小同信心水平,用 t 或 z 分布計樣本平均數嘅信賴區間、誤差範圍同標準誤。
Cohen's d 效應值計算機
輸入兩組嘅平均數、標準差同樣本量,計算 Cohen's d 同 Hedges' g 效應值,並按 Cohen 1988 標準分類為極細/細/中/大效應。
取餘數(Modulo)計算機
輸入被除數 a 同除數 n,計算 a mod n 嘅商同餘數,並同時列出「向下取整」(floor,數學定義)、「向零取整」(trunc,C/JavaScript %)同「Euclidean」三種結果以揭示負數時嘅差別。
chmod 權限轉換器(八進制 ↔ rwx)
揀 user / group / other 嘅讀 / 寫 / 執行權限,即時得到八進制(如 755)同符號(如 rwxr-xr-x)兩種表示法。
向量大小與方向計算機(2D / 3D)
輸入 2D 或 3D 向量分量(x, y, z),計算向量大小、單位向量同方向角。
百分誤差計算機(Percent Error / Percent Difference)
輸入實驗值同理論值(accepted value),即時計算百分誤差、絕對誤差同帶符號嘅相對誤差;亦可切換到 percent difference 模式比較兩個冇真值參考嘅量度結果。
泊松分佈機率計算機
輸入平均事件率 λ 同事件數 k,計算 P(X = k)、P(X ≤ k)、P(X ≥ k)、平均值、變異數、標準差,用於排隊論、客服中心、罕見事件預測等場景。
貝氏定理機率計算機(Bayes’ Theorem)
輸入先驗機率 P(A)、靈敏度 P(B|A) 同假陽性率 P(B|¬A),由貝氏定理計算後驗機率 P(A|B),常用於醫療檢測、垃圾郵件偵測、AI 分類決策分析。
圓弧長度與扇形面積計算機
輸入圓嘅半徑同圓心角(度或弧度),計算對應嘅弧長 s = r·θ、扇形面積 A = ½·r²·θ 同弦長,適用於幾何作業、機械加工同建築佈局。
矩陣行列式計算機(2×2 同 3×3)
輸入 2×2 或 3×3 矩陣嘅每個元素,即時用 ad − bc 同沿首列展開(cofactor expansion)求行列式 det(A),並顯示矩陣可逆性同每步小行列式,方便溫線性代數。
向量點積(內積)計算機(2D / 3D)
輸入兩個 2D 或 3D 向量,即時計算點積、夾角、純量投影同向量投影,並提示是否正交、平行或反向。
餘弦相似度計算機(Cosine Similarity)
輸入兩個任意維度嘅數值向量,計算 cos θ = (a·b) / (|a|·|b|),並轉換為角度距離,廣泛用於 NLP、推薦系統、文件相似度評分。
對稱百分比差異計算機(Percent Difference)
輸入兩個數值,計算對稱百分比差異 |a − b| / ((|a| + |b|) / 2),同時對照常見嘅百分比變化 (b − a)/a,避免實驗報告同新聞數字溝亂。
向量叉積計算機(Cross Product, 3D)
輸入兩個三維向量 a、b,計算叉積 a × b、結果向量嘅長度(等於平行四邊形面積)同夾角 sin θ,廣泛用於物理力矩、計算幾何同 3D 圖形學。
兩點距離計算機(2D / 3D 歐氏距離)
輸入平面或空間中嘅兩個點座標,用歐氏距離公式 √Σ(Δᵢ)² 計算直線距離、各軸差值同中點,方便幾何作業、CAD 量度同 GIS 平面距離。
變異係數計算機(Coefficient of Variation, CV)
輸入一組數值,計算變異係數 CV = σ / μ × 100%(標準差除以均值),用嚟比較唔同單位或量級嘅資料離散程度,常見於實驗重複性同投資組合風險評估。
中位數同四分位數計算機(Median, Q1, Q3, IQR)
輸入一組數值,工具排序後計算中位數、第一/第三四分位數、四分位距 IQR 同 1.5×IQR 離群值界限(Tukey 法),係統計箱形圖嘅核心摘要。
調和平均數計算機(Harmonic Mean)
輸入一組正數,計算調和平均 HM = n / Σ(1/xᵢ) 同對應嘅算術/幾何平均,常用於平均速度、平均比率、平均 P/E 等「分母性質」嘅數據。
Shannon 熵計算機(資訊熵)
輸入一組類別嘅機率或頻次,計算 Shannon 熵 H = −Σ pᵢ log₂ pᵢ(bits)、最大可能熵同歸一化熵,用於資訊理論、機器學習決策樹同密碼分析。
正多邊形計算機(面積、內角、半徑)
輸入正 n 邊形嘅邊數 n 同邊長 s,工具一次計算內角、外角、內切圓半徑、外接圓半徑、面積同周長,覆蓋三角形、正方形、五邊形、六邊形以至高邊數。
卡塔蘭數計算機(Catalan Number Cₙ)
輸入 n,計算第 n 個卡塔蘭數 Cₙ = (2n)! / ((n+1)! · n!) — 計算機科學常用,數括號配對、二叉樹形狀、Dyck 路徑等組合問題嘅標準解。
RMSE / MAE 預測誤差計算機
輸入一組實際值同對應預測值,工具同時計算 MAE、MSE、RMSE、R² 同 MAPE,用於機器學習回歸評估、銷售預測同實驗對比,仲會講解三個指標嘅敏感度差異。
二元一次方程組求解(Cramer's Rule)
輸入 ax + by = e 同 cx + dy = f 嘅 6 個係數,工具用 Cramer 法則計算 x, y、行列式 D 同分類情況(唯一解 / 無解 / 無窮多解),同步顯示步驟方便檢查作業。
至少一次機率計算機(1 − (1 − p)ⁿ)
輸入單次事件機率 p 同重複次數 n,工具計算「至少出現一次」嘅機率 1 − (1 − p)ⁿ、預期次數 np,以及達到目標機率所需嘅試驗次數 — 適用於抽獎、Gacha、A/B 測試、安全冗餘設計。
期望值計算機(E[X] = Σ p·x)
輸入一組「結果值 x」同對應「機率 p」,工具計算離散隨機變量嘅期望值 E[X] = Σ p·x、方差 Var(X)、標準差 σ — 用於賭場、保險、投資決策、A/B 測試等概率問題嘅基礎指標。
誤差幅度計算機(民調 / 抽樣 Margin of Error)
輸入樣本量 n、樣本比例 p(或樣本標準差)同信心水平(90 / 95 / 99 %),工具計算誤差幅度 MOE = z·√(p(1−p)/n) 同對應信心區間 — 民調、A/B 測試、市場研究嘅核心統計量。
平均絕對偏差計算機(MAD)
輸入一組數字,工具計算平均絕對偏差(Mean Absolute Deviation, MAD)= 平均(|xᵢ − x̄|) — 比標準差更直觀嘅離散度指標,常見於中學統計課同需求預測。