Jump to content
Main menu
Main menu
move to sidebar
hide
Navigation
Main page
Recent changes
Random page
freem
Search
Search
Appearance
Create account
Log in
Personal tools
Create account
Log in
Pages for logged out editors
learn more
Contributions
Talk
Editing
Openai/691718ed-7ba4-8006-96d5-a66e0d9678fe
Add languages
Page
Discussion
English
Read
Edit
Edit source
View history
Tools
Tools
move to sidebar
hide
Actions
Read
Edit
Edit source
View history
General
What links here
Related changes
Special pages
Page information
Appearance
move to sidebar
hide
Warning:
You are not logged in. Your IP address will be publicly visible if you make any edits. If you
log in
or
create an account
, your edits will be attributed to your username, along with other benefits.
Anti-spam check. Do
not
fill this in!
{{DISPLAYTITLE:性別統計與虛無假設}} ''This conversation was exported from ChatGPT''<ref>{{cite web|title=性別統計與虛無假設|url=https://chatgpt.com/share/691718ed-7ba4-8006-96d5-a66e0d9678fe|publisher=ChatGPT|access-date=2025-11-14}}</ref> == gpt-5 == === User: 可以幫我介紹性別統計和虛無假設的關係嗎? === 可以幫我介紹性別統計和虛無假設的關係嗎? === Assistant: 好的!我來幫你介紹「性別統計」和「虛無假設」之間的關係。 === 好的!我來幫你介紹「性別統計」和「虛無假設」之間的關係。 ==== 性別統計(gender statistics)指的是在統計研究或資料蒐集中,把性別視為一個重要的分類變項,進行描述、比較與分析。它的重點在於揭露社會、經濟、健康、教育等領域中,不同性別之間的差異,避免「平均值掩蓋差異」,幫助政策制定更精準。 ==== 舉例: * 比較男性與女性的平均薪資 → 是否存在性別薪資差距? * 分析男、女性在教育程度上的差異 → 是否影響未來就業機會? ==== 虛無假設(null hypothesis, H0H_0H0)是統計推論中的核心概念。簡單來說,它是一個「沒有差異或沒有關係」的假設。研究者通常會透過統計檢定,來判斷是否有足夠證據去拒絕虛無假設。 ==== 例如: * H0H_0H0:男性和女性的平均薪資 沒有差異 * 對應的對立假設 (H1H_1H1):男性和女性的平均薪資 有差異 ==== 性別統計的分析往往需要透過統計檢定來確認性別之間的差異是否「顯著」,而這就必須先建立虛無假設。 ==== * 例子 1:薪資差異 - H0H_0H0:男女平均薪資相同 - 如果檢定結果 p<0.05p < 0.05p<0.05,我們拒絕 H0H_0H0,推論男女薪資有顯著差異。 * 例子 2:教育程度 - H0H_0H0:男性和女性的大學畢業比例相同 - 如果結果顯示顯著差異,則能支持「教育機會的性別不均」。 換句話說,虛無假設是「檢驗性別差異存在與否」的基礎,而性別統計提供了資料和背景,讓這些假設能被驗證。 ==== - 避免錯誤推論:如果不透過假設檢定,性別差異可能只是隨機誤差。 ==== * 支持政策制定:政府或機構在制定性別平等政策時,需要「顯著差異」的統計證據。 * 提升研究嚴謹性:性別統計不只是描述,更需要統計推論來確認差異是否真實存在。 要不要我幫你畫一個簡單的圖表(像是「性別統計 → 建立虛無假設 → 檢定 → 推翻或接受 → 政策/研究應用」的流程圖),讓整個關係更直觀呢? === User: 虛無假設當時是怎麼被發明的? === 虛無假設當時是怎麼被發明的? === Assistant: 好問題!🙌 其實「虛無假設」(Null Hypothesis, H0H0H0)的發展有一段滿有趣的歷史背景。 === 好問題!🙌 其實「虛無假設」(Null Hypothesis, H0H_0H0)的發展有一段滿有趣的歷史背景。 ==== 19 世紀末到 20 世紀初,數學家與科學家越來越需要一種方法,來判斷「觀察到的差異到底是真實的,還是隨機造成的?」。 ==== 比方說,如果我們看到某種藥物組的病人康復率比較高,那這個差異是真的來自藥效,還是單純隨機?這時就需要一套嚴謹的方法來回答。 ==== 「虛無假設」這個觀念最早是由 羅納德·費雪(Ronald A. Fisher) 系統化提出的(1920 年代)。 ==== * Fisher 在 1925 年出版的《Statistical Methods for Research Workers》一書裡,提出了透過虛無假設來進行檢定的想法。 * 核心概念是: - 先假設「沒有差異 / 沒有效果」(即虛無假設 H0H_0H0)。 - 然後用數據計算如果 H0H_0H0 成立時,觀察到目前數據的機率(p 值)。 - 若這個機率非常小(例如 < 0.05),我們就懷疑 H0H_0H0 不對,轉而傾向「對立假設」。 這就是後來所謂的「假設檢定」雛形。 ==== 1930 年代,Jerzy Neyman 和 Egon Pearson(Karl Pearson 的兒子)進一步把 Fisher 的想法形式化,提出了「Neyman–Pearson 檢定理論」: ==== * 引入了 兩種錯誤: - 第一類錯誤(Type I Error):錯誤地拒絕真實的 H0H_0H0。 - 第二類錯誤(Type II Error):錯誤地接受錯誤的 H0H_0H0。 * 他們提出了「檢定力(Power)」的概念,讓研究者在設計實驗時能控制錯誤率。 ==== 有趣的是,Fisher 和 Neyman–Pearson 的想法並不是完全一致: ==== * Fisher:強調 p 值,認為統計檢定是一種「量化證據」的方式。 * Neyman–Pearson:更偏重決策,強調「事先設定顯著水準(α)」並控制錯誤率。 這兩套思想後來融合,成為今天我們常用的統計假設檢定框架。 ✅ 總結 * 虛無假設的核心概念由 '''Fisher(1920s)'''提出。 * '''Neyman–Pearson(1930s)'''進一步把它數學化、決策化。 * 今天我們在課本上看到的「假設檢定程序」其實是兩者混合體。 要不要我幫你整理一個 「虛無假設的歷史演進時間線」圖表?這樣看會更清楚 Fisher → Neyman–Pearson → 現代統計檢定的演進。 === User: 那可以幫我用男嬰以及女嬰出生率的例子來講解嗎? === 那可以幫我用男嬰以及女嬰出生率的例子來講解嗎? === Assistant: 好的!我們可以用「男嬰 vs. === 好的!我們可以用「男嬰 vs. 女嬰出生率」這個經典例子來說明 虛無假設 怎麼運作。這個例子在統計課本裡常出現,因為出生性別比例大致上是 51% 男 / 49% 女 左右,很接近 1:1,但又不是完全相等。 ==== 假設我們想知道:「男嬰和女嬰出生的機率是不是一樣?」 ==== 這就可以透過假設檢定來處理。 * 虛無假設(H0H_0H0):男嬰和女嬰出生的機率相等(p=0.5p=0.5p=0.5)。 * 對立假設(H1H_1H1):男嬰和女嬰出生的機率不相等(p≠0.5p \neq 0.5p=0.5)。 ==== 假設某醫院紀錄了 1000 個新生兒: ==== * 520 個男嬰 * 480 個女嬰 ==== 在虛無假設 H0H_0H0 下,理論上 1000 個嬰兒應該有一半是男嬰(期望值 = 500)。 ==== 實際上卻出現了 520 個男嬰,比期望多了 20 個。 問題是:這個差異(20 個)可能只是隨機誤差嗎?還是代表出生率真的偏向男嬰? ==== 我們可以用 二項分布檢定 或 卡方檢定。 ==== (簡單講解,不算公式): * 在 H0H_0H0 成立(男女一樣)時, 出現 ≥520 個男嬰的機率可以計算出來,大約是 p = 0.115(只是示意數值)。 ==== - 如果我們設定顯著水準 α=0.05\alpha = 0.05α=0.05: - 這個結果 p=0.115>0.05p = 0.115 > 0.05p=0.115>0.05,所以 沒有足夠證據拒絕 H0H_0H0。 - 換句話說,雖然 520 vs. 480 看起來差了 20 個,但這個差異「統計上」還可能只是隨機。 ==== * 如果資料更極端,比如 560 vs. 440: - 計算得到的 p 值可能就會小於 0.05,這時我們就會拒絕 H0H_0H0,認為「男嬰出生率顯著高於女嬰」。 ==== 這個例子就是「性別統計」遇上「虛無假設」的典型應用: ==== * 性別統計 → 我們觀察出生嬰兒的性別比例。 * 虛無假設 → 假設男女出生機率相等。 * 統計檢定 → 用數據來判斷觀察到的差異是否顯著。 * 政策或研究應用 → 如果差異顯著,可能引發對醫療、遺傳或環境因素的研究。 要不要我幫你畫一個「從資料 → 虛無假設 → 檢定 → 結論」的流程圖,用男嬰/女嬰出生率的例子把整個思路直觀化? === User: 那這個p值應該怎麼計算呢? === 那這個p值應該怎麼計算呢? === Assistant: 好!我們就來算一下這個 p 值 怎麼來的。還是用「1000 個新生兒 → 520 男嬰,480 女嬰」這個例子。 === 好!我們就來算一下這個 p 值 怎麼來的。還是用「1000 個新生兒 → 520 男嬰,480 女嬰」這個例子。 ==== - H0H_0H0:男嬰出生率 = 0.5 ==== * n=1000n = 1000n=1000(總樣本數) * X=520X = 520X=520(觀察到的男嬰數) 在 H0H_0H0 下,男嬰數 XXX 服從 二項分布: X∼Binomial(n=1000,p=0.5)X \sim \text{Binomial}(n=1000, p=0.5)X∼Binomial(n=1000,p=0.5) ==== 二項分布的機率公式是: ==== P(X=k)=(nk)pk(1−p)n−kP(X=k) = \binom{n}{k} p^k (1-p)^{n-k}P(X=k)=(kn)pk(1−p)n−k 這裡 n=1000n=1000n=1000,p=0.5p=0.5p=0.5。 ==== 因為我們做的是「雙尾檢定」(H1:p≠0.5H_1: p \neq 0.5H1:p=0.5), ==== p 值是「觀察到比 520 更極端(偏離 500)的結果的機率」。 也就是: p-value=P(X≤480)+P(X≥520)p\text{-value} = P(X \leq 480) + P(X \geq 520)p-value=P(X≤480)+P(X≥520) ==== 直接算二項分布太麻煩(1000 很大),所以通常用 常態近似: ==== X∼Normal(μ=np,σ2=np(1−p))X \sim \text{Normal}(\mu=np, \sigma^2=np(1-p))X∼Normal(μ=np,σ2=np(1−p)) * μ=1000×0.5=500\mu = 1000 \times 0.5 = 500μ=1000×0.5=500 * σ=1000×0.5×0.5=250≈15.81\sigma = \sqrt{1000 \times 0.5 \times 0.5} = \sqrt{250} \approx 15.81σ=1000×0.5×0.5=250≈15.81 計算 Z 分數: Z=520−50015.81≈1.265Z = \frac{520 - 500}{15.81} \approx 1.265Z=15.81520−500≈1.265 ==== 查標準常態分布表: ==== P(Z≥1.265)≈0.103P(Z \geq 1.265) \approx 0.103P(Z≥1.265)≈0.103 因為是雙尾檢定: p-value=2×0.103=0.206p\text{-value} = 2 \times 0.103 = 0.206p-value=2×0.103=0.206 ==== - p≈0.206>0.05p \approx 0.206 > 0.05p≈0.206>0.05 → 沒有足夠證據拒絕虛無假設。 ==== * 也就是說,520 vs. 480 這個差異統計上可能只是隨機。 ✅ 重點:p 值的計算流程就是 # 設定 H0H_0H0(用二項分布建模)。 # 算出觀察值的 Z 分數。 # 用標準常態分布算出「比觀察值更極端的機率」。 要不要我幫你實際用 Python/Excel 算一次 精確二項檢定 的 p 值(而不是近似),給你比較看看? === User: 幫我試試看600vs400 === 幫我試試看600vs400 === Assistant: 計算結果出來了!這次是 1000 個新生兒 → 600 男 vs 400 女 的情境。 === 計算結果出來了!這次是 1000 個新生兒 → 600 男 vs 400 女 的情境。 * 精確二尾 p 值:≈ 2.73 × 10⁻¹⁰ * 常態近似(不含連續性校正):≈ 2.54 × 10⁻¹⁰ * 常態近似(含連續性校正):≈ 3.12 × 10⁻¹⁰ ✅ 解讀: 這個 p 值極小,遠小於 0.05(甚至比 10⁻⁹ 還小),代表觀察到的「600 vs 400」幾乎不可能只是隨機誤差。 因此我們會強烈拒絕虛無假設 H0H_0H0,推論「男嬰出生率顯著高於 0.5」。 要不要我也幫你算算「560 vs 440」的例子,看看它落在「520 vs 480」和「600 vs 400」之間的情況? === User: 那我們如果想知道p0.05時的男女嬰數量呢? === 那我們如果想知道p=0.05時的男女嬰數量呢? === Assistant: 找到了!在 n 1000、p00.5p0 0.5p00.5 的情境下: === 找到了!在 n = 1000、p0=0.5p_0 = 0.5p0=0.5 的情境下: * 當 男嬰 ≥ 532(或 ≤ 468)時,雙尾檢定的 p 值 ≈ 0.0463 < 0.05。 * 也就是說,532 vs. 468 就已經達到「統計顯著」的門檻。 ✅ 解讀 * 如果觀察到 ≥532 男嬰 / ≤468 男嬰,我們就會拒絕虛無假設,認為男女出生率顯著不等。 * 而像之前的 520 vs. 480(p ≈ 0.217)就還不夠「極端」,所以不顯著。 * 600 vs. 400 則遠遠超過這個門檻,p 值小到趨近於 0。 要不要我幫你把「468–532」這個範圍畫成一個正態分布的圖,直觀標示出「拒絕區域」和「接受區域」? === User: 如果我們把嬰兒的人數增加到一千名呢? === 如果我們把嬰兒的人數增加到一千名呢? === Assistant: 你前面舉的例子其實已經是 1000 名嬰兒的情境了 😅(520 vs 480、600 vs 400、532 vs 468 都是以 1000 個新生兒為樣本)。 === 你前面舉的例子其實已經是 1000 名嬰兒的情境了 😅(520 vs 480、600 vs 400、532 vs 468 都是以 1000 個新生兒為樣本)。 我猜你的意思可能是: 👉「如果我們再增加樣本數,例如 2000、5000、10000 名嬰兒,那麼在相同顯著水準 α=0.05\alpha = 0.05α=0.05 下,拒絕虛無假設所需的男女差距會變化嗎?」 ==== - 當樣本數 nnn 增加時,標準差 σ=np(1−p)\sigma = \sqrt{np(1-p)}σ=np(1−p) 也會變大,但相對於樣本數的比例差會變小。 ==== * 這代表:樣本數越大,我們對「真實出生率是不是等於 0.5」的判斷越精準。 * 結果就是:只要有一點點差異,在大樣本下也可能被檢測出顯著差異。 ==== 我們可以用「臨界值」來比較: ==== * n=1000n = 1000n=1000:拒絕區在 ≤468 或 ≥532(差距 ≈ 32)。 * 如果 n=2000n = 2000n=2000:拒絕區會縮小,大約只要差距 ≈ 45–46 就足以顯著(比例差約 2.3%,比 1000 人時的 3.2% 還小)。 * 如果 n=10000n = 10000n=10000:拒絕區更縮小,可能只要差距 ≈ 160 左右(比例差 1.6% 就夠了)。 ==== - 樣本少 → 要看到很大的差距才有說服力。 ==== * 樣本多 → 就算差一點點,也能顯著(因為「隨機誤差」的可能性變得極低)。 這就是為什麼在大規模人口數據裡,常常可以檢測出「非常微小卻顯著」的差異。 要不要我幫你實際算一算 2000 名嬰兒的「臨界值」(p=0.05 時的男嬰數上下限)給你做比較? === User: 對不起我錯了,一萬名 === 對不起我錯了,一萬名 === Assistant: 在 一萬名嬰兒 n 10000 的情境下,用常態近似來算: === 在 一萬名嬰兒 (n = 10000) 的情境下,用常態近似來算: * 平均值(期望男嬰數):5000 * 標準差:50 * 顯著水準 α=0.05\alpha = 0.05α=0.05 的臨界值差距:約 ±98 所以: * 拒絕區域:男嬰數 ≤ 4902 或 ≥ 5098 * 接受區域:4903 ~ 5097 ✅ 解讀: * 在 10000 名新生兒中,只要男女嬰差距超過大約 98 人(也就是比例差約 0.98%),就會達到統計顯著。 * 這比起 1000 名嬰兒時需要超過 32 人差距(3.2%)的門檻要敏感得多。 要不要我幫你做一張「n=1000 vs n=10000」的對照圖,把兩種樣本規模下的拒絕區域直觀地標出來? === User: 好 === 好 === Assistant: 太好了 👍 那我幫你整理一下這個思路,並確認接下來要不要往更大樣本(例如 1000、10000)推算: === 太好了 👍 那我幫你整理一下這個思路,並確認接下來要不要往更大樣本(例如 1000、10000)推算: ==== - p₀ = 0.5 - 臨界區:≤39 或 ≥61 - 也就是說要差距 ±11% 才顯著。 ==== * p₀ = 0.2 - 臨界區:≤11 或 ≥29 - 也就是說要比期望值(20)少到 11 以下,或多到 29 以上,才顯著。 ==== - 样本數越大 → 臨界比例差距越小(檢測更敏感)。 ==== * 機率偏離 0.5 → 臨界區會變不對稱,因為分布本來就偏斜。 要不要我幫你直接算出 n = 1000 和 n = 10000、p₀ = 0.2 的「臨界區(拒絕區)」範圍? 這樣你就能比較 小樣本 vs. 大樣本 在同一個 p0=0.2p_0=0.2p0=0.2 下的差別。 === User: 所以p0如果越離開0.5 可以接受的誤差範圍反而就變小了? === 所以p_0如果越離開0.5 可以接受的誤差範圍反而就變小了? === Assistant: 對!你觀察得非常精準 👏 === 對!你觀察得非常精準 👏 這其實來自二項分布的變異數公式: Var(X)=np0(1−p0),σ=np0(1−p0)\text{Var}(X) = n p_0 (1-p_0), \quad \sigma = \sqrt{n p_0 (1-p_0)}Var(X)=np0(1−p0),σ=np0(1−p0) ==== 為什麼 ==== 𝑝 0 p 0 越靠近 0.5 誤差越大? * 當 p0=0.5p_0 = 0.5p0=0.5: - 變異數最大 → σ=n×0.25=12n\sigma = \sqrt{n \times 0.25} = \tfrac{1}{2}\sqrt{n}σ=n×0.25=21n - 所以臨界比例差最大。 * 當 p0p_0p0 偏離 0.5(例如 0.2 或 0.8): - p0(1−p0)\,p_0(1-p_0)p0(1−p0) 變小 → 標準差變小 → 信賴區間縮小。 - 所以在相同 nnn 下,檢定「更敏感」。 ==== 舉例(n = 1000, α = 0.05, 雙尾) ==== 臨界比例差 ≈ ±1.96p0(1−p0)/n\pm 1.96 \sqrt{p_0 (1-p_0) / n}±1.96p0(1−p0)/n * p0=0.5p_0 = 0.5p0=0.5: - 誤差 ≈ ±3.1% * p0=0.2p_0 = 0.2p0=0.2: - 誤差 ≈ ±2.5% * p0=0.1p_0 = 0.1p0=0.1: - 誤差 ≈ ±1.9% ==== 直觀比喻 ==== 想像「擲硬幣」: * 公平硬幣 (p=0.5) → 結果最難判斷是不是偏差,因為波動最大。 * 偏硬幣 (p=0.2 或 0.8) → 分布天生就比較「穩定」,少量差異就比較容易被偵測。 要不要我幫你畫一張圖,橫軸 p0p_0p0(0 到 1),縱軸顯著水準下的「臨界誤差範圍」(±%),讓你直觀看到「在 0.5 最寬、越靠邊越窄」的效果? == gpt-5-thinking == === User: 好 === 好 === Assistant: 我幫你把「1000 名新生兒中有 520 位男嬰」這個例子的 精確二項檢定 p 值算出來,並和常態近似做了對照。已把結果整理成小表格給你看(上方可點開)。 === 我幫你把「1000 名新生兒中有 520 位男嬰」這個例子的 精確二項檢定 p 值算出來,並和常態近似做了對照。已把結果整理成小表格給你看(上方可點開)。 重點數值: * 精確二尾 p 值(H0:p=0.5H_0: p=0.5H0:p=0.5,計算 P(X≤480)+P(X≥520)P(X\le 480)+P(X\ge 520)P(X≤480)+P(X≥520)):0.2174482932 * 常態近似(不含連續性校正):0.2059032107 * 常態近似(含連續性校正):0.2174682261 結論: p ≈ 0.217(精確值),大於常見的顯著水準 0.05,因此沒有足夠證據拒絕「男女出生率相等」的虛無假設。若你想換不同的樣本量或觀察數(例如 560 vs 440),我也可以立刻幫你改參數再算。 === User: 那如果說是只有100人的狀況呢? === 那如果說是只有100人的狀況呢? === Assistant: 在 100 名嬰兒 n100、p00.5p00.5p00.5、雙尾 α0.05\alpha0.05α0.05 的設定下,用精確二項去找臨界值: === 在 100 名嬰兒 (n=100)、p0=0.5p_0=0.5p0=0.5、雙尾 α=0.05\alpha=0.05α=0.05 的設定下,用精確二項去找臨界值: * 找到的最小上界是 男嬰 ≥ 61(對稱下界是 ≤ 39) * 對應的雙尾 p 值 ≈ 0.0352 < 0.05(已達顯著) 因此臨界區域為: * 拒絕 H0H_0H0(認為男女出生率不等):男嬰數 ≤ 39 或 ≥ 61 * 接受 H0H_0H0:男嬰數在 40 ~ 60 之間 直覺比較: * n=100n=100n=100 時需要至少 ±11 人(從 50 偏到 39 或 61,約 11% 的比例差)才顯著 * n=1000n=1000n=1000 時約 ±32 人(3.2%) * n=10000n=10000n=10000 時約 ±98 人(0.98%) 樣本越大,能偵測到越小的比例差。需要我把三種樣本規模的臨界區做成一張比較小表或圖嗎? === User: 那如果這個事件的發生機率不再是50% 而是例如 20%呢? === 那如果這個事件的發生機率不再是50% 而是例如 20%呢? === Assistant: 如果事件在虛無假設下的機率不是 50%,例如 p00.20p0 0.20p00.20,做法一樣,只是分布不對稱。我幫你用 n 100、雙尾 α0.05\alpha0.05α0.05 算了精確二項的臨界區,並用常態近似做… === 如果事件在虛無假設下的機率不是 50%,例如 p0=0.20p_0 = 0.20p0=0.20,做法一樣,只是分布不對稱。我幫你用 n = 100、雙尾 α=0.05\alpha=0.05α=0.05 算了精確二項的臨界區,並用常態近似做對照(上方有兩個小表可以展開查看)。 ===== - 精確等尾法(each tail ≈ 0.025)得到: - 下臨界點:X≤11X \le \mathbf{11}X≤11,其 P(X≤11)≈0.0126P(X \le 11) \approx 0.0126P(X≤11)≈0.0126 - 上臨界點:X≥29X \ge \mathbf{29}X≥29,其 P(X≥29)≈0.0200P(X \ge 29) \approx 0.0200P(X≥29)≈0.0200 -(兩端合計約 0.0326,這是因為二項分布是離散的,無法剛好切到 0.025+0.025) ===== * 常態近似(含連續性校正):下界約 ≤ 12、上界約 ≥ 28(和精確值非常接近) 解讀:在 n=100n=100n=100、p0=0.20p_0=0.20p0=0.20 下,觀察到 * X≤11X \le 11X≤11(太少)或 X≥29X \ge 29X≥29(太多)就會拒絕 H0H_0H0。 * 例如觀察到 25 個事件不算顯著;30 個事件就會顯著。 我也算了幾個例子的 p 值(上方第二個表)供你對照,例如: * X=25X=25X=25:雙尾精確 p(probability-based)約多少;單尾 P(X≥25)P(X\ge 25)P(X≥25) 也一併列出。 * X=28X=28X=28、303030、353535:可以看到超過 29 後,p 值迅速跌破 0.05。 如果你要換成 其他樣本數(像是 1000 或 10000),或指定 單尾檢定,我可以直接幫你把臨界值與 p 值表生出來做比較。 === User: 請幫我算出 n 1000 和 n 10000、p₀ 0.2 的「臨界區(拒絕區)」範圍? === 請幫我算出 n = 1000 和 n = 10000、p₀ = 0.2 的「臨界區(拒絕區)」範圍? === Assistant: 好的!在 兩尾檢定 α0.05\alpha0.05α0.05、假設機率 p00.20p00.20p00.20 的情況下,我用常態近似(含連續性校正)算出以下「拒絕區(臨界區)」;在這兩個樣本數下近似非常準確: === 好的!在 兩尾檢定 α=0.05\alpha=0.05α=0.05、假設機率 p0=0.20p_0=0.20p0=0.20 的情況下,我用'''常態近似(含連續性校正)'''算出以下「拒絕區(臨界區)」;在這兩個樣本數下近似非常準確: ===== - 期望值:μ=np0=200\mu = np_0 = 200μ=np0=200 ===== * 標準差:σ=np0(1−p0)=160≈12.65\sigma = \sqrt{np_0(1-p_0)} = \sqrt{160} \approx 12.65σ=np0(1−p0)=160≈12.65 * 臨界 zzz:約 1.96 * 拒絕 H0H_0H0 當: - 男嬰數 ≤175\le 175≤175 或 ≥225\ge 225≥225 * 換成比例:≤17.5%\le 17.5\%≤17.5% 或 ≥22.5%\ge 22.5\%≥22.5%(離 20% 約 ±2.5 個百分點) ===== - 期望值:μ=2000\mu = 2000μ=2000 ===== * 標準差:σ=16000≈126.49\sigma = \sqrt{16000} \approx 126.49σ=16000≈126.49 * 拒絕 H0H_0H0 當: - 男嬰數 ≤1752\le 1752≤1752 或 ≥2248\ge 2248≥2248 * 比例:≤17.52%\le 17.52\%≤17.52% 或 ≥22.48%\ge 22.48\%≥22.48%(離 20% 約 ±2.48 個百分點) : 如果你想要精確二項(非近似)的臨界點,我可以針對 n=1000 做精確計算給你對照;n=10000 也能做,但需要用更穩定的數值法(結果會非常接近上述近似值)。 === User: 好 === 好 === Assistant: 算好了!以下是在 兩尾 α0.05\alpha0.05α0.05、p00.20p00.20p00.20 的設定下: === 算好了!以下是在 兩尾 α=0.05\alpha=0.05α=0.05、p0=0.20p_0=0.20p0=0.20 的設定下: ===== - 下臨界點:X≤175X \le \mathbf{175}X≤175,P(X≤175)≈0.02499P(X \le 175) \approx \mathbf{0.02499}P(X≤175)≈0.02499 ===== * 上臨界點:X≥226X \ge \mathbf{226}X≥226,P(X≥226)≈0.02311P(X \ge 226) \approx \mathbf{0.02311}P(X≥226)≈0.02311 也就是說: * 拒絕 H0H_0H0 當 X≤175X \le 175X≤175 或 X≥226X \ge 226X≥226 * 換成比例:≤17.5%\le 17.5\%≤17.5% 或 ≥22.6%\ge 22.6\%≥22.6%(距離 20% 約 ±2.5 個百分點) * 我已把這個精確結果整理成表格(上方可展開查看)。 ===== - 下臨界點:約 X≤1752X \le 1752X≤1752 ===== * 上臨界點:約 X≥2248X \ge 2248X≥2248 * 比例:≤17.52%\le 17.52\%≤17.52% 或 ≥22.48%\ge 22.48\%≥22.48%(同樣約 ±2.5 個百分點) : 如果你想把這些臨界點畫成一張圖(標出接受區與拒絕區),我可以幫你生圖對照 n=100、1000、10000 在 p0=0.2p_0=0.2p0=0.2 下的差異。 === User: 這樣看起來即使樣本數變多,好像誤差範圍還是沒有小太多? === 這樣看起來即使樣本數變多,好像誤差範圍還是沒有小太多? === Assistant: 好眼力!這裡有兩個容易混淆的點: === 好眼力!這裡有兩個容易混淆的點: # 看「人數差」 vs 看「比例差」 * 臨界門檻的「人數差」會跟 n\sqrt{n}n 一起長大(越多樣本,臨界差的人數要更多)。 * 但我們真正關心通常是「比例差」(誤差範圍),它會隨 1/n1/\sqrt{n}1/n 變小——樣本越大,比例上的誤差越小。 # 我前面把 n=10000、p0=0.2p_0=0.2p0=0.2 的比例臨界值寫成「約 ±2.5%」是口誤,正確應該是約 ±0.78%。跟你說聲抱歉🙏,下面給你一張對照表釐清: | 設定 | 期望比例 𝑝 0 p 0 | 樣本數 𝑛 n | 臨界比例(約) | 誤差幅度(約) | | --- | ----------------- | --------- | ------------------- | ------- | | 小樣本 | 0.20 | 100 | ≤ 11% 或 ≥ 29% | ±9% | | 中樣本 | 0.20 | 1,000 | ≤ 17.5% 或 ≥ 22.6% | ±2.5% | | 大樣本 | 0.20 | 10,000 | ≤ 19.22% 或 ≥ 20.78% | ±0.78% | : 計算依據(雙尾 : 𝛼 : = : 0.05 : α=0.05): : 誤差 ≈ : 𝑧 : 0.975 : 𝑝 : 0 : ( : 1 : − : 𝑝 : 0 : ) : / : 𝑛 : z : 0.975 : : : p : 0 : : : (1−p : 0 : : : )/n : : : ;帶入 : 𝑝 : 0 : = : 0.2 : p : 0 : : : =0.2、 : 𝑧 : ≈ : 1.96 : z≈1.96 : : 𝑛 : = : 1,000 : n=1,000: : 1.96 : 0.16 : / : 1000 : ≈ : 2.48 : % : 1.96 : 0.16/1000 : : : ≈2.48% : : 𝑛 : = : 10,000 : n=10,000: : 1.96 : 0.16 : / : 10000 : ≈ : 0.784 : % : 1.96 : 0.16/10000 : : : ≈0.784% ===== 直覺 ===== * 如果你用「人數」看,從 n=1000n=1000n=1000 到 n=10000n=10000n=10000 的臨界差數量從大約 ±25 人變成'''±98 人''',會以為差很多; * 但換成「比例」,其實從 ±2.5% 縮到 ±0.78%,是明顯縮小的。這就是「n\sqrt{n}n 規模」的效果:樣本加 10 倍,比例誤差大約縮到原來的 110\tfrac{1}{\sqrt{10}}101。 如果你想,我可以把不同 nnn 的樣本量 vs. 誤差畫成一張曲線(∝1/n\propto 1/\sqrt{n}∝1/n),超直觀! == References == <references /> [[Category:ChatGPT Shares]] [[Category:openai]]
Summary:
Please note that all contributions to freem are considered to be released under the Creative Commons Attribution-ShareAlike 4.0 (see
Freem:Copyrights
for details). If you do not want your writing to be edited mercilessly and redistributed at will, then do not submit it here.
You are also promising us that you wrote this yourself, or copied it from a public domain or similar free resource.
Do not submit copyrighted work without permission!
Cancel
Editing help
(opens in new window)
Templates used on this page:
Template:Cite web
(
edit
)
Module:Citation/CS1
(
edit
)
Module:Citation/CS1/COinS
(
edit
)
Module:Citation/CS1/Configuration
(
edit
)
Module:Citation/CS1/Date validation
(
edit
)
Module:Citation/CS1/Identifiers
(
edit
)
Module:Citation/CS1/Utilities
(
edit
)
Module:Citation/CS1/Whitelist
(
edit
)
Module:Citation/CS1/styles.css
(
edit
)