Jump to content
Main menu
Main menu
move to sidebar
hide
Navigation
Main page
Recent changes
Random page
freem
Search
Search
Appearance
Create account
Log in
Personal tools
Create account
Log in
Pages for logged out editors
learn more
Contributions
Talk
Editing
Openai/691718ed-7ba4-8006-96d5-a66e0d9678fe
(section)
Add languages
Page
Discussion
English
Read
Edit
Edit source
View history
Tools
Tools
move to sidebar
hide
Actions
Read
Edit
Edit source
View history
General
What links here
Related changes
Special pages
Page information
Appearance
move to sidebar
hide
Warning:
You are not logged in. Your IP address will be publicly visible if you make any edits. If you
log in
or
create an account
, your edits will be attributed to your username, along with other benefits.
Anti-spam check. Do
not
fill this in!
== gpt-5-thinking == === User: 好 === 好 === Assistant: 我幫你把「1000 名新生兒中有 520 位男嬰」這個例子的 精確二項檢定 p 值算出來,並和常態近似做了對照。已把結果整理成小表格給你看(上方可點開)。 === 我幫你把「1000 名新生兒中有 520 位男嬰」這個例子的 精確二項檢定 p 值算出來,並和常態近似做了對照。已把結果整理成小表格給你看(上方可點開)。 重點數值: * 精確二尾 p 值(H0:p=0.5H_0: p=0.5H0:p=0.5,計算 P(X≤480)+P(X≥520)P(X\le 480)+P(X\ge 520)P(X≤480)+P(X≥520)):0.2174482932 * 常態近似(不含連續性校正):0.2059032107 * 常態近似(含連續性校正):0.2174682261 結論: p ≈ 0.217(精確值),大於常見的顯著水準 0.05,因此沒有足夠證據拒絕「男女出生率相等」的虛無假設。若你想換不同的樣本量或觀察數(例如 560 vs 440),我也可以立刻幫你改參數再算。 === User: 那如果說是只有100人的狀況呢? === 那如果說是只有100人的狀況呢? === Assistant: 在 100 名嬰兒 n100、p00.5p00.5p00.5、雙尾 α0.05\alpha0.05α0.05 的設定下,用精確二項去找臨界值: === 在 100 名嬰兒 (n=100)、p0=0.5p_0=0.5p0=0.5、雙尾 α=0.05\alpha=0.05α=0.05 的設定下,用精確二項去找臨界值: * 找到的最小上界是 男嬰 ≥ 61(對稱下界是 ≤ 39) * 對應的雙尾 p 值 ≈ 0.0352 < 0.05(已達顯著) 因此臨界區域為: * 拒絕 H0H_0H0(認為男女出生率不等):男嬰數 ≤ 39 或 ≥ 61 * 接受 H0H_0H0:男嬰數在 40 ~ 60 之間 直覺比較: * n=100n=100n=100 時需要至少 ±11 人(從 50 偏到 39 或 61,約 11% 的比例差)才顯著 * n=1000n=1000n=1000 時約 ±32 人(3.2%) * n=10000n=10000n=10000 時約 ±98 人(0.98%) 樣本越大,能偵測到越小的比例差。需要我把三種樣本規模的臨界區做成一張比較小表或圖嗎? === User: 那如果這個事件的發生機率不再是50% 而是例如 20%呢? === 那如果這個事件的發生機率不再是50% 而是例如 20%呢? === Assistant: 如果事件在虛無假設下的機率不是 50%,例如 p00.20p0 0.20p00.20,做法一樣,只是分布不對稱。我幫你用 n 100、雙尾 α0.05\alpha0.05α0.05 算了精確二項的臨界區,並用常態近似做… === 如果事件在虛無假設下的機率不是 50%,例如 p0=0.20p_0 = 0.20p0=0.20,做法一樣,只是分布不對稱。我幫你用 n = 100、雙尾 α=0.05\alpha=0.05α=0.05 算了精確二項的臨界區,並用常態近似做對照(上方有兩個小表可以展開查看)。 ===== - 精確等尾法(each tail ≈ 0.025)得到: - 下臨界點:X≤11X \le \mathbf{11}X≤11,其 P(X≤11)≈0.0126P(X \le 11) \approx 0.0126P(X≤11)≈0.0126 - 上臨界點:X≥29X \ge \mathbf{29}X≥29,其 P(X≥29)≈0.0200P(X \ge 29) \approx 0.0200P(X≥29)≈0.0200 -(兩端合計約 0.0326,這是因為二項分布是離散的,無法剛好切到 0.025+0.025) ===== * 常態近似(含連續性校正):下界約 ≤ 12、上界約 ≥ 28(和精確值非常接近) 解讀:在 n=100n=100n=100、p0=0.20p_0=0.20p0=0.20 下,觀察到 * X≤11X \le 11X≤11(太少)或 X≥29X \ge 29X≥29(太多)就會拒絕 H0H_0H0。 * 例如觀察到 25 個事件不算顯著;30 個事件就會顯著。 我也算了幾個例子的 p 值(上方第二個表)供你對照,例如: * X=25X=25X=25:雙尾精確 p(probability-based)約多少;單尾 P(X≥25)P(X\ge 25)P(X≥25) 也一併列出。 * X=28X=28X=28、303030、353535:可以看到超過 29 後,p 值迅速跌破 0.05。 如果你要換成 其他樣本數(像是 1000 或 10000),或指定 單尾檢定,我可以直接幫你把臨界值與 p 值表生出來做比較。 === User: 請幫我算出 n 1000 和 n 10000、p₀ 0.2 的「臨界區(拒絕區)」範圍? === 請幫我算出 n = 1000 和 n = 10000、p₀ = 0.2 的「臨界區(拒絕區)」範圍? === Assistant: 好的!在 兩尾檢定 α0.05\alpha0.05α0.05、假設機率 p00.20p00.20p00.20 的情況下,我用常態近似(含連續性校正)算出以下「拒絕區(臨界區)」;在這兩個樣本數下近似非常準確: === 好的!在 兩尾檢定 α=0.05\alpha=0.05α=0.05、假設機率 p0=0.20p_0=0.20p0=0.20 的情況下,我用'''常態近似(含連續性校正)'''算出以下「拒絕區(臨界區)」;在這兩個樣本數下近似非常準確: ===== - 期望值:μ=np0=200\mu = np_0 = 200μ=np0=200 ===== * 標準差:σ=np0(1−p0)=160≈12.65\sigma = \sqrt{np_0(1-p_0)} = \sqrt{160} \approx 12.65σ=np0(1−p0)=160≈12.65 * 臨界 zzz:約 1.96 * 拒絕 H0H_0H0 當: - 男嬰數 ≤175\le 175≤175 或 ≥225\ge 225≥225 * 換成比例:≤17.5%\le 17.5\%≤17.5% 或 ≥22.5%\ge 22.5\%≥22.5%(離 20% 約 ±2.5 個百分點) ===== - 期望值:μ=2000\mu = 2000μ=2000 ===== * 標準差:σ=16000≈126.49\sigma = \sqrt{16000} \approx 126.49σ=16000≈126.49 * 拒絕 H0H_0H0 當: - 男嬰數 ≤1752\le 1752≤1752 或 ≥2248\ge 2248≥2248 * 比例:≤17.52%\le 17.52\%≤17.52% 或 ≥22.48%\ge 22.48\%≥22.48%(離 20% 約 ±2.48 個百分點) : 如果你想要精確二項(非近似)的臨界點,我可以針對 n=1000 做精確計算給你對照;n=10000 也能做,但需要用更穩定的數值法(結果會非常接近上述近似值)。 === User: 好 === 好 === Assistant: 算好了!以下是在 兩尾 α0.05\alpha0.05α0.05、p00.20p00.20p00.20 的設定下: === 算好了!以下是在 兩尾 α=0.05\alpha=0.05α=0.05、p0=0.20p_0=0.20p0=0.20 的設定下: ===== - 下臨界點:X≤175X \le \mathbf{175}X≤175,P(X≤175)≈0.02499P(X \le 175) \approx \mathbf{0.02499}P(X≤175)≈0.02499 ===== * 上臨界點:X≥226X \ge \mathbf{226}X≥226,P(X≥226)≈0.02311P(X \ge 226) \approx \mathbf{0.02311}P(X≥226)≈0.02311 也就是說: * 拒絕 H0H_0H0 當 X≤175X \le 175X≤175 或 X≥226X \ge 226X≥226 * 換成比例:≤17.5%\le 17.5\%≤17.5% 或 ≥22.6%\ge 22.6\%≥22.6%(距離 20% 約 ±2.5 個百分點) * 我已把這個精確結果整理成表格(上方可展開查看)。 ===== - 下臨界點:約 X≤1752X \le 1752X≤1752 ===== * 上臨界點:約 X≥2248X \ge 2248X≥2248 * 比例:≤17.52%\le 17.52\%≤17.52% 或 ≥22.48%\ge 22.48\%≥22.48%(同樣約 ±2.5 個百分點) : 如果你想把這些臨界點畫成一張圖(標出接受區與拒絕區),我可以幫你生圖對照 n=100、1000、10000 在 p0=0.2p_0=0.2p0=0.2 下的差異。 === User: 這樣看起來即使樣本數變多,好像誤差範圍還是沒有小太多? === 這樣看起來即使樣本數變多,好像誤差範圍還是沒有小太多? === Assistant: 好眼力!這裡有兩個容易混淆的點: === 好眼力!這裡有兩個容易混淆的點: # 看「人數差」 vs 看「比例差」 * 臨界門檻的「人數差」會跟 n\sqrt{n}n 一起長大(越多樣本,臨界差的人數要更多)。 * 但我們真正關心通常是「比例差」(誤差範圍),它會隨 1/n1/\sqrt{n}1/n 變小——樣本越大,比例上的誤差越小。 # 我前面把 n=10000、p0=0.2p_0=0.2p0=0.2 的比例臨界值寫成「約 ±2.5%」是口誤,正確應該是約 ±0.78%。跟你說聲抱歉🙏,下面給你一張對照表釐清: | 設定 | 期望比例 𝑝 0 p 0 | 樣本數 𝑛 n | 臨界比例(約) | 誤差幅度(約) | | --- | ----------------- | --------- | ------------------- | ------- | | 小樣本 | 0.20 | 100 | ≤ 11% 或 ≥ 29% | ±9% | | 中樣本 | 0.20 | 1,000 | ≤ 17.5% 或 ≥ 22.6% | ±2.5% | | 大樣本 | 0.20 | 10,000 | ≤ 19.22% 或 ≥ 20.78% | ±0.78% | : 計算依據(雙尾 : 𝛼 : = : 0.05 : α=0.05): : 誤差 ≈ : 𝑧 : 0.975 : 𝑝 : 0 : ( : 1 : − : 𝑝 : 0 : ) : / : 𝑛 : z : 0.975 : : : p : 0 : : : (1−p : 0 : : : )/n : : : ;帶入 : 𝑝 : 0 : = : 0.2 : p : 0 : : : =0.2、 : 𝑧 : ≈ : 1.96 : z≈1.96 : : 𝑛 : = : 1,000 : n=1,000: : 1.96 : 0.16 : / : 1000 : ≈ : 2.48 : % : 1.96 : 0.16/1000 : : : ≈2.48% : : 𝑛 : = : 10,000 : n=10,000: : 1.96 : 0.16 : / : 10000 : ≈ : 0.784 : % : 1.96 : 0.16/10000 : : : ≈0.784% ===== 直覺 ===== * 如果你用「人數」看,從 n=1000n=1000n=1000 到 n=10000n=10000n=10000 的臨界差數量從大約 ±25 人變成'''±98 人''',會以為差很多; * 但換成「比例」,其實從 ±2.5% 縮到 ±0.78%,是明顯縮小的。這就是「n\sqrt{n}n 規模」的效果:樣本加 10 倍,比例誤差大約縮到原來的 110\tfrac{1}{\sqrt{10}}101。 如果你想,我可以把不同 nnn 的樣本量 vs. 誤差畫成一張曲線(∝1/n\propto 1/\sqrt{n}∝1/n),超直觀!
Summary:
Please note that all contributions to freem are considered to be released under the Creative Commons Attribution-ShareAlike 4.0 (see
Freem:Copyrights
for details). If you do not want your writing to be edited mercilessly and redistributed at will, then do not submit it here.
You are also promising us that you wrote this yourself, or copied it from a public domain or similar free resource.
Do not submit copyrighted work without permission!
Cancel
Editing help
(opens in new window)