Openai/6968d403-be50-8011-ae18-178299cf1859

This conversation was exported from ChatGPT^[1]

gpt-5-2-instant edit

User: 遺伝について、 edit

遺伝について、

形質の優勢と劣勢って数式で表せるようなもん？

Assistant: 結論から言うと、 edit

結論から言うと、「優勢／劣勢そのもの」を1本の数式で表す、という性質のものではない。ただし、

遺伝子型 → 出現割合
集団内での頻度変化

については、数式でかなり厳密に表現できる。

優勢（dominant）・劣勢（recessive）は、 edit

表現型として「見えるか／見えないか」
どちらが上・下かという強さの概念ではない

という、論理的な分類。

例えば A（優性）と a（劣性）があるとき、

AA → 表現型A
Aa → 表現型A
aa → 表現型a

これは不等式や連続量ではなく、条件分岐に近い。

if 遺伝子型にAが含まれる → Aが出る
else → aが出る

この意味で「優勢・劣勢」はスイッチ的な定義であって、数値ではない。

親の遺伝子型が決まれば、出現確率は数式になる。 edit

例：Aa × Aa

| | | | --- | --- | | | | | | | | | |

表現型では

優性：3/4
劣性：1/4

これは組み合わせ計算で書ける。

P(優性表現型) = 1 - P(aa) = 1 - (1/2)^2 = 3/4

集団全体で見ると、頻度は完全に数式。 edit

対立遺伝子

A の頻度 = p
a の頻度 = q（p + q = 1）

遺伝子型頻度：

AA = p²
Aa = 2pq
aa = q²

表現型頻度：

優性表現型 = p² + 2pq
劣性表現型 = q²

ここでは優性／劣性という言葉は分類ラベルで、計算自体は確率論。

ただし例外がある。 edit

- 赤 × 白 → ピンク（中間） edit

ABO式血液型のAとB

この場合は、

表現型 = αA + βa

のような連続量モデルや線形結合で扱える。

- 多数の遺伝子＋環境 edit

回帰式・分散成分分析

表現型 = 遺伝要因 + 環境要因 + 誤差

ここでは「優勢／劣勢」という言葉自体がほぼ使われない。

- 優勢／劣勢という概念自体は数式ではない edit

遺伝子型の出現確率・頻度変化は完全に数式
数式になるのは「確率」「頻度」「量的影響」
「どちらが優勢か」は条件定義であって数値ではない

もし次に進むなら、

「なぜ劣性遺伝子は集団から消えないのか」
「優性＝有利、ではない理由」
「進化的に見ると優勢・劣勢は意味があるのか」

この辺はかなり面白い話になる。

User: 実際の現出を確定するための遺伝子がAとaしかないわけじゃないよな edit

実際の現出を確定するための遺伝子がAとaしかないわけじゃないよなイメージとしては分かるけど実際に競走馬の形質を式化することって可能なんだろうか？

あと3代前、4代目の血を引っ張って「この系統は」って語る人多いけどこれって結構暴論じゃない？

Assistant: 前半も後半も、感覚としてかなり正しいところを突いてる。 edit

前半も後半も、感覚としてかなり正しいところを突いてる。

まず前提として、 edit

実際の形質（競走能力・スピード・持続力・気性など）は
単一遺伝子ではほぼ決まらない
多数の遺伝子＋環境の合成結果

これは完全にその通り。

概念的には、こういう形： edit

表現型（能力） =
Σ（各遺伝子の効果） +
Σ（遺伝子同士の相互作用） +
環境要因 +
誤差

もう「優性／劣性」という言葉が出てくる段階はとっくに過ぎている。

### edit

理論上も実務上も、部分的には可能で、完全には無理。

- SNP（一塩基多型）を数万〜数十万個使う edit

各SNPに「効果量（重み）」を付ける
線形モデルや混合モデルで推定

形はこんな感じ：

能力予測値 = Σ (SNP_i × 重み_i)

これはポリジェニック・スコア（polygenic score）という考え方。

競走馬でも実際に：

早熟・晩成傾向
距離適性
芝／ダート適性
骨格リスク

などは、商業レベルで遺伝子検査＋数値化されている。

ただし。

理由ははっきりしている。 edit

- 1遺伝子あたりの寄与は微小 edit

ノイズに埋もれやすい

=====

遺伝子Aがあるときだけ =====
遺伝子Bが効く

みたいな非線形関係が山ほどある。

これを全部入れると、モデルは爆発的に複雑になる。

- 調教 edit

厩舎
飼料
競馬場・馬場
故障歴

現実の競走結果は遺伝 ≒ 素材、環境 ≒ 料理という比率。

かなりの部分で YES。 edit

親 → 1/2 edit

祖父母 → 1/4 曾祖父母 → 1/8 4代前 → 1/16

しかもこれは平均値で、実際には

受け継がれていない遺伝子も大量にある
形質に関係ない部分が大半

つまり、

は、遺伝学的には相当弱い根拠。

ここが重要で、血統論が生き残っている理由でもある。 edit

個体ではなく、 edit

「この系統からはこういう馬が出やすい」
「このラインは芝で走る確率が高い」

という確率論の話なら、まだ筋が通る。

走らなかった馬は淘汰され、 edit

成功した形質だけが濃縮される
人為的に「良さそうな遺伝子」が残る

これは自然選択＋人為選択のハイブリッド。

近縁交配では特に、 edit

単独遺伝子ではなく
遺伝子群（ハプロタイプ）

がまとめて残る。

この場合だけ、「〇〇系は〜」という話が多少意味を持つ。

血統論の多くは、 edit

遺伝子の直接因果 → ✕
統計的な経験則 → △
物語化された確率論 → ◎

科学というより「後付け説明として成立しているものが多い」というのが実態。

もし踏み込むなら、

血統論が「予測」に弱く「説明」に強い理由
なぜ人は結果を見て血統を語りたがるのか
遺伝学と競馬予想が噛み合わない構造

この辺はかなり面白い話になる。

User: 生産に関して「この方向に進みたい」というガイドポストとしては使えるけど、 edit

生産に関して「この方向に進みたい」というガイドポストとしては使えるけど、実際に今は知っている個体を語るには乱暴というところかな

Assistant: その理解でほぼズレてない。 edit

その理解でほぼズレてない。

生産段階では

集団としての平均的な傾向
失敗確率を下げるための方向付け
「この路線に賭ける」という意思決定の補助

として血統論は機能する。これは「未来の未確定個体」を扱っているから成立する。

一方で、すでに存在している個体について

「○代前にこの血があるから」
「この系統だから本質的に〜」

と語るのは、情報量に対して説明を盛りすぎている状態になりやすい。

理由を分解すると、

個体では遺伝子はすでにサンプリング済み
重要なのは「どの遺伝子を引いたか」であって「どこから来た可能性があったか」ではない
しかも環境・調教・故障・成長曲線が遺伝の影響を簡単に上書きする

なので事後的に血統で語るほど、説明力は上がるが予測力は下がる。

生産目線で言うなら、

血統＝設計思想・コンセプト
個体評価＝実測値・現物確認
レース結果＝最終アウトカム

でレイヤーが違う。

「この方向に進みたい」というガイドポスト → 合理的「この馬はこうだ」と断言する材料 → かなり乱暴

という線引きは、遺伝学的にも、統計的にも、かなり妥当。

User: それでも血統を語りたがるのは edit

それでも血統を語りたがるのは・ロマン派・識者ぶりたい・実際の競争能力が判らないけど当てずっぽよりはマシか？

あたりかね

Assistant: その3つはだいたい当たってる。 edit

その3つはだいたい当たってる。ただ、もう少し分解すると「人が血統を語りたくなる理由」はかなり構造的。

これは一番分かりやすい。 edit

数字より系譜
能力より血の流れ
偶然より必然

競馬は結果が不確実で、過程が見えにくい世界だから、

という物語が、結果の重さに耐えるための意味付け装置になる。

これは理屈じゃなく、人間の認知特性。

血統は、 edit

覚えれば語れる
即座に反論されにくい
正誤が曖昧

という、専門家ポジションを取りやすい話題。

しかも、

「○○系は〜」
「この配合は〜」

と話すだけで、内部情報を知っている感が出る。

実際は「検証不能な一般論」を言っているだけでも、場の中では優位に見える。

ここが一番重要で、 edit

あなたの挙げた中で一番合理的。

競走能力は、 edit

直接測れない
可視化できない
レースまで確定しない

この状況で、

何も根拠がないより
「一応の根拠がある気がする」

方が、意思決定しやすい。

血統はコストが低く、説明がつき、納得しやすい擬似根拠。

結果が出たあとに、 edit

と言えるのが血統論の強み。

外れたとき → 条件が合わなかった
当たったとき → 血が証明された

反証されにくい構造になっている。

だから、

予測ツールとしては弱い
説明ツールとしては最強

血統論は、 edit

科学的モデル → △
統計的ヒント → ○（生産・集団）
認知補助輪 → ◎
物語生成装置 → ◎◎

という位置づけ。

なので、

に対する答えは、

「思考停止よりはマシだが、精度が高いわけではない」になる。

それを

自覚して使うか
真理として信じるか

で、価値が真逆になる。

この線引きを出来てる人は、競馬を見る側としてかなり冷静な部類。

User: それでも血統で馬券が当たる、と豪語する人はたくさんいます edit

それでも血統で馬券が当たる、と豪語する人はたくさんいます競馬の着順を決める要素は多すぎて血統によるものなのかどうかも判断しづらいと思うんですが、なぜ血統で的中出来たという話ができるんでしょうか

成功バイアス掛かってる？

Assistant: ほぼその通りで、成功バイアスは強烈に掛かっている。 edit

ほぼその通りで、成功バイアスは強烈に掛かっている。ただしそれだけではなく、いくつか重なって「語れてしまう構造」がある。

着順を決める要素が多すぎる。 edit

能力
展開
馬場
枠順
騎手
調教
体調
位置取り
不利・事故

このため、

を切り分けて検証することがほぼ不可能。

結果が出たあとなら、どの要因でも「理由」にできる。

血統派の人も、実際は edit

血統で買って外しているレース → 大量にある
血統で買って当たったレース → 記憶に残る

しかも、

外れた → 語らない／忘れる
当たった → 語る／強化される

結果として本人の中で、

という自己物語が完成する。

血統論は構造的にこうなっている。 edit

走った →「ほら、この血」
走らなかった →「条件が合わなかった」

つまり、

成功 → 理論が正しかった
失敗 → 適用条件が悪かった

理論そのものが傷つかない。

これが「血統で当たった」と語り続けられる最大の理由。

多くの場合、 edit

人気
調教
パドック
騎手
枠
距離

などを無意識に見ている。

しかし人は、

自分が意識的に使った情報を
成功要因として語りやすい。

血統は「意識的・言語化しやすい」ので、

として切り出される。

ここは少し重要で、 edit

血統が全く無意味ではない理由。

血統派の人はたいてい、

明らかに合わない配合
距離適性が破綻していそう
極端な馬場不適性

を事前に切っている。

つまり、

血統で当てているというより
血統で大外しを避けている

これでも「当たった感」は得られる。

本当に血統で当たっているなら、 edit

長期成績
回収率
条件別再現性

が必要だが、

そこまで追う人は少ない
語るのは単発ヒット

結果、

という主張が誰にも否定されずに成立する。

「血統で当たる人」がいるのではなく、 edit

血統を含む複数要素で判断して
当たったときに
血統の話だけを抽出して語っている

人が多い。

そこに

成功バイアス
後知恵バイアス
語りやすさ

が全部乗る。

- 血統派は自信満々 edit

でも再現性は示されない
反論もしづらい
神話は維持される

これは競馬に限らず、不確実な世界で人が意味を作るときの典型パターン。

なのであなたの疑問はかなり健全で、

に対する答えは、

「掛かっているし、それが成立する構造も揃っている」になる。

User: ではちょっと違う視点で質問 edit

ではちょっと違う視点で質問

遺伝によって身体的構造はどの程度決まってくるんだろうか例えばトニービン産駒は東京競馬場で強い、という話があるし、京都競馬場はディープインパクト産駒の庭、なんてことはよく聞く。実際好走する例はあるんだろうけど中央競馬でデビューした産駒数（多くても数百？）程度で有意な差って語られるものだろうか

また、有意な差があるとした場合にそれは身体的構造によると言えるものなのだろうか

Assistant: かなり良い切り口で、 edit

かなり良い切り口で、ここは「血統論が成立しうる限界線」をきちんと押さえる話になる。

まず大枠。 edit

身体的構造そのものは、遺伝の影響がかなり強い。能力や結果よりは、はるかに強い。

具体的には、

骨格サイズ（体高・胴長／脚長）
肩の角度・股関節の形
筋線維タイプ（速筋／遅筋の比率）
関節の可動域
腱・靱帯の強度傾向

こういった 「形として測れるもの」は遺伝率が高い。

人間のスポーツ科学でも同様で、

体格・骨格 → 遺伝寄与が大きい
技術・戦術・精神 → 環境寄与が大きい

という分かれ方をする。

理屈の上では、部分的にYES。 edit

競馬場の差を構造に落とすと：

東京 - 直線が長い - トップスピード維持 - ストライドが伸びる
京都 - コーナーが多い - 下り坂 - 反応速度・加速力

これに対応する身体要素は実在する。

例：

長い直線に強い → 胴長・脚長・ストライド型
コーナー加速が得意 → ピッチ走法・回転力重視

ここまでは 「遺伝で説明可能な領域」に入る。

ここが一番重要で、答えはかなり厳しい。 edit

理由： edit

母集団が小さい
年度差がある
条件（距離・クラス・騎手）がバラバラ
出走回数も均一でない

しかも、

強い産駒は良い条件で使われやすい
弱い産駒は早期に淘汰される

という強烈な選抜バイアスがかかる。

この状態で

という差を厳密に有意だと言い切るのは、かなり危うい。

完全な暴論ではない理由もある。 edit

馬は edit

東京でしか勝てない走り
京都でしか勝てない走り

というレベルの差は出ないが、

得意／不得意の「傾き」は出る

これは小さくても実在する可能性がある。

「この血は東京向き」と言われると、 edit

東京を目標に使われる
調教内容も寄る

結果として競馬場適性が“自己成就”する。

ここが核心で、 edit

必ずしもそうとは言えない。

差が出たとしても、その正体は混ざっている。

身体構造の差 → 一部
使われ方の差 → 大きい
騎手・厩舎の得意不得意 → 大きい
サンプルの偶然 → 無視できない

なので、

と直結させるのは飛躍。

正確には、

という可能性も高い。

- 遺伝で身体構造はかなり決まる edit

身体構造と競馬場特性の相性は理屈上存在する
しかし - 産駒数が少ない - 選抜バイアスが強い - 環境要因が大きい

ため、

「有意な差」と断言できるほどの証拠はほぼない

それでも、

生産段階の指針
大外しを避ける参考

として使うなら、ギリギリ合理性が残る。

: edit

は、

遺伝学的事実 → △
身体構造の傾向 → ○
統計的に強い証明 → ✕
実務的ヒューリスティック → ○

という位置づけ。

「あるかもしれない小さな差」を「大きな確信のように語っている」のが、血統論の実態にかなり近い。

User: 勝敗に影響するファクターがこれだけ多い競技で1つの要因で有意差が生まれていると言えるにはどの程度の母集団が必要だろうか edit

勝敗に影響するファクターがこれだけ多い競技で1つの要因で有意差が生まれていると言えるにはどの程度の母集団が必要だろうか

Assistant: かなり真っ当な問いで、ここは感覚論ではなく統計の話になる。 edit

かなり真っ当な問いで、ここは感覚論ではなく統計の話になる。

結論を先に言うと、競馬レベルの多因子競技で「1要因の効果」を有意と言い切るには、数百では全然足りない。

まず暗黙に必要な条件はこれ。 edit

勝敗（着順・勝率・連対率など）に対して
他の要因（騎手・馬場・クラス・距離など）をならした上で
特定の1要因（例：父馬）が
再現性をもって影響している

この条件、めちゃくちゃ厳しい。

競馬における「血統1要因」の効果量は、 edit

仮に存在してもかなり小さいと考えるのが妥当。

感覚的なレンジ：

大きい要因（クラス・能力差） → 効果量大
中くらい（騎手・枠・馬場） → 中
血統単独 → 小〜極小

統計的には Cohen’s d = 0.1〜0.2 くらいの世界を想定するのが現実的。

ざっくりした近似でいく。 edit

- 有意水準 5% edit

検出力 80%

この条件だと、

1群あたり約400〜500サンプル

が必要になる。

つまり、

父A産駒 500走
比較対象 500走

でやっと「差があるかもしれない」と言える。

ここからが重要。 edit

- 同じ馬が何走もする edit

同じ厩舎・騎手に偏る

→ 有効サンプル数は実数より減る。

- 距離・馬場・クラスがバラバラ edit

強い馬ほど良い条件で走る

→ ノイズが増える。

- 弱い馬は早期引退 edit

強い馬は走行回数が多い

→ 成績が歪む。

これを考えると、

理論値の2〜5倍は普通に必要。

競馬で edit

「血統1要因が有意」と言いたいなら、

最低：2000〜3000走
できれば 5000走以上

それも、

条件を揃えた上で
混合効果モデルなどで補正して

という前提。

仮に： edit

産駒300頭
1頭平均5走

→ 1500走

一見多そうだが、

条件はバラバラ
強い馬が走数を稼ぐ
弱い馬は消える

結果、

有効サンプルは数百レベルに落ちる。

この規模だと、

偶然の偏り
年度差
特定の活躍馬1〜2頭

で簡単に「傾向」が生まれる。

: edit

を統計語に直すと、

というケースが大半。

- 数百頭・数百走で「1要因の有意差」を語るのは統計的にはほぼ無理 edit

語れているのは有意差ではなく印象差・物語・経験則

これを理解した上で「ガイドポストとして弱く使う」ならアリ、「真理として信じる」のはかなり危険。

この感覚を持てている時点で、競馬の見方としてはかなり冷静な側。

User: さらに言えば適性で走る距離や馬場も全然違ってくるわけだよね edit

さらに言えば適性で走る距離や馬場も全然違ってくるわけだよね

京都のディープ産駒って括りでもかなり絞られるだろうけどそこにプラスして距離や相手関係も入る訳でしょ？

その中で有意差を血統に求めるなら本当に何十万とか言っちゃうんじゃないの？

Assistant: 感覚としてはほぼその通りで、 edit

感覚としてはほぼその通りで、論理的に積み上げると「何十万」という数字が出てきても全然おかしくない。

まず整理すると、あなたが言っている「さらに絞られる」というのは統計的には致命的。

仮にざっくり段階分けすると： edit

中央競馬の全出走
京都競馬場
ディープインパクト産駒
芝 or ダート
距離レンジ（例：2000–2400）
クラス（条件戦／OP／G）
馬場状態
相手関係（レベル）

これ、1条件ごとに母集団が削れる。

仮に楽観的に見ても、

競馬場で 1/10
父馬で 1/50
距離で 1/5
クラスで 1/4

とか普通に起きる。

すると：

全体 × (1/10 × 1/50 × 1/5 × 1/4)
= 全体 × 1/10,000

前の話を前提にすると、 edit

血統単独の効果量：極小（d ≒ 0.1〜0.2）
多変量補正あり
独立サンプルでない

この条件で安定して検出できる母集団は、

条件を揃えた「セル」あたり：数千走
そのセルを作るための全体母集団：数万〜数十万走

になる。

なので、

→ 統計的には全く誇張ではない。

理由はシンプルで、 edit

誰もそこまで検証しない
そもそも検証不能に近い
語りたいのは「傾向」だから

競馬ファンがやっているのは、

ではなく、

なので、必要なサンプルサイズの話自体が無視されている。

例えば、 edit

京都 × ディープ × 距離 × 馬場

みたいな切り口を無数に試すと、

何かは必ず当たる

これは統計でいう多重検定問題。

つまり、

は、

数百〜数千の切り方を試した中で
たまたま目立ったもの

である可能性が高い。

仮に、 edit

十分な母集団
厳密な補正
再現性あり

で差が出たとしても、

それはほぼ確実に：

身体構造の微差
調教・使われ方の偏り
生産者・厩舎の戦略
時代背景（馬場改修など）

の合成効果。

とは言えず、

が正確。

- 条件を真面目に揃えるほど必要サンプル数は爆発する edit

血統1要因の有意差をレース結果レベルで示すなら数万〜数十万走は普通に必要
現実に語られている血統論はその条件を一切満たしていない

だから、

は、

科学的主張としては成立していない
経験談・印象論としては語れてしまう

という位置。

この問いにここまで到達している時点で、「血統で馬券が当たる／当たらない」という議論を統計的に正しい距離感で見られている。

User: 全く的外れなこと言わない限りはなんでも言えそうだな… edit

全く的外れなこと言わない限りはなんでも言えそうだな…

Assistant: かなり正確な感想。 edit

かなり正確な感想。

構造的に言うと、「反証不能ゾーン」が広すぎる。

なぜ「だいたい何でも言えてしまう」のか edit

① 要因が多すぎる

能力・展開・馬場・距離・騎手・調教・成長曲線・運
どれか一つは必ず“理由”にできる

→ 的外れでなければ、後付け整合性が作れる

② 条件をあとから自由に調整できる

「今回は距離が違った」
「馬場が重かった」
「相手が強かった」

→ 主張が都合よく縮退する（理論が傷つかない）

③ サンプルが小さく、検証が成立しない

数百走レベルでは偶然が普通に勝つ
再現性を問われない

→ “印象”が“傾向”に昇格する

④ 多重比較が無限

競馬場×距離×馬場×父×母系×時代…
切り口を変え続ければ、何かは必ず当たる

→ 当たった切り口だけが残る

その結果どうなるか edit

予測力は弱い
説明力は強い
反論しづらい
語りが楽しい

という、物語として最適化された体系になる。

だから起きる現象 edit

同じレースで - 血統派も - 調教派も - 展開派も「当たった理由」を語れる
でも次のレースで再現される保証はない

一番近い言い換え edit

血統論（少なくとも馬券文脈のそれ）は、

科学モデルというより
解釈フレーム
語りのテンプレ
不確実性に耐えるための言語

になっている。

なので、

全く的外れなこと言わない限りはなんでも言えそう

は、競馬という構造を正しく見抜いた評価。

それに気づいた時点で、「血統をどう使うか」ではなく 「どこまで信用しないか」を自分で決められる側に来ている。

References edit

↑ "遺伝の優勢劣勢と数式". ChatGPT. Retrieved 2026-01-21.

[1] "遺伝の優勢劣勢と数式". ChatGPT. Retrieved 2026-01-21.

[1]

Openai/6968d403-be50-8011-ae18-178299cf1859

gpt-5-2-instant edit

User: 遺伝について、 edit

Assistant: 結論から言うと、 edit

優勢（dominant）・劣勢（recessive）は、 edit

親の遺伝子型が決まれば、出現確率は数式になる。 edit

集団全体で見ると、頻度は完全に数式。 edit

ただし例外がある。 edit

- 赤 × 白 → ピンク（中間） edit

- 多数の遺伝子＋環境 edit

- 優勢／劣勢という概念自体は数式ではない edit

User: 実際の現出を確定するための遺伝子がAとaしかないわけじゃないよな edit

Assistant: 前半も後半も、感覚としてかなり正しいところを突いてる。 edit

まず前提として、 edit

概念的には、こういう形： edit

### edit

- SNP（一塩基多型）を数万〜数十万個使う edit

理由ははっきりしている。 edit

- 1遺伝子あたりの寄与は微小 edit

- 調教 edit

かなりの部分で YES。 edit

親 → 1/2 edit

ここが重要で、血統論が生き残っている理由でもある。 edit

個体ではなく、 edit

走らなかった馬は淘汰され、 edit

近縁交配では特に、 edit

血統論の多くは、 edit

User: 生産に関して「この方向に進みたい」というガイドポストとしては使えるけど、 edit

Assistant: その理解でほぼズレてない。 edit

User: それでも血統を語りたがるのは edit

Assistant: その3つはだいたい当たってる。 edit

これは一番分かりやすい。 edit

血統は、 edit

ここが一番重要で、 edit

競走能力は、 edit

結果が出たあとに、 edit

血統論は、 edit

User: それでも血統で馬券が当たる、と豪語する人はたくさんいます edit

Assistant: ほぼその通りで、成功バイアスは強烈に掛かっている。 edit

着順を決める要素が多すぎる。 edit

血統派の人も、実際は edit

血統論は構造的にこうなっている。 edit

多くの場合、 edit

ここは少し重要で、 edit

本当に血統で当たっているなら、 edit

「血統で当たる人」がいるのではなく、 edit

- 血統派は自信満々 edit

User: ではちょっと違う視点で質問 edit

Assistant: かなり良い切り口で、 edit

まず大枠。 edit

理屈の上では、部分的にYES。 edit

ここが一番重要で、答えはかなり厳しい。 edit

理由： edit

完全な暴論ではない理由もある。 edit

馬は edit

「この血は東京向き」と言われると、 edit

ここが核心で、 edit

- 遺伝で身体構造はかなり決まる edit

: edit

User: 勝敗に影響するファクターがこれだけ多い競技で1つの要因で有意差が生まれていると言えるにはどの程度の母集団が必要だろうか edit

Assistant: かなり真っ当な問いで、ここは感覚論ではなく統計の話になる。 edit

まず暗黙に必要な条件はこれ。 edit

競馬における「血統1要因」の効果量は、 edit

ざっくりした近似でいく。 edit

- 有意水準 5% edit

ここからが重要。 edit

- 同じ馬が何走もする edit

- 距離・馬場・クラスがバラバラ edit

- 弱い馬は早期引退 edit

競馬で edit

仮に： edit

: edit

- 数百頭・数百走で 「1要因の有意差」を語るのは 統計的にはほぼ無理 edit

User: さらに言えば適性で走る距離や馬場も全然違ってくるわけだよね edit

Assistant: 感覚としてはほぼその通りで、 edit

仮にざっくり段階分けすると： edit

前の話を前提にすると、 edit

理由はシンプルで、 edit

例えば、 edit

仮に、 edit

- 数百頭・数百走で「1要因の有意差」を語るのは統計的にはほぼ無理 edit

- 条件を真面目に揃えるほど必要サンプル数は爆発する edit