
第十一夜 満月に吼えるオカミさん
オオカミさんではありません。オカミさんです。先日、産経新聞に満月の夜に分娩する妊婦は通常より出血の量が多く、帝王切開のケースも多いという話しが載っていました。というわけで満月に吼えるオカミさんです。
これなんかは有用なデーターですね。先生は通常の日より、それなりの準備をして体制を整える事ができますからね。
では無用なデーターとは何でしょうか。いちばん簡単なのは、サンプル数が極端に少ないものです。例えばG1のときなんかによく出てくるのが、ステップレースでどのレースに連帯した馬が有力であるとか、たかだか雨の日に2戦2勝しただけでで道悪巧者だとかいわれる類のものです。
つい先日の菊花賞でもダービー馬より皐月賞馬の方が勝っているといわれ、その通りになったといってますが、ではそのデータをどれだけ重視できるのでしょうか。こういうクソみたいなデーターでも自分で見つけ出して、最優先で買うという人には何もいいませんが、雑誌や、新聞に出ているのを読むくらいなら、最初から見ない方がましです。天皇賞もそういった類のデーターが見事裏切られました。
わたしは最低でもサンプルは100以上ないと使えないと思ってます。ですから、データーを重層的に絞っていった場合、あまり母数がちいさくなりすぎると、自分勝手なこじつけになる恐れがあります。
データーの恐いところは、きちんとしたデーターベースから自分で導き出さないと信用できないという事です。
例えば、ワインブームといわれた中には、ポリフェノールという物質が動脈硬化を防ぐので脳梗塞とか心筋梗塞で死ぬ人が少ないというデーターが使われていました。だから身体にいいんだと。フランスでは先進国の中で動脈硬化による病気の死亡率が低いので、フレンチパラドックスと呼ばれてると、みのもんたあたりが言ってました。
テレビで言うのはここまでです。ウソはついてないんですが、そのかわりワインをガブガブ飲むので、肝硬変やアルコール依存症が他の国に比べて多いんです。結局死んでる数はほとんど同じで、成人病というくくりでは死亡原因が違う程度のことだったんですね。
映画の宣伝文句でも一緒ですわ。興行収入全米1位(封切り1週間)観客動員数全米1位(主要10大都市)とかほとんどの映画が全米1位でしょ。都合のいいとこだけ切り取ってるわけですね。
もう1つは、あたりまえですけど、データーというのは過去のものであって、単なる結果の羅列ということです。だから、去年がこうだったから必ず今年もこうなるとはいえない可能性もあるわけです。世の中の馬券本の類はここが一番分かってないですね。過去のデーターをいじくりまわすだけで、過去がこうだったから今度もこうですといってるだけです。
基本的には、データーから仮説を立てて、それを検証する。この流れが1セットになってないと絞り込んでいくことができません。仮設の検証によって仮説の不備や欠点がわかります。そこに不備を補うデーターを探すなりして新たな仮設を立てることができます。この試行錯誤によって自分の望んでるいるものへ少しづつではありますが近づけるとわたしは思います。
抽象的な話しばかりではわかりにくいので、1つの事例としてわたしがこのHPで予想している単勝の場合を書いてみます。
前回も書きましたが、単勝の人気別的中率と配当を大雑把に見てみますと、以下のようになります。
| 勝率 | 平均配当 | 必要配当 | |
| 1番人気 | 30% | 240円 | 330円 |
| 2番人気 | 20% | 410円 | 500円 |
| 3番人気 | 14% | 580円 | 720円 |
| 4番人気 | 8.8% | 900円 | 1140円 |
| 5番人気 | 7.5% | 1200円 | 1330円 |
これを1次データーとして、ここからいろいろ考えるわけですが、最初に考えないといけないのは、配当と必要配当額の差を埋めるにはどうするか、あるいは的中率を上げる方法ですね。
ここで注意しないといけないのは、平均というものはできるだけ使わないで、その分布を1度調べて見るということです。平均の怖いのは、例えば極端な例でいいますと、100円と900円の2レースでは平均配当が500円になってしまいます。でも他のデーターでは550円と450円である場合もあるわけです。
どちらも平均で500円としてしまっては大きな間違いが出てきます。そのために標準偏差というのがあるんですが、ややこしくなるので省略します。
特に馬連の配当データーなんかで、回収率が100%を上回っている場合など、注意して見ると高額の万馬券がいくつか出ていたりすることがあります。その辺りのデーター処理をどうするかも1つのポイントにはなります。
そういったことに注意して見てみると、1番人気の配当は高いですよね。体感的に200円以上というのは少ないというのが分かります。そこで金額別にでている数を見てみると、やはり150円あたりが1番多くなっています。150円あたりの的中率は30%を上回ります。そこで、色々な条件を設定してみてフィルターをかけて見ますが、最終的な結論は的中率80%で配当150円という線が出てきましたが、これをクリアする事はできませんでした。
1番人気の配当を10円20円上げるのは難しいですが、2番人気以下だとなんとかなりそうです。
そこで、2番・3番・4番人気が必要配当額を上回ってる時を見ますと、やはり圧倒的1番人気が飛んでいるときです。
ここで、1つの仮説がたちます。
単勝1番人気が200円までのレースで圧倒的1番人気馬が飛ぶレースはどれくらいあるのか。
そのときに2番・3番・4番人気馬の勝率及び配当を調べることで、必要配当額を上回れるんではないか。
この仮説を検証するためにいろいろなデーターを使って見ます。
これ以上は公開できませんが、これをベースに以前から取っていた出馬表のABC馬等の勝率とか、1番人気馬と2番人気馬の指数差などのデーターを加味してレース選択しています。
わたしが、機械的に選択しているのはここまでで、逆にいえば、圧倒的1番人気馬が飛びそうなレースを選択する為に出しているということです。
そのときに1番人気馬を脅かすのはどの馬かというのはアナログ的になってきます。そのせいか、候補に落ちたレースでよく1着になったりもしますが。
これをする事によって、選択からもれたレースでは1番人気馬を堅軸として買うこともできます。
よく、掲示板等でも「レースが絞れずほとんど全部買ってしまいます」という書きこみを見ますが、大多数の人は出された試験問題を順番に解くようにしかレースを見てないんじゃないでしょうか。大きなくくりとして、固いのか、荒れるのかの2つでもいいと思いますがレースを分けてみるのひとつの方法だと思います。
これも実は凄い難しい事ですが、ただ、自分なりに分けようと思えば、何かの基準がなければ分けられないはずですので、そういう基準を持つキッカケになるかもしれません。
わたしは、逆にドカンと勝負できるほどのレースがないときのほうが多く、今日はもう1つやなぁというときでもなんとか勝負できそうなレースを見つける方法がないものかと思ってます。
馬券で食べている人は、そんな日でもやはりどこか狙い目を絞って勝負しなければならないでしょうし、それができなければ食べていくこともでいないでしょう。麻雀でもなんでもそうですが、悪い手をどうしのぐかが力量なわけで、やれるレースが多いというのもある意味しあわせなんかもしれませんね。たくさんのレースを買うだけの資金もあるというこですからね。
最後に、データーというのはヒマなときにゴニョゴニュいじってると思わぬものが出てきたりします。例えば、なんとなく牝馬限定戦て何が勝ってるんやろとか、どうとか。そういう単発のデーターでなんとなく頭の隅にでも残ってるやつが他のデーター見てるときにふとリンクしたりして面白い事になったりします。
競馬に負けるとオカミサンが吼える率100%とというデーターは出ないようにがんばりましょう。
でないと競馬に行くときに、「ちょっと引越しの手伝いに」といわなければならなくなります。
第十二夜