第十夜 500匹の犬


  ニューヨーク市かシカゴ市かちょっと忘れたのだが、年間約500人の人が犬に噛まれて病院に運びこまれるというデーターがある。この10年間で480〜520あたりで増減はしているが、ほぼ500件ということである。それがどうしたといわれればそれまでだが、実は金儲けのネタというのはこういうところに潜んでいるのだ。

  世の中に絶対確実100%ということはありえないといわれているが、1つだけ存在するのである。それは生きているものは確実にいつか死ぬということだ。まぁ、わたしの知らないところで、ゾンビや吸血鬼の一族がいるのかもしれないが、とりあえず100%としておく。
  そして、誰もができる未来予測が、あなたはいつかきっと死ぬでしょうということである。
  これがどういうことを意味しているかというと、サンプルをどれだけとっても、みんな死ぬという100%のデーターがあるということで、そこから導き出される結果として、必ずみんな死ぬという100%の予測が成り立つということだ。

  古今東西、未来を見通せると豪語した超能力者、予言者は数知れないが、ギャンブルでそれを証明した者は一人もいない。もってまわったやり方で行方不明者を山の中でさがしたり、その人の家の中から探し物をするなら、全12Rをスイチで当てるなり、壷の中のサイコロを当ててガッポリ現金を積んで見せればいいだけの話しである。
  しかし、ここに敢然とギャンブルに挑んだ人達がいた。それが統計という手法を使って未来予測をしようとした数学者たちである。なんでもそうだが、最初に物事のしくみみたいなものを発見するというのはほんとに凄いことだと思う。
 そして、確率論というものが生み出され、数学者と博打の胴元との長い戦いがはじまるのである。たしか紀元前にサイコロの原型のようなものが発明されたと共に博打もはじまり、必勝法を求めた戦いも同時に始まったのだから、気が遠くなる時間だ。

  長い戦いの末、確率に支配されているギャンブルはすべて胴元の勝ちとなった。
特にルーレットの場合などは、ある数学者が0と00を作って入れればいいんだよ〜んと胴元側に寝返ったためまったく勝てる要素がなくなってしまったのである。悪名高きアメリカンルーレットの誕生である。
  何も知らなければ数字に0が入っていてもなんの不思議もないが、0と00は治外法権となり、見事胴元側に有利なルールを作ったのである。
  ブラックジャックもそうである。絵札が出た枚数を記憶しながら、残りが何枚のときはこうと、ある一定のルールを作り必勝法を編み出したかに見えたが、デッキ(カード1組の単位)を3から5つをまとめて入れることによって、これも不可能になってしまった。

  では、統計や確率はもはやギャンブルに勝利するための道具となり得ないのだろうか。
そこは、バカとハサミはなんとやらである。使いようによってはなんとかなるだろう、いや、なんとかなって欲しい、なんとかなって、ねぇ、お願い。ぜひとも、よろしくお願いします。という感じだ。

  あっ、そのまえに言っておくが、敗れ去った数学者達はハサミに見えてじつはバカである。必勝法というのは、たとえそれがどんなに完璧にできていても、存在した時点で成り立たないのだ。ブラックジャックの必勝法を見つけても、次の日からカジノにブラックジャックのテーブルがなくなっていたらそれでお終いである。
  そこまでいかなくても、常に勝ちをしたまわるオッズに引き下げればいいだけの話である。あるいは寺銭をアップするとか色々方法はあるだろう。しょせん勝ち目のない戦いである。

  じゃ、一体どこで使うのだということになるのだが、もちろんこのサイトで書いてる以上競馬である。
ただ、お断りしておきたいのは、必勝法を作ろうとかそういうのではありません。もちろんそんなものができれば、こんなとこに書きませんけど。
  やはり、デジタルの基礎はデーターになるんじゃないかということで、データーというものの持ってる原石みたいなものを、いろんな切り口で切ってみることであぶりだせるんじゃないかと考えます。

  具体的にいうと、データーは完全じゃないと意味がありません。そして、データーの取り出し方、切り口によって加工される2次情報があります。最後に自分が予想する上で、データーから取り出した情報をどの程度の比重で組み込むかということがあります。最終的にはこのバランスの問題にもなってくるんですが、ここではデーターというものがどういうもので、そこから出てくる可能性みたいなものを考えて見たいと思います。

  で、冒頭の話しに戻ります。
ここにあるデーターは年間500人の人が犬に噛まれて病院に行くということです。では10年間の推移を見てみると、やはり500前後だったとします。ここから類推できるのは、おそらく来年も500人前後の人が犬に噛まれるということです。100%の未来予測ではありませんが、ほぼ、確実だといえるでしょう。

  前述した金儲けのネタというのはどういう事かといいますと、ここに年間500人のが確実に病院にいくというマーケットがあるということです。ではこれを1次情報として、2次情報としたらどのようなことがあるでしょうか。例えば、年齢別・発生したエリア別・月別あるいは四半期別等々。このような切り口の2次情報を加工することで、子どもが多いとか、市の北部の方が多いとか色々な事が浮かび上がってきます。
  これを標準化して人口100万都市あたりのデーターにすれば、多くの都市でも同じような事が起こりうると類推できます。これを元に「犬に噛まれちゃったのよ」保険として売り出せるかもしれません。そして、うまく行けば全国規模のビジネスとして成り立つかもしれません。
  究極をいえば、100%でなくとも向こう3ヶ月以内に誰が犬に噛まれるかということが分かれば、これは立派に金になる情報となります。

  まぁ、そこまでの推測は不可能ですが、単なる事象から色々なことを導き出すことによって、ある一定の未来予測ができたりします。いつ、誰が、何処で、どの犬に、ということまで分からなくても、毎年500人の人が確実に犬に噛まれるということだけは確かなのです。

  これを競馬に当てはめて見ますと、単勝1番人気の馬が1着になるのは年間30%ある。とういうのと同じです。ここから分かる事は、1番人気の馬を買い続ければ10レースに3レースは的中するということだけです。
  裏を返せば、3割の的中率を持った買い方を発見したことと同じです。ここのすごさが分からない人はデーターを使うのはやめたほうがいいです。
  次に調べるのは、当然その30%の的中したレースの配当ですね。それが301円だったら、必勝法を発見したことになります。しかし、残念ながら240円でした。

  この的中データーと配当のデーターは共に1次データーで並列に扱われなければなりません。次にしなければならない事は、30%の勝率が1%でも上がる条件をフィルターにして2次データーを出します。同じく、配当が少しでも上がるフィルターをかけます。フィルターの数や条件は思いつくままでいいです。900万でも4歳戦でも牝馬限定戦でもなんでも。大事なのは一度に複数のフィルターを通さないということです。900万なら900万、500万なら500万として条件設定をします。うまく行けば回収値が勝率を上回る交点が発見できるかも知れません。

  まぁ、例え話なので、こんな簡単なことで必勝法が見つかるくらいなら、とっくに誰かが見つけているはずですのでやめておきますが、ここで言いたいことは、データーの階層を間違えたり、ごっちゃにしないということと、あるていどまで絞り込めたデーターはレース選択や見極めの基準として使えるんじゃないかということです。
だらだらと書いてしまいましたが、  次回は使えるデーターと使えないデーターについてもうちょっと考えてみたいと思います。

  大晦日の夜。除夜の鐘が鳴る頃、コタツで寝転ぶあなたを、ポメラニアンのポメ子ちゃんが光った目でみつめているかもしれません。なぜなら、ついさっき499人目の人が犬に噛まれたばっかりだからです。

第十一夜