競馬のデータマイニング予想は勝てるか?当たる当たらない検証と分析。JRA-VAN

競馬のマイニング予想は勝てるか?

▼『マイニングで競馬に勝てますか?』

というご質問をいただいたので、本日は、マイニング指数について、独断と偏見で書いてみたいと思います。

マイニング2

▼私(ブエナ)の経験則で書けば、

「マイニング指数は昔は利益を出せたが、今はマイニング単品で利益を出すのは難しいと感じる」

「ただ、マイニングもスピード指数同様に、人気との乖離を狙うことで、回収率を高めることが可能だと思う」



ではこの件について、私なりに考察してみたいと思います。



▼マイニング指数というものがあります。

これは有料ですが、JRA-VANなどを使っている人には、おなじみの指数かと思います。



▼マイニングとは、ただのスピード指数ではなく、騎手や調教師、枠順、血統、コース、等々。。。

あらゆるファクターを総合的に分析し、

レース結果を事前に予測する指数

となっています。
  ↓
データマイニング公式サイト(JRA)



▼実はこのマイニング。

数年前までは、超有効な指数でした。

マイニングに限らず、ほとんどのスピード指数は、数年前まではかなり利益を出すのに有効だったわけです。

が、近年の情報化社会により、指数系はその多くが、「オッズに反映されてしまった印象


これにより現在は、スピード指数「単体で」利益を出す事は、非常に困難な状況になっています。

これについては、前回の記事でも書いた通りです。



▼私ブエナも、数年前までは、とあるスピード指数だけで簡単に回収率をプラスにできていました。

しかし、現在はそのスピード指数だけで利益を出すことは困難です。

では本日のテーマ。「マイニング」はどうなのか?



▼その前に蛇足ですが、マイニングがデータ分析しにくい理由の1つとして、「マイニングはロジック変更が行われる」というものがあります。

微調整かと思いますが、ロジックの変更が行われてしまうと、利用する側としても、どの部分のロジックが変更されたのか分からないので、かなり厄介です。



▼とりあえず、マイニングの成績を簡単に調べてみました。


2010年~2015年
【タイム型マイニング】1~3位の単勝回収率


マイニング1位 78%
マイニング2位 80%
マイニング3位 84%



はい。
こんな感じ。

上記のデータは、一切のフィルタリングをせず、過去の「19,925レース」を分析したものです。

単純にマイニングの1~3位の単勝を買い続ければ、完全にマイナスになることがわかります。



▼ちなみに、マイニング1~3位を「人気別」に見ても、単勝回収率は80%程度。

プラスになっているのは、

「マイニング1~3位かつ、13~14番人気」

の馬だけです。



▼これは指数狙いの鉄則で、「指数上位なのに人気がない馬を狙う」というルールにマッチします。

ただ、13~14番人気ですから、勝率が1%くらいしかない。

つまり、100レース購入して、1レースしか当たらない。

これではいくら回収率がプラスでも、途中で心が折れることが予想されます。



▼芝とダートの比較では、私ブエナの感覚では、芝の方がマイニング向きかと思います。

芝限定なら、

芝マイニング1~3位かつ、8番人気以下の馬

は、なかなか期待値が高いと思います。


ただこれに関しても、8番人気以下なので、的中率が低すぎて途中で飽きてくる。
(私ブエナの場合ですが。)



▼距離を見てみると、芝2400mは、単勝回収率プラスですが、複勝回収率は平凡で、それほどの優位性は感じません。

ちなみに、私ブエナが主戦場としている、午後の芝レースで調べてみても、特にマイニングで有効なポイントは発見できませんでした。



▼マイニングが利益を出しにくい理由として、「複数のファクターをごっちゃに混ぜすぎ」のような気がします。

馬券で利益を出すには、「優位性のあるファクターだけを組み合わせる」という作業が効果的。

なので、プラスファクターとマイナスファクターを混ぜてしまうと、相殺されて、高期待値の部分が見えなくなるような気がするわけ。
(あくまで私ブエナの考えです)


逆に言えば、マイニングはまだまだ進化する余地があり、これから使える指数として、また復活する可能性も十分にあると思います。



▼尚、マイニングには、「タイム型マイニング」と「対戦型マイニング」の2種類があります。

ここまでで解説したのは、オーソドックスな「タイム型マイニング」でした。

「対戦型マイニング」は、新型のマイニングで、ロジックが少し改変されています。



▼「対戦型マイニング」は、各馬の能力を相対比較するファクターが加味されており、より実戦的な指数になっています。

とは言え、この「対戦型マイニング」であっても、1~3番人気の単勝回収率は、74%前後。

タイム型でも、対戦型でも、現時点ではマイニングをそのまま買っても、利益を出す事は困難であると思われます。



▼やはり指数ですから、常に「人気との乖離を狙う」という形がベターかと思われます。

マイニング1位でも、1番人気では、期待値の上昇が見込めないからです。

競馬は常に、オッズとの戦いです。
(マツリダ予想より引用)



▼ということで本日は、「競馬データマイニング」について書いてみました。

もっと徹底的に調べれば、マイニングで勝つ方法があるのかもしれませんが、マイニングだけで利益を出そうとしても、なかなか難しいような気がします。



▼マイニングに限らず、あらゆる競馬予想ファクターは、「複合的に活用」することで、その威力が飛躍的に増します。

なので、「マイニング1位を単純に買う!」のではなく、他のロジックと絡ませれば、マイニングで利益を出すことも可能かと思われます。


現時点での私ブエナの印象としては、マイニングだけで利益を出すのは、難しいのではないか?と感じました。

またマイニングで効果的な狙い目が見つかったら、シェアしたいと思います。

ブエナが使っている競馬サイトを公開

▼競馬で勝つためには、馬券知識を増やすしかない。

私(ブエナ)が、馬券知識を増やすために学んだサイトは、

やっぱり⇒『マツリダ予想』です。




マイニングの実戦活用例

▼データマイニングについての考察を続けます。

ちょっと具体的なケーススタディも見てみます。

例えば、2016年の有馬記念


1着 サトノダイヤモンド(1-5)
2着 キタサンブラック(5-1)
3着 ゴールドアクター(2-7)

(マイニングー対戦型マイニング)



はい。
()内が、マイニングと対戦型マイニングの順位です。

うーん。狙いにくいです。

ここは本命サイドの決着だったので、1位から5位まで流しても、ほとんど利益は出ません。



▼では次に、2016年のジャパンカップも見てみます。


1着 キタサンブラック(8-2)
2着 サウンズオブアース(12-7)
3着 シュヴァルグラン(2-3)

(マイニングー対戦型マイニング)



はい。
ここも厳しいですね。

サウンズオブアースのマイニング順位が低すぎて、マイニングで買うと多分2着が抜けると思います。

1位が凡走しているのも、困りどころです。



▼それでは次の事例。

2016年の天皇賞秋


1着 モーリス(8-6)
2着 リアルスティール(7-8)
3着 ステファノス(3-3)

(マイニングー対戦型マイニング)



はい。
これも厳しいです。

マイニングだけでは、どうやっても当たる気がしない。

マイニングでは、大外15番のラブリーデイが、マイニングー対戦型マイニングどちらも1位。

しかし、この府中2000mでは大外枠の期待値が低いのは明白であり、指数だけで狙ってしまうと、このような地雷を踏むことになると思うわけ。



▼ただ、シュヴァルグランやステファノスの指数順位が良いのは、なかなか使える。

上述した通り、「人気と指数の乖離」を考えると、この2頭はヒモで狙えるな、という判断に使える。

なので、やはりマイニングでも、それを盲目的に購入するのではなく、自分の予想と合わせて活用していくことが重要だと、私ブエナは思うわけです。



マイニング上位馬でも、大穴馬は回収率が上がりにくい
さて、「マイニングと人気の乖離を狙う」というのが基本戦略になるかと思いますが、これにも罠がある。

それは、「いくらマイニング上位馬であっても、あまりにも人気薄だったら、期待値が相殺されるかも」

という部分です。
(あくまで私ブエナの見解です)



▼競馬では、基本的には大穴馬は期待値が低くなりやすい。

それは、控除率と過剰人気の影響があるからです。
(マツリダ予想より引用)

だから私も、基本的な馬券構成は「中穴狙い」にして、大穴馬は深追いしないようにしているわけ。



▼単純に、長期の人気別回収率を洗ってみても、やはり13番人気以下などの超人気薄は、回収率が低くなりやすい印象。

なので大穴ゾーンは、よほどデータ的な裏付けがない限り、なかなか回収率が上がらない。

たまに大きな万馬券をゲットしても、同じ作戦で馬券を買い続ける限り、どんどん回収率は下がって利益は飲まれます。
(ブエナ経験談)



▼マイニングでも同様で、例えば、

「マイニング1位で、15番人気!」

という、オッズ乖離を発見したとする。

これはどう考えても高期待値に見える。飛びつきたくなる。

しかし、ここまで行ってしまうと、逆にリバウンドして期待値が下がることもあるのではないか?

そのように私は思うわけです。



大穴馬の期待値が低い理由
単純控除率を考えた場合、人気サイドの馬と、大穴の馬では、平均還元率が違っている気がするわけ。

ここまで書いてきたとおり、大穴サイドの馬は、控除が多めのような気がするわけです。

なので、たとえマイニング上位であったとしても、それが大穴馬である限り、基本回収率はなかなか上がってこない印象。



▼そしてそもそも、そこまでのマイニングと人気の乖離は発生しにくい、という問題もあります。

マイニングに限らず、すべてのスピード指数に言えることですが、なかなか人気との乖離を発見することができない。

これはマイニングなどの総合的な指数では特に顕著です。



▼つまり、マイニングには色々な要素が加味されているため、人気とリンクしやすいわけです。

1番人気のマイニング順位は高くなりやすく、大穴のマイニング順位は低くなりやすい。



▼このような傾向にあるため、「マイニング1位で、大穴」という馬をなかなか発見できないんですね。

たとえ発見したとしても、サンプル数が極めて少ない。

大穴馬でサンプル数が少ないのは、かなり冒険なのです。

なぜかというと、確率の収束までかなり遠くなってしまい、自分が想定した期待値に収束してくるまで、長い年月がかかってしまうからです。



▼さて、では次にまた具体的なデータを見てみましょう。


芝の重賞レース。マイニング1~3位】2015~2020年

1番人気⇒単勝回収率80%
2番人気⇒単勝回収率75%
3番人気⇒単勝回収率100%
4~6番人気⇒単勝回収率57%
7~9番人気⇒単勝回収率131%
10番人気以下⇒単勝回収率63%



はい。
マイニング1~3位の馬を、人気順に分類してみました。



▼まず、1番人気と2番人気は、単勝回収率が80%と75%。どちらも平凡です。

ここまで書いてきたとおり、いくらマイニングの順位が上位でも、それが人気馬だと、期待値的な伸びしろがなく、平均還元率に収束しやすいわけです。



3番人気は単勝回収率100%となっていますが、複勝回収率は83%なので、これは誤差の範囲内でしょう。

「マイニング1~3位の3番人気は儲かるのか!」と、早とちりしないように。



4~6番人気は、単勝回収率が57%と低いです。

このゾーンは中穴で、狙いやすい部分かと思ったんですが、マイニングと中穴は、それほど相性が良くないのかもしれない。



▼そこで、もう少し穴サイドにシフトしてみます。

7~9番人気で、マイニング1~3位の馬。

ここは狙い目になります。

7番人気、8番人気、9番人気、すべてにおいて単勝回収率がプラスになっています。

合計の単勝回収率は、131%と素晴らしい成績ですね。

複勝回収率も98%あるので、ヒモ馬の期待値として考えても、優秀なゾーンになります。



▼ではさらに、穴サイドにシフトしてみましょう。

10番人気以下の大穴馬が、マイニング1~3位だった場合。

この場合は、また回収率が大きく下がってしまいます。

13番人気で、一度大穴が出ていますが、それ以外は10番人気が1回勝っただけ。

惨憺たる成績になっています。



▼先ほども少し書きましたが、大穴サイドというのは、とにかく回収率が上がりにくいです。

人気で言えば、10番人気以下。

このゾーンは、過剰人気の影響と、控除率の影響により、平均回収率が低くなりやすいんですね。



▼これはマイニングを使う場合でも同じで、芝の重賞レースでは、あまり大穴を狙うと、回収率が下がってしまいます。

ここまで書いてきたとおり、マイニング1~3位での狙い目としては、「7~9番人気」ということになっています。

2015年から2020年までのデータですが、頭に入れておくと、マイニングで回収率を上げることができそうです。


馬券収支が向上するサイトランキング

馬券で勝つには、馬券知識を増やすしかない。
ちなみに、私(ブエナ)が馬券知識を学んだのは、
  ↓
このユニークなサイトです。


その他、馬券に役立つ情報ランキングは、こちらにまとめました。
  ↓
無料だけど使える競馬情報ランキング