次は競馬だ!JRA公式データ × AIで回収率を競う ドワンゴ『電脳賞(春)』が開幕

このエントリーをはてなブックマークに追加

[PR]Ads by dwango.co.jp


はい。ドワンゴがまたなんかやらかすみたいです。

JRA公式データ配信サービス『JRA-VAN』から提供される競馬の過去レースビッグデータ(馬場,オッズ,騎手,天候,血統 etc…)を利用し、該当レースにおける仮想資金回収率を競おう!というプログラミング競技会。

その名も『電脳賞(春)』。これを明日、3/4(土)からスタートさせるんだとか。

で、当然というか何というか、機械学習を用いたエンジンで参戦するチームもあり、実はLedgeとしても興味津々だったりします。(ちなみに今回で第2回)

第2回電脳賞(春)の開催概要


  • プログラム形式:不問
  • 開催期間:2017年3月4日~4月2日、4月9日 (計12日間)
  • 対象レース:期間中の中央競馬全てのレースが対象
  • 勝敗:架空のポイント10,000ポイントを選出したレースごとに付与。これの回収率で勝敗を決める

もう『プログラム形式:不問』って時点でワクワクしかないんですが、それこそ自前のAIやニューラルネットを準備して参加するチームもあれば、ExcelとかVBAなんかでゴリっと参戦するチームもあり…という。

なかなかにカオスな感じ。

詳細は本記事下部のチームリストを見ていただくとして、本当に(色々な意味で)どうなるかわからない企画になっています。

開幕戦は生放送なんで、まぁ多分『色々』起こるとは思いますが、当日を楽しみに待つとしましょう。( >>公式生放送へ

第1回大会で叩き出した成果だけでもかなりのもの。さて、今回は…?

なお、『電脳賞(春)』開催期間中の実際進行は以下のような感じ。

  • 土日および祝日に開催される中央競馬の全レースを対象に『このレースで当てに行きます!』と各チームが宣言
  • 運営から架空のポイント10,000ポイントを受領
  • これを予想した馬券に賭けたと仮定して「勝ち馬」ではなく「馬券」を予測
  • レース終了後の回収率の多寡を各チーム間で競う

つまり、どのレースを選ぶのか?どの馬券を選ぶのか?ってなところから、データ解析バトルが始まっていくわけですね。(※ 馬券の券種が良く分からんって方はこちら

ちなみに第1回大会でのハイライトトピックス

  • 1日の選択レースをパーフェクト的中
  • 競技会中最高配当の80.3倍を的中
  • 中京開催の選択レース的中率が脅威の77.8%
  • 3日連続回収率100%超達成

第1回大会は東工大生チームとお茶の水女子大生チームの2チーム参戦だったんですが、それでもこの結果。 結構すごいことやってくれてます。

で、第2回大会となる今回は参戦するチーム数も前回の4倍に増加。全8チームのガチバトル。プログラムそのものや解析アプローチはもちろん、『どんな記録が生まれるのか?』という観点でも要注目ですね。

注目の第2回の参戦チームはこんな感じ。濃い。

以下に今回の参戦チームを、ソフトの紹介と一緒にズラッと並べてみました。が、これは…ちょっとスゴイのがそろっちゃってます。

#TeamIntro / softname & logic
1蛸坊主30年に渡る競馬歴で競馬ライターとしても活躍するITエンジニア
ソフト:優先出走と期間業績によるレース分析(MS-ACCESS)
競走条件毎に予想ファクターの重み付けを定義。優先出走順位決定法と期間業績値がベース
2W.A.R.S. (ウォーズ)競馬予想プログラムやファミコン用競馬ソフトの開発などで活躍する今大会最高齢エンジニア率いるチーム
ソフト:HRPTV5C with 五行(C#、専用言語 ”GoGyo”)
独自のソフト「自然」「HRPTV5C」などの予想指数を配合して、五行で予想
3ニコちゃんAI競馬SPAJAM2016最優秀賞を獲得したエンジニア・テリーと小学生エンジニア・ニコちゃんの親子チーム
ソフト:ニコちゃんAI競馬(C#)
馬単体の強弱から算出する軸馬予想とレース展開を見て2着候補を出す算定方式
4チームふへん者帰国したばかりのリーダーと、電脳賞の為にデータ分析職に転職したプログラマー、一橋大学生の異色チーム
ソフト:松風(Python)
ニューラルネットワークを用いた独自算定
5【Su/Ji】 (すじ)20年間指数理論の研究を行っている競馬好きで、今大会唯一のプログラミング未経験者
ソフト:abis(VB.net)
競馬場、賞金、距離、血統、生産牧場から「格」を算出する独自ロジック
6CHANCE(チャンス)SNSサービスやカメラの商品開発などの経歴を持つ女性リーダーが率いるチーム
ソフト:SIVA(Python, JAVA, node.js)
機械学習、重回帰分析をメインとしたロジックを使用
7ニアークティック元世界最大級ITコンサルファームに所属していた競馬好きITストラテジスト
ソフト:ポテイトーズ(vb,access,excel)
戦績、騎手、血統などからパフォーマブルスピード指数を重回帰分析により算出
8ワセダパラドックス早稲田大学に通う競馬好きエンジニアの先輩後輩コンビ
ソフト:Sortie(R)
人間の予想をベースに、上がりの速さや展開の利などを考慮して予測を行うモデル

ザッと眺めるだけでも、現役競馬ライター兼エンジニアファミコンソフト開発者小学生エンジニアチームがAIで参戦この大会のために転職した凄腕エンジニア…。

さらにプログラミング未経験の研究者重回帰分析を駆使する女性エンジニア本職のITストラテジスト現役早稲田大生のチーム…と。なんでしょうこのバーリトゥード感。

正直ものすごくコメントがしにくい んですが、ハイレベルな戦いが楽しめそうなのは、どうやら間違いなさそうです。(ツッコミどころ多すぎ)

結局どのプログラムも、やっているのは「結果予測」のための「情報の重み付け」なので…

今回の場合は『競馬の勝ち馬券を当てる』という切り口ですが、結局のところ全てのプログラムがやっているのは

  • どのデータが結果に対し重要な要素とみなすか
  • その掛け合わせのパターンをどう出すか
  • さらに出したパターンの重要度をどうつけるか

言い切ってしまえば、こういうことなんですよね。

つまり『巨大な過去データから、予測(Prediction)をどう出すか。どう精度を上げていけるか』ってところで、ガチなバトルをやってみよう。みたいな話。

大手企業なんかで盛んに行われている「ビッグデータ活用の現場でやってること」そのものなんですよね。

通常であればほとんど触れることも知ることもできない、データサイエンティストやエンジニア同士のガチな解析&予測バトル…。として見ても、なんとも楽しみなこの企画。

Ledgeでは、引き続き明日からの第2回大会を継続レポートしていく予定ですので、『プログラムはどこまで競馬の勝ち馬券を当てられるのか?』ちょっと気になった方は、ぜひ公式チャンネルを追っかけながら続報をお待ちいただければ。

ではまたー。