2011年11月23日水曜日

いざ統計分析。その結果は…


こんばんは。玉置卓也です。

怒涛の10月が過ぎたと思えば、さらに怒涛の11月も終わります。

最近は朝の10時から夜の12時までひたすら研究をしています。

充実していると体感時間も短くなるのですね。

今日みたいなせわしなく過ぎる1日が

長く大きく感じられる事を信じて走り続けたいと思います。

さて、今回は研究の要で最大の難所、114時間も缶詰になることになった元凶!

統計分析について触れたいと思います。

アンケートの結果が統計分析で検証される「仮説」となって活きてくるところなので、大事なフェーズです。

統計分析とは一言で表すと、「直感ではつかめない法則を明らかにすること」

ここで皆さんに一つ質問をします。



「アイスクリームの消費金額第1位の都道府県はどこだとおもいますか?」

検索窓にマウスを持ってったりせず、直感で考えてみてください。




正解は石川県です。

きっとみなさん「まさか」と思われたことでしょう。

日本の最南端、年中半袖の島沖縄県は全国47位です。

そう。最下位。

暑いからといって、アイスクリームが売れるわけじゃないんです。

それよりも和菓子で有名な石川県のような甘いものを食べる習慣が根付いている地域ほどアイスクリームが売れるのかもしれません。

不思議ですよね。



例えばこんな直感からでは想像がつかない事象の原因を探ることが出来るのが統計分析です。

私たちが今回分析するのは、アイスクリームではなく

「どんな試合が観客の関心を惹くか」

明らかにするためには、まず3つのことを考えます。

観客の関心を何で表わすか

試合の特徴を何で表わすか

因果の方向

については、統計分析では「試合のある特徴」が1増えると「観客の関心」がいくつ増えるかといった説明を行うので、

どんなことでも全部数字で表さないと分析ができないのです。

は、例えば「勉強を良くする生徒は頭がいい」という因果関係があったとします。

でも、「頭がいい生徒だから勉強を良くする」とも言えなくもないです。

こんなこともあるので、因果関係の方向が自分たちの明らかにしたいことと逆ではないか考えないといけないのです。

今回は

観客の関心を何で表すかサーキットへの入場者数で表す

試合の特徴を何で表すか各ドライバーの獲得ポイントの均衡度合で表す

因果の方向過去の試合の特徴が未来の試合の入場者数影響を与える

ということにしました。

私たちが立てた仮説は3

「全ドライバーが均衡していれば入場者数は多い」

「上位ドライバーが均衡していると入場者数は多い」

「スタードライバーが均衡していると入場者数は多い」

この2つ目と3つ目はフィールドワークから導き出しました。

アンケートで60%の方が「表彰台争いが熾烈な試合が見たい」と答えられたので、
上位のドライバーで均衡が起きていればいいという仮説は実際に存在するのではと考えました。

現地には帽子や服など、様々な応援グッズを身にまとったファンがいます。

その中でも真っ赤なユニフォームを着たフェラーリファンと白いマクラーレンファンが大半を占めていて、

アンケートで40%を超える方が「応援しているドライバーが健闘しているレース」がおもしろいと回答したためです。

フェラーリとマクラーレンはF1を代表する強豪チーム。

プロ野球でいえば巨人、阪神

サッカーでいえばアントラーズとグランパス

そこに所属するドライバーも年間チャンピオン獲得経験者がうようよしています。

つまり、フェラーリ、マクラーレンのファンが入場者数の多くを占め、そのうちの多くの人が応援するドライバーがいいレースをするとおもしろいと感じているんです。

その応援するドライバーは輝かしい戦績を持つスタードライバーなのです。

ということは、スタードライバーがいい試合をすれば、ファンの関心をひけるということなのです。



準備はこれで完了です!いざ分析を!

100時間ほどかけたでしょうか。

結果は、

「上位ドライバーが均衡していると入場者数は多い」

「スタードライバーが均衡していると入場者数は多い」

が支持されました。

感動の結末!のはずですが、いまいち涙が出ません。

それもそのはず、100時間で行った分析は1000を超えます。

その中でクリティカルな結果は20ほどなのです。

これが統計分析の性。

とはいえ努力あるのみです。



つづく

0 件のコメント:

コメントを投稿