続・Google検索件数による2013都議選の結果予想を振り返る
前回の記事によると、Google検索件数による候補者予想は、まともに的中したのが千代田区・台東区・三鷹市・青梅市・小平市・南多摩の6選挙区だけでした。どうやら都議選においては、各選挙区の当選者をGoogle検索件数によって導き出すのは困難なようです。
ですが、これで終わってしまってはちょっと面白くないので、いくつかのパラメータについてGoogle検索件数を軸に検討してみたいと思います。
Google検索件数と得票数に相関はあるか?
相関関係は見られませんでした。
↑のグラフは、全候補者のGoogle検索件数と得票数の関係を記したものです。検索件数が少なくても得票数が多い人はいるし、逆もまた然りです。
ただ、これだと選挙区ごとの規模が考慮されておらず不公平なので、得票数ではなく得票「率」で比較することを試みました。さらに、当選者数の数が多い選挙区はその分当選ラインが下がるので、得票率に当該選挙区の当選者数を掛け、さらに10を掛けた値を用いました。この値は、得票数を各選挙区における供託金没収点で割った値に等しく、これを没収点比と呼ぶことにします。
全候補者のGoogle検索件数と没収点比の関係は、次のグラフの通りです。
都議選の候補者に関して言えば、Google検索件数から得票数、あるいは当該選挙区での有利/不利を占うことはできなさそうです。
ところが、Google検索件数の多寡ごとに候補者の当選率を調べると、興味深い現象が見られました。次のグラフをご覧ください。
Google検索件数が1000件〜100000件の候補者は比較的当選率が高いことが分かりました。一方、1000件未満、10万件以上の候補者は当選率が比較的低いことが分かりました。
都議選で当選するためには、Google検索件数は最低限1000件はあったほうがよいが、それ以上増やす分にはあまり当選率に寄与しない、ということなのかもしれません。
政党別に、Google検索件数による当落予想の精度を検討する。
今回の都議選では、自民党と公明党は全員当選してしまったので、ここでは、共産党・民主党・みんなの党・日本維新の会について、当落予想の精度を検討します。
【共産党】
実際に当選 | 実際に落選 | 当選率 | |
---|---|---|---|
当選すると予想 | 10 | 7 | 59% |
落選すると予想 | 7 | 18 | 39% |
このサイトで、当選率について有意差検定を行った結果、5%水準で有意(統計量Z=2.01)。
【民主党】
実際に当選 | 実際に落選 | 当選率 | |
---|---|---|---|
当選すると予想 | 12 | 17 | 41% |
落選すると予想 | 3 | 12 | 20% |
有意差検定を行った結果、有意差なし(統計量Z=1.4)。
【みんなの党】
実際に当選 | 実際に落選 | 当選率 | |
---|---|---|---|
当選すると予想 | 5 | 7 | 42% |
落選すると予想 | 2 | 6 | 25% |
有意差検定を行った結果、有意差なし(統計量Z=0.78)。
【日本維新の会】
実際に当選 | 実際に落選 | 当選率 | |
---|---|---|---|
当選すると予想 | 2 | 9 | 18% |
落選すると予想 | 0 | 19 | 0% |
有意差検定を行った結果、10%水準で有意(統計量Z=1.91)。
ぶっちゃけ、サンプル数も少ないし、そもそも当選率が少なすぎて比較にならないという話もありますが、共産党においては、Google検索件数で優位に立っていた候補者が当選しやすい傾向にあるのかもしれません。
Google検索件数による選挙予想は、選挙区ごとの事情や党派に関するバイアスが全く考慮されていないのが最大の問題点です。AKB総選挙のように、それらの事情が排除されればかなり上手く見積もれるかもとは思うのですが。
参院選でも同様の選挙予想をやってみたいと考えていますが、的中率が比較的高そうなのは、全国区で非拘束名簿式な比例代表制でしょうね。個人名を書かれる人(知名度が高い人)ほど当選しやすい制度なので。