事例紹介:選挙の要因の発見

選挙の要因の発見に挑戦

Trial Toolを使ってみよう!

哺乳類の事例では動物の情報を学習することで、哺乳類の判別を行うことができました。

ここでは選挙の当落要因の発見を行ってみましょう。


当選者の特徴は何か

選挙で当選する候補者、落選する候補者の特徴は何でしょうか。

  • どの政党に属しているのか
  • 現職候補者なのか、新人の候補者なのか
  • 若手なのか、重鎮なのか
  • どのような政策を推しているのか

など、様々な要因が考えられます。

また、選挙は地方によって強く支持される政党が違ったりします。そういった組み合わせを1つ1つ考えて、当選に重要な要因を見つけ出すのは大変です。

Wide Learning™を使うと、過去の選挙結果から当選において役に立つ特徴の組み合わせを簡単に見つけることができます。

そのような特徴の組み合わせを知ることで、有権者がどのような基準で投票する人を決めているかがわかり、立候補者は有権者が何を求めているのかを知ることができます。


今回使うデータ

今回、デモ用に作成したデータを使って、Wide Learning™ Trial Toolで当選者の特徴を見つけてみましょう。

Wide Learning™ Trial Toolを使って選挙当落予測行うためには、下記の2つのデータが必要ですので、リンク先のファイルをダウンロードしてご利用ください。

なお、登場する人物・団体・名称等は架空であり、実在のものとは関係ありません。

選挙事例の学習用データ:Wide Learning™に学習させるためのデータ(election_train.csv)

選挙事例の予測用データ:Wide Learning™に予測させるためのデータ(election_test.csv)

学習用データには、架空の選挙に対する当選者が219人分、落選者が456人分、合計675人分の様々な情報が表の形式で格納されています。正解ラベルである当選の列が1であれば当選、0であれば落選であることを表します。

例えば、学習用データの1行目には富士通太郎さんに関する以下のような情報が格納されています。

名前 富士通 太郎さん   年齢 67歳
性別 男性   政党 諸派
ブロック 東海BL   当選回数 3回
新人現職元職 元職   出生地=選挙区 NO

学習用データの詳細な内容はWide Learning™ Trial Toolの「1-3. 学習用データの確認」から確認できます。

データの確認

学習用データのアップロード

Wide Learning™を利用するには、AIに学習用データをインプットして学習させる必要があります。先程ダウンロードした選挙事例の学習用データをWide Learning™ Trial Toolにアップロードして中身を確認してみましょう。


アップロードした学習用データの中身を見てみよう

学習用データをアップロードすると、そのデータの内容が表の形式で表示されます。1つの行が候補者一人のデータを表します。

学習用データの統計情報は「1-3. 学習用データの確認」から確認することができます。詳しくは哺乳類判別事例の「統計情報を見よう」を御覧ください。

選挙の当落に影響を与える要因は?

重要な項目の組み合わせを生成

「重要な項目の組み合わせを生成」というボタンをクリックしてください。(生成には少し時間がかかります)

生成が終わると、Wide Learning™が重要(選挙当落予想の判別に役立つ)と判断した項目の組み合わせが表の形式で表示されます。

1つの行が1つの組み合わせの情報を表します。一番左の「重要な項目の組み合わせ」の列が、Wide Learning™が見つけた重要な項目の組み合わせを表します。

それでは、発見した重要な項目の組み合わせをもとに、AIに学習をさせてみましょう。「重要な組み合わせに重みをつける」というボタンを押してください。


重要な組み合わせの確認

学習が終わると、先程確認した重要な項目の組み合わせに対してどのくらいの大きさの重みがついているかを見ることができます。

ここで、「重み」とは、その項目の組み合わせが、当選かどうかを判別するためにどのくらい重要な要因になるかを数値で表したものです。

POS(=Positive)の組み合わせは、候補者が当選であると判別するための重要な根拠となります。

一方、NEG(=Negative)の組み合わせは、当選でない(=落選)と判別するための重要な根拠となります。

学習結果から当落要因を発見

では、今回の選挙事例において発見された重要な組み合わせを見てみましょう。

当選に寄与する特徴

「3-1. 全体の学習結果」の表の右上でPOSが選択されていることを確認してください。

POSでは当選の判定に寄与する特徴の組み合わせを確認できます。POSの項目にはどのようなものがあるでしょうか。

「出身大学_C大学 ∧ 学部_経済学部」は、C大学の経済学部からは政界進出する人が多いことを表す組み合わせです。

「主張_健康医療_あり∧主張_福祉介護_あり ∧ 主張_年金_あり」という組み合わせからは高齢者問題、老後の年金などに人々は関心があることが伺えます。

また、「年齢>=60.0∧当選回数>=3.0」は当選者がベテランであることを表す組み合わせです。

AIですべての組み合わせを調べることで、一見関係のなさそうな項目の組み合わせからなる特徴も見つけ出せます。


落選に寄与する特徴

表の右上の「NEG」をクリックしてください。すると、NEGの判定に寄与する組み合わせを確認できます。

「ブロック_北関東BL ∧ 主張_子ども・子育て_なし」が出現していることがわかります。このことから北関東の有権者は子ども・子育てに関する関心を強く持っているのかもしれません。

「ブロック_東北BL ∧政党_B党」からは、東北地方ではB党の支持率が低いことが見て取れます。

また「ブロック_四国BL ∧ 主張_夫婦別姓_なし」「ブロック_四国BL ∧ 主張_健康医療_あり」「ブロック_四国BL ∧ 当選回数>=3.0」など、「ブロック_四国BL ∧ 〇〇」の形をした項目が数多く見当たります。このことから四国地方は他の地方と比較した際に当落パターンが異なっていることが推測されます。


個別の候補者の当落要因を確認する

「3-2. 個別の学習結果」をクリックしてください。

ここでは、学習用データの中の1つ1つについて、POS/NEGに寄与する組み合わせにどのようなものがあるか、また、その結果の当落予測を確認することができます。


個別の項目「30 谷本 裕人さん」を調べる

谷本 裕人さんの結果を見てみましょう。谷本 裕人さんは実際に当選しており、AIの計算結果はPOSを表すピンクの項目のみからなっており、当選となっています。では、当選と予測する根拠となる重要な項目の組み合わせを確認してみましょう。

谷本 裕人さんには重要な組み合わせとして、「年齢>=60.0∧当選回数>=3.0」や「主張_健康医療_あり∧主張_福祉介護_あり ∧ 主張_年金_あり」があり、当選であると予想されています。これらの組み合わせは実際に先ほど確認した当選に重要な組み合わせとなっていますね。


個別の項目「277 佐野 隆弘さん」を調べる

次に佐野 隆弘さんの結果を見てみましょう。佐野 隆弘さんは、NEGを表す青の重みが大きく、落選となっています。では、「NEG」をクリックして、落選と予測する根拠となる重要な項目の組み合わせを見てみましょう。NEGの重要な組み合わせとして、先ほど確認した「ブロック_北関東BL ∧主張_子供・子育て_なし」などが出現しています。

このように、Wide Learning™を用いることで、当落の根拠となる重要な項目の組み合わせを確認することができます。

ほかの候補者についてもどのような要因で当選・落選したのかを確認してみてください。

新たな選挙に関する予測

先ほど学習した学習をしたAIを用いて、新規の候補者に対する当落予測をしてみましょう。

先ほどダウンロードした予測用データには神奈川県の候補者6人の情報が入っています。

この6人の候補者のうち、2人が当選するとします。このとき、どの候補者の当選する可能性が高いでしょうか。Wide Learning™ Trial Toolに予測用データをアップロードして予測をしてみましょう。

予測の結果を確認

「5-1. 個別の予測結果」では、予測データにある候補者に対する結果やスコアを確認することができます。スコアが0.5を超えたときに、結果がPOS(当選)となります。

当選確率の高い順=スコアの高い順となるため、今回の神奈川県の例では石原 克己さん、谷口 佐和さんが当選確率の高い二人となります。学習用データと同様に各候補者を選択することで、当落予想の根拠となる特徴の組み合わせを確認することができます。


実際の選挙に関する当落予測

今回は事例紹介のために作成されたデータを用いて学習を行いましたが、現実のデータに対しても同様の解析を行うことができます。Wide Learning™を用いて2019年の参議院選の当落予測をした案件については以下を御覧ください。

AI による国政選挙の当落予測フレームワークの提案


Trial Toolを使用してみる

会員登録不要、無料でご利用いただけます。
さあ、Wide Learning™に触れてみよう!