事例紹介：選挙の要因の発見

選挙の要因の発見に挑戦

Trial Toolを使ってみよう！

哺乳類の事例では動物の情報を学習することで、哺乳類の判別を行うことができました。

ここでは選挙の当落要因の発見を行ってみましょう。

当選者の特徴は何か

選挙で当選する候補者、落選する候補者の特徴は何でしょうか。

どの政党に属しているのか
現職候補者なのか、新人の候補者なのか
若手なのか、重鎮なのか
どのような政策を推しているのか

など、様々な要因が考えられます。

また、選挙は地方によって強く支持される政党が違ったりします。そういった組み合わせを１つ１つ考えて、当選に重要な要因を見つけ出すのは大変です。

Wide Learning™を使うと、過去の選挙結果から当選において役に立つ特徴の組み合わせを簡単に見つけることができます。

そのような特徴の組み合わせを知ることで、有権者がどのような基準で投票する人を決めているかがわかり、立候補者は有権者が何を求めているのかを知ることができます。

今回使うデータ

今回、デモ用に作成したデータを使って、Wide Learning™ Trial Toolで当選者の特徴を見つけてみましょう。

Wide Learning™ Trial Toolを使って選挙当落予測行うためには、下記の2つのデータが必要ですので、リンク先のファイルをダウンロードしてご利用ください。

なお、登場する人物・団体・名称等は架空であり、実在のものとは関係ありません。

選挙事例の学習用データ：Wide Learning™に学習させるためのデータ（election_train.csv）

選挙事例の予測用データ：Wide Learning™に予測させるためのデータ（election_test.csv）

学習用データには、架空の選挙に対する当選者が219人分、落選者が456人分、合計675人分の様々な情報が表の形式で格納されています。正解ラベルである当選の列が1であれば当選、0であれば落選であることを表します。

例えば、学習用データの1行目には富士通太郎さんに関する以下のような情報が格納されています。

名前	富士通太郎さん	年齢	67歳
性別	男性	政党	諸派
ブロック	東海BL	当選回数	3回
新人現職元職	元職	出生地＝選挙区	NO

学習用データの詳細な内容はWide Learning™ Trial Toolの「1-3. 学習用データの確認」から確認できます。

データの確認

学習用データのアップロード

Wide Learning™を利用するには、AIに学習用データをインプットして学習させる必要があります。先程ダウンロードした選挙事例の学習用データをWide Learning™ Trial Toolにアップロードして中身を確認してみましょう。

アップロードした学習用データの中身を見てみよう

学習用データをアップロードすると、そのデータの内容が表の形式で表示されます。1つの行が候補者一人のデータを表します。

学習用データの統計情報は「1-3. 学習用データの確認」から確認することができます。詳しくは哺乳類判別事例の「統計情報を見よう」を御覧ください。

選挙の当落に影響を与える要因は？

重要な項目の組み合わせを生成

「重要な項目の組み合わせを生成」というボタンをクリックしてください。（生成には少し時間がかかります）

生成が終わると、Wide Learning™が重要（選挙当落予想の判別に役立つ）と判断した項目の組み合わせが表の形式で表示されます。

1つの行が1つの組み合わせの情報を表します。一番左の「重要な項目の組み合わせ」の列が、Wide Learning™が見つけた重要な項目の組み合わせを表します。

それでは、発見した重要な項目の組み合わせをもとに、AIに学習をさせてみましょう。「重要な組み合わせに重みをつける」というボタンを押してください。

重要な組み合わせの確認

学習が終わると、先程確認した重要な項目の組み合わせに対してどのくらいの大きさの重みがついているかを見ることができます。

ここで、「重み」とは、その項目の組み合わせが、当選かどうかを判別するためにどのくらい重要な要因になるかを数値で表したものです。

POS(=Positive)の組み合わせは、候補者が当選であると判別するための重要な根拠となります。

一方、NEG(=Negative)の組み合わせは、当選でない（＝落選）と判別するための重要な根拠となります。

学習結果から当落要因を発見

では、今回の選挙事例において発見された重要な組み合わせを見てみましょう。

当選に寄与する特徴

「3-1. 全体の学習結果」の表の右上でPOSが選択されていることを確認してください。

POSでは当選の判定に寄与する特徴の組み合わせを確認できます。POSの項目にはどのようなものがあるでしょうか。

「出身大学_C大学 ∧ 学部_経済学部」は、C大学の経済学部からは政界進出する人が多いことを表す組み合わせです。

「主張_健康医療_あり∧主張_福祉介護_あり ∧ 主張_年金_あり」という組み合わせからは高齢者問題、老後の年金などに人々は関心があることが伺えます。

また、「年齢>=60.0∧当選回数>=3.0」は当選者がベテランであることを表す組み合わせです。

AIですべての組み合わせを調べることで、一見関係のなさそうな項目の組み合わせからなる特徴も見つけ出せます。

落選に寄与する特徴

表の右上の「NEG」をクリックしてください。すると、NEGの判定に寄与する組み合わせを確認できます。

「ブロック_北関東BL ∧ 主張_子ども・子育て_なし」が出現していることがわかります。このことから北関東の有権者は子ども・子育てに関する関心を強く持っているのかもしれません。

「ブロック_東北BL ∧政党_B党」からは、東北地方ではB党の支持率が低いことが見て取れます。

また「ブロック_四国BL ∧ 主張_夫婦別姓_なし」、「ブロック_四国BL ∧ 主張_健康医療_あり」、「ブロック_四国BL ∧ 当選回数>=3.0」など、「ブロック_四国BL ∧ 〇〇」の形をした項目が数多く見当たります。このことから四国地方は他の地方と比較した際に当落パターンが異なっていることが推測されます。

個別の候補者の当落要因を確認する

「3-2. 個別の学習結果」をクリックしてください。

ここでは、学習用データの中の1つ1つについて、POS/NEGに寄与する組み合わせにどのようなものがあるか、また、その結果の当落予測を確認することができます。

個別の項目「30 谷本裕人さん」を調べる

谷本裕人さんの結果を見てみましょう。谷本裕人さんは実際に当選しており、AIの計算結果はPOSを表すピンクの項目のみからなっており、当選となっています。では、当選と予測する根拠となる重要な項目の組み合わせを確認してみましょう。

谷本裕人さんには重要な組み合わせとして、「年齢>=60.0∧当選回数>=3.0」や「主張_健康医療_あり∧主張_福祉介護_あり ∧ 主張_年金_あり」があり、当選であると予想されています。これらの組み合わせは実際に先ほど確認した当選に重要な組み合わせとなっていますね。

個別の項目「277 佐野隆弘さん」を調べる

次に佐野隆弘さんの結果を見てみましょう。佐野隆弘さんは、NEGを表す青の重みが大きく、落選となっています。では、「NEG」をクリックして、落選と予測する根拠となる重要な項目の組み合わせを見てみましょう。NEGの重要な組み合わせとして、先ほど確認した「ブロック_北関東BL ∧主張_子供・子育て_なし」などが出現しています。

このように、Wide Learning™を用いることで、当落の根拠となる重要な項目の組み合わせを確認することができます。

ほかの候補者についてもどのような要因で当選・落選したのかを確認してみてください。