新型コロナウィルスに効果を示す施策の発見に挑戦
Trial Toolを使って各国/地域の施策の効果を分析してみよう
これまでの事例で確認したWide Learning™の要因分析機能を用いて、国/地域の地域特性(以下、本稿では特性と表記します) と実施する様々な施策を分析し、それぞれの特性に対して新型コロナウィルス感染拡大抑制に有効な施策の組み合わせの発見を試みましょう。
この事例記事は、2020年8月時点のデータに基づいて作成しています。
経済活動の振興策で感染者数は拡大する?
2020年の春ごろから、新型コロナウィルスことCOVID-19の感染者が世界中に拡大し、その後も感染者の数は増え続けて、各国/地域の行政は事態の収束を目指して様々な取り組みを行ってきました。
例えば人々の移動や経済活動についても、感染リスクを避けるために制限すべきか、停滞した経済を活性化させるために振興するかが、世界中で議論を呼びました。特にヨーロッパでは、2020年の夏からの感染再拡大に伴う各種制限への反発も多く、引き続き大きな社会問題となりました。
日本でも経済活動振興を目的とした国内移動の支援施策が人々の大きな関心事となり、観光産業などに歓迎されるものの、不安の声を寄せる人々の声もニュースになったことは、皆様もご存じのことと思います。エンターテインメント業界の皆さんやそれらのファンの皆さんの中には、もっと早い制限緩和を望んでいた方もいらっしゃったかもしれません。
同じ施策でも効果の出方が違う地域がある?
ソーシャルディスタンスの維持による感染拡大抑制の施策には、交通機関の閉鎖や外出制限などがあります。
これらの施策が有効に働くか否かは、どうすれば分かるでしょうか。
例えば、同じ外出制限を行った国でも、日本やニュージーランドのようにあまり感染者が増えなかった地域もありますが、アメリカ、インド、ブラジルのように何百万人もの感染者を出した地域もあります。
関係性を掴むのは難しい
これまでの研究でも、アジア地域・ヨーロッパ地域といった「地域区分」や「BCG接種率」、「一人当たりGDP」などが感染拡大に関係しうるとされる要因の候補とされていました。実際には、これらの特性の組み合わせに依存している可能性もありますし、様々な施策を組み合わせて実施することの相互作用も考えられます。
それぞれの特性と施策が、どのように感染拡大の抑制に関係しているのかを確認するのは、簡単なことではなさそうです。
感染拡大の抑制に関係する「特性と施策の重要な組み合わせ」を発見
これらを数十個程度の要因として分析すると、組み合わせの場合の数は2の数十乗通りとなり、この規模になると、コンピュータを使っても処理困難な量になります。
(詳しくはWide Learning™の4つの特徴をご覧ください)
このため、従来の多くの研究では人が予め分析すべき組み合わせ範囲を選び、量を絞り込んで分析を行っています。しかし、この作業のためには深く専門的な知識が必要となりますし、新型コロナウィルスのように未知の問題に対しては、過去の知見がヒントになるとは限らず(※1)、重要なチェック対象を見逃してしまうかもしれません。
Wide Learning™を使えば、膨大なデータから手掛かりを速く見つけられる
Wide Learning™は探索順序の効率化や探索の中間結果の有効活用によって、このような天文学的な分析要因の組み合わせの全体を探索し、高速に重要な組み合わせを発見します。
今回は、各地域の感染者数の拡大率を元に、
「ある地域の特定の期間に感染拡大を抑制できていた (1:POS = Positive) か、否 (0:NEG = Negative) かの情報」を正解ラベルとして、上記施策の実施状況と該当地域の特性情報で学習させることで「どのような特性の地域にどのような施策の組み合わせが関係したか」を発見することを目指します。
※1: WHOは、「この新型コロナウィルスはこれまでのSARS、MERS、インフルエンザのいずれとも異なる独特な特徴を持っている」という声明 を出しています。
今回使うデータ
Wide Learning™ Trial Toolを使うためには、下記のデータが必要ですので、リンク先のファイルをダウンロードしてご利用ください。
感染拡大抑制施策学習用データ: Wide Learning™に学習させるためのデータ(COVID_train.csv)
感染拡大抑制施策予測用データ: Wide Learning™に予測させるためのデータA 未実施から施策を増やした場合(COVID_test_a_increment.csv)
感染拡大抑制施策予測用データ: Wide Learning™に予測させるためのデータB 実際の実施施策を前倒しした場合(COVID_test_b_advance.csv)
以下の表1は、2020年3月25日のアメリカについて、オープンデータから収集した特性と施策実施状況を表にしたものです。世界中の国/地域の感染者数の拡大時期前後についてこのようなデータを集めて、Wide Learning™によって分析を行います。
データラベル | 国_基準日 | アメリカ_2020/03/25 |
---|---|---|
説明変数 | [特性]地域 | 北アメリカ地域 |
[特性]BCG予防接種受診率 | ― | |
[特性]一人当たりGDP | 19443ドル超過 | |
[特性]65歳以上人口比 | 8.5%以上 | |
[特性]平均寿命 | 78.7歳以下 | |
[特性]喫煙者人口比 | 14.3%超過 | |
[特性]都市部人口比 | 55.3%超過 | |
[特性]給与所得者比 | 76.8%超過 | |
[施策]学校閉鎖後 | 3週間以降 | |
[施策]集会制限後 | 2~3週間 | |
[施策]営業休止後 | 2~3週間 | |
[施策]外出制限後 | 3週間以降 | |
[施策]国内移動制限後 | 3週間以降 | |
[施策]交通機関閉鎖後 | 3週間以降 | |
[施策]公共行事中止後 | 3週間以降 | |
目的変数 | 正解ラベル | 1 |
データの詳細
施策に対する説明変数「各施策後2~3週間/3週間以降」については、人がウィルスに感染してから潜伏期間を経て発症、検査をして結果が出るまでを約2週間と考え、施策実施後の1週間以内に感染に影響したか、それ以降に影響したかを判断するための指標として作成しています。
各国/地域の施策実施状況と報告された感染者数、および特性データは、Oxford大学のCovid-19 Government Response Tracker(※2)を利用します。また国/地域の特性として、世界銀行のIndicatorsデータ(※3)も利用しました。
より詳細なデータの内容や目的変数の作り方については、本稿の末尾に記載する補足説明と、関連論文の情報をご参照ください。
※2:Oxford Covid-19 Government Response Tracker (OxCGRT)
※3:Indicators - World Bank Open Data