2021.04.14
図書館に行ってきた。この間読んだ濱岡氏の『科学』2021年4月号の話は3回目だったので、1回目と2回目を読んだ。『科学』2020年10月と11月号である。10月号の内容は、その後データが更新されて、更に因子の回帰分析がされて、2021年4月号に繋がっている元データという感じであった。マクロな視点で各国のデータを比較している。台湾、ベトナム、韓国等の国に比べると、日本の対策は成功しているとは言い難い。人口あたりの累積検査数と人口あたりの累積陽性者数のプロットはなかなか面白い。概ね右下がりの相関性があるが、これとは外れて左下に来るのが感染対策成功組である。つまり、感染初期に徹底的に検査して感染源を絶った為に検査数そのものが少なくなっている。日本の特徴は、PCR検査の不足、第1波より大きな第2波がやってきたこと、「行動自粛」と「クラスター対策」に特化したことである。「行動自粛」は有効であった。11月号では「クラスター対策」つまり感染の連鎖の把握について各国との比較をかなり細かく調べている。濱岡氏は元々が応用物理で、マーケッティング調査の専門家らしい。その分野では「スノーボール・サンプリング」と呼ぶらしい。商品の選択に影響を与えた人を次々と辿って行って、購買意欲の源泉を探る。

・・・それはともかく、日本のクラスター対策における「濃厚接触者」の定義はかなりご都合主義的に変遷していて、WHOの推奨から見ても甘くて、不徹底であった。そのために接触感染ネットワークを充分捉え切れていなかった。例えば、未発症接触者の検査が基準に加えられたのは4/20以降であった。日本の感染対策がクラスター追跡に偏った根拠となったのは、西浦氏の論文(未査読)であったが、データが不十分で、スーパースプレッダーであるという統計的根拠が不十分である。再生産数 ν に広い分布がある、ということを証明するために、分布が無い(感染がポワッソン分布になる)という仮説を帰無仮説として、検定すると、棄却できない。そもそも感染者が多くなるとクラスター対策は不可能になるのだから、定期的な検査とかの他の対策と組み合わせるべきである。その最適化についての論文もある。とまあ、かなり批判的である。孤軍奮闘して論文を書く余裕もなかった西浦氏を責めるのは酷だと思うが、データ解析の専門家から見るとそう言わざるを得ないのだろう。

2021.04.16
「科学」2021年4月号を購入して、濱岡氏の3回目の記事を読んだ。基本的には1回目の記事のアップデートと多変数の回帰分析である。
・・目的変数は、モビリティー(Apple の乗り換え駅データ)、検査人数(厚労省データ)、新規陽性者数(厚労省データ)である。
・・説明変数は
・モビリティーに対して、(人流抑制政策、促進政策、感染状況、気象条件)、
・検査人数に対して、(検査政策、感染状況)、
・陽性者数に対して、(感染能力者数、モビリティー、気象条件、検査人数)
・・感染は陽性者数発表日の 16日前であるとしたので、従属変数はその時期の値を採用する。
・・感染能力者数は、過去14日間の積算陽性者数とする。(潜伏期間6日前後数日位でも良いかと思う)
・・感染状況は陽性者数の7日間移動平均とした(週変動を均す為)。(目的変数の陽性者数もそうしたのであろう。)
陽性者数とモビリティーは目的変数でもあり従属変数でもあるので、内部で関係している(内生変数)。
3つの線形方程式を連立させて最小二乗法で係数を評価する。2段階で最適化したらしい。
使うデータが時系列であるので、誤差項に一次の自己回帰項も入れる。
(そもそも 陽性者数~感染能力者数 というのは自己回帰式であるが、ノイズ項も隣接時刻間に相関がある、という事だろう。
R のライブラリー erer の systemfitAR を使ったということである。)

・・・結果である。
・陽性者数に対しては、感染能力者数、モビリティー、気温(負)が有意
      これは当然の結果。
・モビリティーに対しては、東京営業自粛(負)、緊急事態宣言(負)、GOTOトラベル、横浜スタジアム実験 が有意
      GOTOトラベルは第3波への誘因になった。感染者数の報道自身はあまり影響していない。
・検査人数に対しては、検査陽性者数(負)、オリンピック延期(負)、休日(負)
      感染の拡がりに応じて受動的に検査数を増やしていることが判る。
僕の感想としては、目的変数を陽性者数にするのではなくて、経時的再生産数 Rt にした方がすっきりすると思う。

  <目次へ>       <一つ前へ>     <次へ>