2020.12.23
栗田順子『新型コロナウイルス感染症第一波のパンデミックシミュレーションー数理モデルからの振り返り』(技術評論社)を読んだ。この人は2009年のSARSの時に保健所に居て、その後感染研の人達に教えてもらって、解析モデルを作って本を書いていたらしい。その時のモデルが、ibmモデルと言って、現実の人々の動きを職場や家庭という相互作用の場において多数の区画に分けて扱うモデルらしい。複雑なので現実を描写する為にデータの蓄積とパラメータ最適化の時間がかかり、今回のCOVID-19には間に合わないので、SIRモデルを使ったという。なお、これは6月までのデータに基づいた解析である。

      感染状況は発症日基準で見る。発症していても発症日が記録されていない場合があるので、発症日から検査日までの経過日数分布を求めておいて、それと同じ分布であるとして発症日を当てがっておく。この発症日基準の感染者数を流行曲線と呼ぶ(以下数式で表現する場合があるので、ここでは Q(t) とする)。(これは東京都のHPで通常の報告日基準の曲線と比較して見る事が出来る。)初期の分析では、武漢のデータと武漢滞在日本人のデータを使って、荒っぽい仮定を置いている。潜伏期間は3,4,5,6日目にそれぞれ20%づつの分布。陽性者中の重症、軽症、無症候の比率は 2:11:3 で感染性は重症者も軽症者も同じで、無症候者はその半分。SIRモデルをそのまま使うと初期のデータから R0 を推定して、感染が全人口に広がる様子を計算することになる。勿論これは現実とはかけ離れているから、何100倍もの感染者が『予測』されることになる。その違いの原因を後ほど第6章で考察している。まあ、これは自粛効果であることは誰もが知っていることなのだが。。。

       第3章は実効再生産数の推定の話である。潜伏期間には実測データを使う(ここでは Inc(t) とする)。感染日基準の感染者数を P(t) として、(流行曲線)Q(t)=Σs Inc(t-s)P(s) から逆算で求める。式の意味は、日付 s で感染が起こり、その t-s 日後に発症する。それを日付 s について積算(Σs)すれば、日付 t での発症者数が得られる。Q(t) と Inc(t) から P(t) を逆算するにはブートストラップ法を使う。 特定の分布関数形を想定しないで逆算する方法である。発症日基準の感染性の分布(f(t)とする)は発症日が30%、翌日が20%、その後5日間は10%づつとしている。この頃既に発症日前の感染が45%という論文が出ていたが、まだ信用していなかったらしい。というか、それを想定すると現状のデータでは発症日が記録されていないので、そもそも Q(t) が得られない。Σs f(t-s)Q(s)=F(t) は集団全体としての感染力の時間変化である。ただし、f(t) は規格化されているので、感染力そのものではない。規格化されていなければ、その積分は感染者が感染させる人数であるから、再生産数となるべきものであるが、今は積分が1となるように規格化されている。実際の被感染者数は P(t)だから、P(t)/F(t) が実効再生産数 R(t) である。これを使って、R(t)のピーク日付を求めて、以下の議論に使っている。

      僕は、こんな面倒な事をしなくても、流行曲線の対数の時間微分を見て、潜伏期間(本来は世代時間であるが、COVID-19の場合はほぼ潜伏期間になる)だけ時間をずらせば充分ではないか、と思う。f(t) がほぼ t=0 近傍でピークを持つので、Q(t) と F(t) は大体同期していて、時間積分すればどちらも全感染者数になる。だから、大雑把に言えば、F(t)は P(t) よりも平均の潜伏期間(ΔL)だけ後の時間にずれている。これらの比を取るということはそれぞれの自然対数の差を取って(lnP(t)-lnF(t)) 指数化する(e の肩に乗せる)ことに相当するから、結局 P(t) の自然対数を時間微分して平均の潜伏期間を掛けて、指数化するのと同じである。つまり、大雑把に言えば、( Q(t) の自然対数の時間微分(感染拡大係数 λ)×平均潜伏期間)を指数化したものが実効再生産数に相当する。式で書くと、

              R(t)≒ exp(ΔL×d(lnP(t))/dt)≒exp(ΔL×d(lnQ(t+ΔL))/dt)

      西浦氏の事を『専門家』と読んでいて、批判的に扱っている。「2/29の論文で、110人中80%が誰にも感染させず、20%の人が感染させているとしている。その数は3人程度なので、R0を計算すれば 0.6になる筈であるが、そのことには触れていない。しかし、3/29には 10人に感染させたら R0=2 になるので、このような特異的な感染状況(クラスター)対策をすればよい、という結論になる。」ということで、初期の対策は徹底したクラスター対策となった。しかし、これはデータの読み方を間違えている。実際には R0>1 なのだから、80%が『誰にも感染させなかった』のではなくて、『感染先を見つけられなかった』だけなのである。だから、クラスター対策をしてもそこから漏れてしまう不顕性感染者が感染を拡げているということだったのではないか?これはなかなか良い所を突いていると思える。

・・・そこで、栗田順子氏の西浦博氏への批判を検討する。実際に西浦氏の2/29日論文は MedRxiv にある。https://www.medrxiv.org/content/10.1101/2020.02.28.20029272v2。いかにも急いで書かれたメモみたいな論文である。

・・・2/28の公表時、日本の新規陽性者数は200人位で、この論文の元となったデータが1週間前とすると、感染例のかなりの部分を解析していることになる。5つのクラスターを詳細に調査し、110ケースを調べた。内27人が二次感染者を生み出し、83人は次の感染を生んでいない。それぞれが何人生み出したかを集計するのだが、その際に、密閉条件であったかどうかで区別する。具体的にどのケースとか、どういう判断基準かについては書いていない。グラフから数値を読み取るのは容易である。下表で、列は一人が生み出した二次感染者数で分類している。例えば、二次感染者を1人生み出した一次感染者は16名居た、ということである。それを密閉空間だったかどうかで更に分類している。

二次感染者数 0の場合 1の場合 2の場合 3の場合 4の場合 9の場合 12の場合 総和 二次感染させた総数
(一次)感染者数 83 16 4 4 1 1 1 110 27
内 非密閉空間 77 9 1 1 0 0 0 88 11
内 密閉空間 6 7 3 3 1 1 1 22 16
二次感染者総数 0 16 8 12 4 9 12 61
内 非密閉空間 0 9 2 3 0 0 0 14
内 密閉空間
0 7 6 9 4 9 12 47

密閉空間で感染が起こりやすいという判断は

77 11
6 16

という分割表から明らかである。有意性は計算するまでもない。

・・・勿論、これは感染者110人中の 61人の感染源を説明しているにすぎない。残りの 49人の感染源は不明である。おそらくこのクラスター解析時期あるいは範囲の外部と思われる。

・・・ところで、全感染者 110人から判明した二次感染者は確かに 61人であるから、再生産数は 0.6 と推定されてしまう、というのが栗田氏の意地悪な判断である。この時期の全体としての再生産数は 2.0 位位なので、逆に言えば、二次感染者の内の 30%位しか捉えていないのではないか?そのデータを元にクラスター対策さえすればよい、というのは無謀ではなかったか?というものである。ただ、この批判には無理がある。というのも、このクラスターの実例では、これだけのデータを採取すると同時に感染者が(人道的見地から)隔離されており、その後にあり得た感染事象が起きていないからである。再生産数というのは感染者の全感染期間に亘る積分であるから、感染時点では計算できないという事はご本人がよく判っていると思う。その後にあり得た感染事象が解析から漏れた不顕性感染者である可能性はあるが、同じような密閉空間での通常の感染である可能性の方が高いように思われる。

      第4章では第一波の分析である。ここでも西浦氏への批判から始まる。対策をしない場合の大げさな予測はおそらくSIRモデルをそのまま使ったものであるが、80%接触削減の提案については根拠となる計算が公表されていない。(これらについては本人の説明 がある。)また緊急事態宣言も必要なかった。その前、3月中旬から、休校とイベント自粛、マスコミの報道によって、都民の自粛が始まっていて、そのまま続けていても多少時間がかかるが、感染は終息した筈である。その方が経済へのダメージは抑えられた。こういうバランスを考える為にもデータの分析が重要である、と言う。確かに後で振り返ればそうだったと思うが、人々の自粛ムードをそこまでうまくコントロールできたかどうか?

      第5章は小児が感染しにくいのは何故か?これには類縁のコロナウイルス症(鼻風邪等)にかかっているために、交差免疫が働いているのではないか、という話。3世代 SIR モデルによる分析もある。

      第6章は 3-4月で感染がピークを迎えて収まったのは何故か?という問題。極端ではあるが、集団免疫が成立したという説は、もしも不顕性感染者が陽性者の何百倍も居ると仮定すればピークを説明できるが、その場合には終息後に再び感染者が増えることはない筈である。もう一つは元々 R0<1 なのに、多数の未発症感染者が海外から入ってきたために陽性者のピークができた、という考えであるが、これも事後の現象を説明できない。結局人々の自粛が主要な要因であったのだが、それを傍証するために、携帯電話の外出情報を使っている。docomo は物理的に外出を検出していて、apple は外出先の検索を使っている。後者の方がやや相関性が高い。10%外出自粛すると、再生産数が 0.17 下がる。

      第7章では、まず4月15日に発表された西浦氏の「何もしなければ85万人感染42万人死亡する」という言説が批判されている。この時点では、既に感染ピークが4月3日にあったということが確認できているにも拘らず、このような主張を何の根拠も示さず(論文を公開せず)主張した為に過度の自粛が行われ、経済的損失が多大となった。(論文を公開していない理由については本人の弁明 がある。)他、大阪での K値の批判がある。COCOA 導入の効果予測(再生産数を 12.7% 位は下げられる)も行っている。これは彼女なりの早期検査隔離による感染抑制効果の評価とも言える。これだけによって感染を終息させるほどの効果ではないが、確かに効果はある。

 
<目次へ>                 <一つ前へ>    <次へ>