2020年4月18日土曜日

観測された感染者数に関する覚書き 2

(2020 年 4 月 25 日に改稿し、実データを用いた解析は後続の別記事としました)

再掲した下図からも明らかなように、疫病を終息させることは隠れた感染者 $I$ を消滅させることであり、そのためには $I$ を増加させる感染率 $a$ を減らすか、$I$ を減少させる検査・隔離率 $c$ を増やすかする以外にない(自然の回復率 $b$ を人為で変えることは難しいだろう)。 ロックダウンや社会的距離を保つといった政策は $a$ を減らすことに該当し、広範な検査を行うことは $c$ を増やすことに当たる。 この両面作戦のうち、日本は $c$ を増やすという手段をほとんど採ることなく、結果として $I$ の大きさも推測し難いものとなっている。


疫病の終息は、$a$ を減らし $c$ を増やすことで $a - b - c < 0$ に持ち込むことが前提となる。

感染率 $a$ と検査率 $c$ を推測する何らかの方法なしには観測された感染者数(われわれが感染者数として把握しているもの)である $H$ から、隠れた感染者数 $I$ を推測する方法はあまりない。 特に少ない $H$ しか捉えていない日本ではそうだろう。 ただしわずかながら(ある仮定のもとで)、$H$ の増分の時系列データから、検査によってどの程度の潜在的な感染を防いできたのかを推定でき、そこから $I$ を下から抑える(それよりも小さくはないと言える値を求める)ことはできると思われる。 これによって特に、検査開始時にいたであろう隠れた感染者数 ($I_0$) とそのときの検査率($c(0)$: 単位時間あたりに隠れた感染者のうちどれだけの割合を検査で捉えたか)に対するおおよその見積もりが与えられる。

*   *   *

少なくとも感染率 $a$ を減少させるような強力な政策が行われなかった初期において、$a$ (および $b$)を一定とみなすことができるとする($c$ は時間の関数とする)。 このとき、前の記事のように、隠れた感染者数 $I(t)$ と観測された(検査・隔離された)感染者数 $H(t)$ の時間変化は、それらが人口に比べまだ小さいとき、 $$\dot{I}(t) = (a - b - c(t)) I(t), \quad \dot{H}(t) = c(t) I(t)$$ と見ることができる(ただし、時間微分を上付きのドットで表した)。 $\dot{H}(t)$ は、われわれが(少なくとも日ごとの差分として)知ることができる値であり、$a, b$ はパラメーターとして仮定される。 これらから、 $$\dot{I}(t) = (a - b) I(t) - \dot{H}(t)$$ よって、$I(t)$ は、 $$I(t) = \left(I_0 - \int_0^t \dot{H}(u)\,e^{-(a - b) u} du\right) e^{(a - b) t}$$ となる。

上式に含まれる積分、 $$J(t) = \int_0^t \dot{H}(u)\,e^{-(a - b) u} du$$ は、検査によって隔離された感染者数を $t = 0$ 時点に換算した人数だとみることができる。 この $J(t)$ を($t$ までに観測された感染者の)「初期換算感染者数」と呼ぶこととする。

より詳しく言えば、時刻 $t = 0$ における感染者 1 人は隔離がなされなかったとき、時刻 $t$ で $e^{(a - b) t}$ に膨らみ、逆に $t$ における感染者 $h$ 人は、$t = 0$ において $h e^{- (a - b) t}$ 人から広まったと考えられる。 $h$ が各時点での検査を経た時間あたりの隔離者 $\dot{H}(t)$ であれば、$J(t)$ は時刻 $t$ までの検査・隔離者が $t = 0$ において何人であったかに換算した人数である。

$a$ と $b$ が一定というここでの仮定のもとで、時刻 $t$ においても隠れた感染者であり続ける集団の数は、$I_0$ から $J(t)$ を除いた残りの人々が拡大したものと捉えられ、上式、 $$I(t) = (I_0 - J(t))\,e^{(a - b)t}$$ が確かめられる。 ここでのように感染者数を初期時刻 $t = 0$ に換算して眺めるなら、検査による感染者の発見と隔離とは、$I_0$ から感染者を削っていく作業だと見ることができ、上の因子 $I_0 - J(t)$ は時刻 $t$ までにそれが削られた残りの量を表している[1]。 そして他方の因子 $e^{(a - b)t}$ が示すように、その作業は時間が経つほど指数関数的に困難なものとなる。 すなわち、感染拡大防止のためには初期に広範な検査を行うことが極めて有効であることを意味する

*   *   *

$a - b$ または倍加時間 $D = \ln 2/(a - b)$ の値を仮定すれば、日々公表されている国や地域別の観測された確定者の人数によって $J(t)$ を評価できる。 以下の表は、ジョンズ・ホプキンズ大学 CSSE の確定者時系列データに基づきドイツ、イタリア、韓国、日本の 4 か国に関してこの換算人数を求めたものである(2020 年 4 月 15 日までのデータに基づく)。 なお、$t = 0$ となる起点にはそれぞれの国で検査がある程度まとまって行われ出した日を取っている。 また、図は $t$ に関する $J(t)$ の変化を通常のグラフと片対数グラフで表す。 起点として取った時刻から時間が経過すれば、検査による $J(t)$ の上昇は相対的に小さなものとなっていく。

検査・隔離により除かれた初期換算感染者数 $J(t)$
起点D = 3 日D = 5 日D = 7 日
ドイツ2020-02-26527 人2966 人7589 人
イタリア2020-02-211007 人4128 人9551 人
韓国2020-02-201134 人2207 人3119 人
日本2020-02-1548 人111 人218 人

韓国を除く各国で 4 月 15 日現在、まだ隠れた感染者が多く残っていると思われることを考えるなら、初期の感染者 $I_0$ はこれらの数字よりも大きなものであった。 また日本においては特異的に、検査人数が隠れた感染者の削減に直接寄与していないだろうことがここからも見て取れる。 日本と他国との比は 10 倍を超えるものとなっており、初期感染者数 $I_0$ がそれぞれの国で同等であったとするなら、これは観測された感染者が隠れた感染者よりも大きく下回っているであろうことを示唆する。

*   *   *

上で検査で感染者を見つけることは、初期換算感染者に換算するとき、検査開始時に市中あった隠れた感染者 $I_0$ を削っていく作業であると捉えられることを見た。 しかし、$I_0$ そのものは不明であり、ひいては隠れた感染者 $I(t)$ がどこまで拡がっているのかも一般に直接知ることはできない。 ただし感染が終息したなら、事後的に推測できる。 仮に時刻 $t^*$ において隠れた感染者 $I(t^*)$ を 0 にできた(終息した)とする。 このとき、$J(t^*) = I_0$、すなわち検査による初期換算感染者数が $I_0$ をすべて削ったこととなり、過去の $I(t)$ の動きは、 $$I(t) = (J(t^*) - J(t))\,e^{(a - b) t}$$ として表される。

現在時刻 $t_P$ が終息以前 $t_P \leq t^*$ の場合、過去の時刻 $t$ $(0 \leq t \leq t_P)$ における隠れた感染者 $I(t)$ は部分的にのみ判明しており、それを初期換算した感染者数 $I_0 - J(t)$ は未知の部分と既知の部分に分けられる。 $I_0 - J(t_P)$(上図ピンク色部分)は、現在時刻 $t_P$ における隠れた感染者 $I(t_P)$ に相当する部分であり、依然その大きさを定められないが、$I_0 - J(t_P)$ は $t$ によらず、自然な感染拡大の時定数 $1/(a - b)$ で単純に指数関数的に拡大する。 これを $I_P(t\,;t_P)$ と記せば、 $$I_P(t\,;t_P) = (I_0 - J(t_P))\,e^{(a - b) t} \qquad (0 \leq t \leq t_P)$$ となる。 一方、$J(t_P) - J(t)$(上図緑色部分)は $t$ により変化し、時刻 $t$ 以後 $t_P$ までに削られた隠れた感染者に対応する部分である。 これを、 $$I_E(t\,;t_P) = (J(t_P) - J(t))\,e^{(a - b) t} \qquad (0 \leq t \leq t_P)$$ と表すものとする。 これは、$t_P$ までに判明している $J(t)$ によって求められる既知の部分となり、$I(t)$ を下から抑える。

$J(t)$ は $t$ に関して単調増加するので、$I_E(t\,;t^\prime_P)$ は $t^\prime_P$ に関して単調増加となる(すなわち、$t_{P1} \leq t_{P2} \Rightarrow$ 任意の $t < t_{P1}$ に関し $I_E(t\,; t_{P1}) \leq I_E(t\,; t_{P2})$)。 よって、特にその時点で最新となる時刻 $t_P$ の $I_E(t\,;t_P)$ が $t$ に関して最良の(最も大きな)ものとなる。

また、$I_E(t\,;t_P)$ を用い、$\dot{H}(t) = c(t) I(t), \; I_E(t\,;t_E) \geq 0$ から、検査率 $c(t)$ を上から抑える関数、 $$c_E(t\,;t_P) = \frac{\dot{H}(t)}{I_E(t\,;t_P)} \quad (\geq c(t)) \qquad (0 \leq t \leq t_P)$$ を考えることができる。

ここでは感染率 $a$ を一定のパラメーターとしているが、実際には多くの国で漸次、感染率 $a$ を減らす多大な努力が行われている。 また現時点では隠れた感染者数が十分少なくなったと見なせる国は少ない。 これらを考えるなら、ここでの $I_E(t\,;t_P)$ はよい下限を与えているとは言えない。 特に、日本のような検査を強く制限してきた国に関しては、実際の隠れた感染者数と大きな乖離が見込まれる。 一方、比較的早期に隠れた感染者を $0$ に近い値に抑え込めた韓国のような国に関しては、$I(t)$ およびそれと $H(t)$ との関係、あるいは感染初期における実際の感染率 $a$ や検査初期の隠れた感染者数 $I_0$ を考えるヒントを与えるかもしれない。 次記事において、いくつかの国に関して 2020 年 4 月 15 日時点を $t_E$ とし、倍加時間 $D = \ln 2/(a - b)$ を 1 から 9 まで変化させた $I_E(t\,;t_P)$ と $c_E(t\,;t_P)$ を求め、それらの含意について特に感染拡大初期に関し検討する。

  • [1] @barlow2001 tweet on 2020-04-23. ご精読とご指摘に感謝します。