新型コロナウィルスで見る確率の話

ポエム

ここ何か月か猛威を振るっている新型コロナ(COVID-19)ですが、100万人にたいして検査しろ!とか検査数を増やせ!という声をよく聞くので、100万人に検査してもいみがないことを説明します。

また、この記事は多くの部分仮定の数字を置いていますので、鵜呑みにせず、気になったら公的機関の情報などを調べて自分で計算してください。

条件付き確率

条件付確率とは、ある事象Aが起こったと分かった後で別の事象Bが起こる確率です。

以下のような例を考えてみます。

例)さいころを1つ振って出た目が偶数であると分かった時、出た目が4以上である確率はいくらか

さいころの目のうち偶数であるのは2,4,6の3通りです。このうち4以上であるのは4,6なので2/3と直感的にわかってしまいます。

ここで次のように考えてみます。

  • A: 出た目が偶数である
  • B:出た目が4以上である
  • A∩B:出た目が偶数かつ4以上である

こうすると、確率はそれぞれ

P(A)=1/2

P(A∩B)=2/6

となるので、Aが起こったと分かった後にBが起こる確率P(B|A)は、

\[P(B|A)=\frac{P(A∩B)}{P(A)}=\frac{2}{3}\]

となります。

感度と特異度の話

次に、検査などで使われる用語、「感度」と「特異度」について説明します。

感度:罹患している人が実際に陽性だと検出される確率

特異度:罹患していない人が実際に陰性だと検出される確率

のことです。検査で陽性と検出されても実際は罹患していない場合(偽陽性)や、検査で陰性とでていても実際は罹患している場合(偽陰性)があるということです。

まとめると以下の表のようになります。

実際に罹患している実際は罹患していない
検査で陽性とでる真陽性偽陽性
検査で陰性とでる偽陰性真陰性

一般的に、何かの病気の検査でこの感度と特異度が100%になることはありません。

例えば0.1%の有病率の疾患に対して、感度95%・特異度99.9%の検査(PCR検査と同等だと仮定)を行った場合を考えてみます。

あなたは、検査を行って陽性と検出されました。さて、実際に病気に罹っている可能性はどれくらいでしょうか?

事象AとBを次のように定義します。

  • A:検査で陽性と検出される
  • B:あなたが病気である
  • A∩B:あなたが病気であり、かつ検査で陽性と検出される

この場合、確率は次のようになります。

Aは真陽性と偽陽性の場合の確率の和となります。

つまり実際に罹患(0.1%)していて陽性と出る人(真陽性)と実際は罹患していない(99.9%)のに陽性と出る人(偽陽性)です。

\[P(A)=\frac{0.1}{100}\times \frac{95}{100}+\frac{99.9}{100}\times \frac{5}{100} \]

また、P(A∩B)は単純に真陽性である確率なので

\[P(A∩B)=\frac{0.1}{100}\times \frac{95}{100} \]

となります。つまり求める確率は

\[P(B|A)=\frac{P(A∩B)}{P(A)}=\frac{0.1\times 95}{0.1 \times 95+99.9\times 5}=0.0186\cdots \]

つまり約1.9%ということになります。

有病率が0.1%としているのでこんなに低い値となってしまいます。まったく症状も出ていない、濃厚接触もないような、検査の母集団を絞らない状態でむやみに検査をしても、陽性かどうかを見極めることは出来ません。

100万人に簡易検査は意味がない

では100万人無作為に検査を行って、偽陽性や偽陰性が出てしまう場合を考えましょう。

ここでは簡易検査として感度60%・特異度98%(インフルエンザの簡易検査キットと同等と仮定)とします。

100万人に検査すると、有病率が30%の場合(蔓延期を想定)実際に罹患しているのは30万人ということになります。

このうち偽陰性となのは2%なので6000人。この人たちは陰性と判断されたので普通に会社や学校へ行ってしまうことになるでしょう。

ただ、100万人に検査して陰性となっても、熱が続いたり咳が出ていれば普通は自宅療養すると考えられるので、こちらはそこまで問題にならなそうではあります。

一方、実際に罹患していない70万人のうち、偽陽性となるのは40%なので、28万人

この人たちはコロナに罹っているわけではないのに、陽性と判断されてしまうので、隔離措置なり自宅療養などをしなければなくなってしまいます。

実際に罹患している人が30万人なのに、罹患していないのに陽性と出てしまう人はなんと28万人となってしまいました。見かけ上の感染者が倍になってしまった。

まとめ

今回は自分の確率の知識の復習もかねて、新型コロナウィルスに関して簡単に計算してみました。

ここらへんの知識は機械学習の仕組みを勉強するときに必ず習得すべき知識なので、これを機に理解を深めたいと思います。

なお、冒頭でも書きましたが、医療に関してど素人が仮定を置きまくって書いていますので、数値など鵜呑みにしないように。

この記事を書いた人

渋谷で働くよわよわエンジニア。TypeScript(Next.js/Node.js)/Golang/AWS/Flutterなど
LINE API Expert(2023/1~)

tokkuをフォローする
オススメ記事
在宅ワークが多くなって、デスクの配線周りに困っている方は、拡張デスクの導入がおすすめです。Windows/MacOS/Linuxの複数の機器をスッキリとデスク周りに収める事ができました!リモートからサーバーメンテを行うインフラエンジニアは必見です!
ポエム
tokkuをフォローする

コメント

タイトルとURLをコピーしました