最近、ユーチューブなどの動画サイトには、非常に優れた動画が多数あがっています。なかでも興味深いのは、「予備校のノリで学ぶ『大学の数学・物理』」というチャンネルで優れた動画を多数アップロードされている、「ヨビノリたくみ」先生というユーチューバーの方です。今から約1年半前の動画で、「罹患率が低い病気で、無差別に検査を実施しても意味がない」とする解説をされているのですが、これについて紹介しておきたいと思います。
ベイズの定理
「ベイズの定理」、というものがあります。
これは「条件付確率」、つまり「ある事象Aが発生する」という条件のもとで、ほかの事象Bが発生する確率を求めるという、確率統計の分野における定理のひとつです。
これについて、なかなか興味深い動画を発見しました。
講師は「ヨビノリたくみ」先生というユーチューバーの方ですが、これがめっぽう面白いのです。
チャンネル名称は「ヨビノリ」、つまり「予備校のノリで学ぶ『大学の数学・物理』」というもので、講師のヨビノリたくみ先生は口調が軽快でありながら、内容は極めてハイレベルです(ちなみにリンク先動画のアップロード日はコロナ禍が発生するよりも1年以上前の2019年1月9日です)。
ヨビノリたくみ先生のチャンネル登録者数は昨晩時点で47.5万人で、ほかに上げていらっしゃる動画も、「中学数学からはじめる相対性理論」だの、「今週の積分」だの、軽快でわかりやすい口調でありながら極めてハイレベルという、とても貴重なチャンネルです。
個人的には、この動画シリーズがあればNHK教育など不要だと思うほどです。
偽陽性と偽陰性
さて、リンク先動画のなかで興味深いのは、「罹患率0.01%の病気があるとする」、「その病気にかかっているかどうかを判別するための検査がある」、「ただし検査では偽陽性・偽陰性が一定確率で発生する」、という説明の部分です。
これについて当ウェブサイトなりに解説すると、次のような設例です(図表1)。
図表1 偽陽性・偽陰性
陽性となる確率 | 陰性となる確率 | |
---|---|---|
実際には病気にかかっている | 98% | 2% |
実際には病気にかかっていない | 20% | 80% |
(【出所】リンク先動画を参考に著者作成)
つまり、実際に病気にかかっているかどうかは検査をしてみないとわからないのですが、その病気の場合、「実際に病気にかかっている」ならば98%の人が「陽性」と判定されるものの、間違って「陰性」と判定される確率が2%だったとします(間違って陰性と判定されることを「偽陰性」と呼びます)。
また、逆に、実際に病気にかかっていないならば、80%の人は「陰性」と判定されるものの、間違って「陽性」と判定される確率が20%だったとしましょう(間違って陽性と判定されることを「偽陽性」と呼びます)。この検査では「罹患しているか疑わしい人」を陽性と判定しやすい、ということでしょうか。
そして、罹患率(社会全体でその病気にかかっている人)が0.01%(つまり1万人に1人)だったとしましょう。このとき、とにかく無差別に検査を実施したら、いったい何が発生するでしょうか。
ヨビノリたくみ先生によると、結論的には「検査で陽性となった」としても、実際にその病気にかかっている人は約0.05%しかいない、と述べます。
「そんなバカな!」
「陽性に患者はたった0.05%」、数式を使わないで説明してみた
これについては、ヨビノリたくみ先生の動画を視聴していただければ、「なぜ罹患率0.01%の場合、無差別に検査を実施しても、『陽性』のなかに本物の患者が0.05%しか罹患していないのか」がよくわかると思うのですが、本稿ではあえて数式を使わずに、これについて解説してしまいましょう。
仮に人口が100万人の都市があったとします。このとき、「罹患率は0.01%」ということがわかっているとすれば、この都市のなかで病気にかかっている人は100人です(=100万人×0.01%)。
では、この100人を検査によって特定することは可能なのでしょうか。
よくわからないので、とにかく片っ端から検査することにしてみましょう。すると、検査の結果、次のとおりとなるはずです。
図表2 無差別に100万人を対象に検査を実施した場合
検査で陽性判定が出た人 | 検査で陰性判定が出た人 | 合計 | |
---|---|---|---|
病気にかかっている人 | 98人 | 2人 | 100人 |
病気にかかっていない人 | 199,980人 | 799,920人 | 999,900人 |
合計 | 200,078人 | 799,922人 | 1,000,000人 |
(【出所】著者作成)
計算は、これで合っていると思います。
人口100万人中、「病気にかかっている人」は全部で100人、「病気にかかっていない人」は99万9000人です。一方で、検査で陽性判定が出た人は200,078人、検査で陰性判定が出た人は799,922人となるはずです。
罹患率が低い/偽陽性率・偽陰性率が高いほど、全員検査に意味がない
さて、ここで問題です。
「検査で陽性判定が出た人」200,078人のなかで、「実際に病気にかかっている人」はいったい何%含まれているのでしょうか。電卓があれば「98÷200,078」と打ち込めば誰にでも計算できますが、正確にいえば0.048980897…%、ざっくりいえば0.05%(!)であることが確認できるでしょう。
つまり、罹患率が低ければ低いほど、また、偽陽性・偽陰性となってしまう確率が高いほど、その検査を全人口に対して実施しても意味がないのです。せっかく100万人全員に対して検査を実施したのに、実際には病気にかかっていない199,980人もの人に対して誤って陽性判定が出てしまうのです。
この場合、「陽性」と判定された200,078人に関しては、そのなかで罹患している人98人を特定するために、さらに再検査をしたりしなければなりません。疫病が流行している際に、貴重な医療リソースをこんな効率の悪い検査で潰すとは愚の骨頂でしょう。
もちろん、罹患率が上昇すればするほど、「無差別に検査を実施した場合」の検査の有効性は上昇します。たとえば、罹患率が50%だった場合、この検査で陽性だった人が本当に病気にかかっている確率は約83.05%にまで上昇します。
しかし、罹患率が1%だった場合は、この検査で陽性判定が出たとしても、実際に罹患している確率は約4.72%に過ぎないのです。
※ ※ ※ ※ ※ ※ ※
さて、今回の武漢コロナ禍では、ごく一部のメディアからは、「なぜ希望する全員に対してPCR検査を実施しないのか」、などと安倍政権を批判する論調が出ていました。
これについてはコロナ関連の読者投稿のなかでも指摘されている稿がありましたが、あらためてベイズの定理を使ってみれば、少なくとも「無差別にPCR検査を行わないこと」の効果は明白ですし、安倍政権による、「一定の基準を満たした人のなかから保健所などの判断で検査する」という方針は正解でした。
このあたり、「日本のコロナ患者数が少ないのはPCR検査を無差別に実施していないからだ」とする言説自体、明らかにおかしなものと言わざるを得ませんし、「PCR検査を実施しろ」と主張するメディアは、わざと医療崩壊を発生させようとしていると批判されても仕方はないでしょう。
なお、「罹患率」自体が「なぜ0.01%なのか」、「これはどうやって推計するのか」といった疑問を持つ方もいらっしゃるかもしれませんが、そういう方こそ是非、ヨビノリたくみ先生の動画を視聴していただくのが良いと思います。個人的には「逐次ベイズ推定」の部分、非常に参考になりました。
ヨビノリたくみ先生、良い動画を大変ありがとうございました。
View Comments (53)
「専門家」の肩書きでもって結論のみ語ることの危険性ですね。
本来この手の話は統計の基礎中の基礎ですし、防疫の専門家なら欠くことの出来ない大原則なはずです。
現在のPCR検査の疑陽性疑陰性の率でもって、どのくらいの推定感染率があったなら全数検査に意味があるか、というのも計算で求まるはずです。その数値に大きく及ばないと考えられるから全数検査は不要。単純にそんな話だと思っています。
G様
統計的な部分以外の補足をさせていただきます。
検査数が増えれば増えるほど人手や検査するための場所、検査試薬も必要になります。また、実際は感染していなかったのに検査に出かけて感染してしまう、ような懸念もあります。さらに、大部分の人は感染しても軽症であり治療法としては隔離安静(隔離を治療というのは変かもしれませんが)になる、というのも理由としてあったと思います。
本来このような解説こそマスコミが行うべきもののはずですが、現在のマスコミは明後日の方向に行ってますよね。
>わざと医療崩壊を発生させようとしている
流石にそんな事は考えてないとは思うけど、、全員に検査をすべきという意見って、どんな目的だったのかな?ってのは気になるのです♪
1.ただ批判がしたかっただけ
わかりやすいけど、ここで終わらずに真面目なのも、も少し考えてみました♪
2.無症状のまま感染を拡大する人の補足
発症者から濃厚接触者を見つけて隔離ってだけだと感染拡大は防げないって発想なんだと思うのです♪
ただ、感染しても無症状のままの人が圧倒的に多いって想定なら、そんなに怖がる必要はないんじゃないかなって思うのです♪
ウィルスじゃないけどビフィズス菌なんかは、多分みんな感染してると思うのです♪
3.感染状況の正確な把握
新しい病気だからこそ、その実態解明のために大規模なデータをとって知見を積み上げるのは大切だと思うのです♪流行初期の感染拡大の様子なんて、実験じゃ得られないデータだろうし、偽陰性の問題もそれを考慮に入れて補正すれば、データとしては使えそうな気がするのです♪
ただ、初期対応でドタバタしてるときにやるべきことなのかは疑問なのです♪
4.自分が感染してないことを証明したい
も少し突っ込むと、安心感が欲しいとか、お仕事なんかで安全アピールしたいから、ってことだと思うのです♪
偽陽性の存在と陽性が出たときの外出自粛ってペナルティを考えると、ギャンブルに過ぎないように思うのです♪
5.体調悪いのに検査待ちで診察や治療が受けられない
ニュースなんかでも取り上げられていたと思うのです♪
これは問題だと思うけど、望む人の全てに検査をするばいいって問題じゃないと思うのです♪
あたしも振り返って無闇な検査は不要だったなって思うけど、そういう意見で不安を煽ってる人もいた訳だし、政府にはそのあたりの説明もしてもらえたら良かったのに、とも思うのです♪
>政府にはそのあたりの説明もしてもらえたら良かったのに、とも思うのです♪
いやいや、無~~理 ですよ。
いくら説明されてもちんぷんかんぷん。だぁ~れも何がなんだか分からない。
数学は数式で会話する。日本語でも英語でも独語でも何語でもなく数式で会話するんですって。
政府だろうが誰だろうが統計学の説明をし出したらマスコミはじめだぁ~れも理解できない。かえって大騒ぎになりますよ。
理系のなかでもここに書き込むような凄い連中だけですよ、今回の話が一瞬で分かるのは。
新宿さんが難しい統計学の数式を使わず文字と四則演算だけで説明して、それがわかるのは元々統計学に熟知している理系だけ。
団塊みたいな文系はキョトンと眼が点になっただけ。
・・・
まあ、『そのあたりの説明もしてもらえたら』
と
書いてる段階でこの話(統計学)がちんぷんかんぷんなんじゃないですか、団塊(=馬鹿)と同じに。
そもそもテレビ新聞で政府から統計学を説明されて国民の半分でも理解できるなら、中学校や高校の授業でやってますよ。
今回の件で思ったのは「自分は頭が悪いです」と宣言するのに躊躇が無い人がこんなにも多いという驚きですw
自分は頭が悪いなあと思っている人は少なくないのでしょうが、宣伝して回る人まではそんなにはいないだろうと甘く考えていました。
りょうちんさま
今回のコロナウイルス関連情報は、このサイトで自分よりも頭の良い人の情報が、役に立ちました。ここだと、頭の悪い話は、論破されて淘汰されますので、楽でした。
いつもなら考える事を、考えずに済んだ部分が、結構有るのだと思います。
頭の悪い人は、自分が頭が悪い(自分よりも頭の良い人がいる)という事が、分からないのだと思います。
それを頭の良い人から見ると、頭が悪い事の宣伝に、見えるのだと思います。
こういった理解しやすい説明を政府なり、専門家なりがする事が大事なんですよね。正しい情報提供をし、理解を深めてパニックを起こさないようにする。これはコロナだけに限らず、政治やせいどにおいても肝要なのではないでしょうか。安倍政権にこれが出来れば、最強の政府と誰もが認めるのではないかと思う次第です。
豆鉄砲様
同意いたします。
少しずれますが、記者会見などの様子、マスコミが流したものが検証できるよう、政府も動画を上げるようになったのはとても良いことだと考えています。切り取り継ぎ接ぎで全く違う内容になって報道されても一応確かめられますから。
今回は医療クラスタが自分たちで解説を発信したのも幸いでした。
>こういたった理解しやすい説明を政府なり、専門家なりがする事が大事なんですよね。
多分ですが、していたと思いますよ、PCR検査の偽陽性の確率と偽陰性の確率について。
残念ながら聞いた我ら国民が、難しい統計学の計算結果とかの話が、難し過ぎて何を言われているのか分からなかっただけ。
もしかすると説明されたマスコミのレベルが、説明されても、ちんぷんかんぷんだったら、国民に伝えようがありませんね。
まあ、正確に伝えられても団塊は理解不能、やたらのPCR検査は武漢ウィルスを蔓延させるだけくらいしか分かりませんけどね。
専門家の方々は、えー、このくらいは分かってますよね、から話を始めるので、一般市民からすると、何?分からない単語がいっぱい、となります。意志疎通の橋渡しをしてくれる方の存在は有難いです。
偽陽性率しかふれられていませんが偽陰性率の方が値が大きく感染率によって大きくかわりますから、両方を考えると全検査なんてまったく無駄ということがわかります。
私は大学で統計学やテーマが統計に関わることを勉強してましたし、仕事では階層ベイズモデルを使いますので、初心に戻りました。
当時はパソコンなんかありませんから、逐次ベイズなんか電算室で順番待ちでした。
近年は、コンピューターの性能が上がりましたから、ビッグデータの解析でも注目されています。
国民全員にPCR検査を行うということは、国民全員のDNAデータを集めることにもなります。したがって、中国やその他、人権のない国ならいざ知らず、日本で行う場合には生体データの取り扱いに関するしっかりとした議論や法整備が必要かと思います。
全市民のPCR検査を行った武漢当局が手に入れたDNAデータを破棄するとは思えません。
>国民全員にPCR検査を行うということは、国民全員のDNAデータを集めることにもなります
わぁ~お、そうなんだ!
純粋に質問なんですが、狙撃のような病原体のPCR検査とか、特定の領域のみに絞ったDNAデータバンクの構築には使えそうですが、全ゲノムのデータを取る手間とか費用とかものスゴいと思うのですが・・・。
最新の技術でもたしか全ゲノムシーケンス解析には1日かかるとニュースで見た記憶が。
単純に思うんだけど、全国民のDNA情報を集めるなら、例えば定期健康診断で採血した検体で十分、というか、その方が圧倒的に質の高いDNAが取れるよね。そいで、健康診断で採取した検体の扱いについては、きっちり法整備されてる。目的以外の検査には使えない。だから、化学者さんのコメントはなんか違う気がします。
そもそも、精度云々以前に防疫目的で国民全員検査をするなら1億2千万人同時に行わなければなりません。
数か月かけて検査をするなら、陰性判定でも明日も陰性とは限りませんから。
例えるなら池の水を全部抜かない限り外来種駆除は出来ません、池の面積の1/10000の大きさの網で10000回すくってみたところで魚を移動するし、繁殖もしるので駆除は出来ないのと同じです。
また、不安不安解消のための検査なんかは愚の骨頂
発症前のPCR検査の精度についての米ジョンズ・ホプキンズ大のチームの分析では
https://mainichi.jp/articles/20200530/k00/00m/040/128000c
発症4日前の陽性率は0%
発症前日の陽性率は33%
だそうです。
無症状感染者については検知できず、発症前で1/3しか陽性者を特定できないのですから、不安解消のための検査は出来ないということです。
むしろサイレントキャリアを過信させ、感染拡大に無防備にさせてしまいます。
PCR検査は症状発生者に対してコロナウイルス感染の確定を行うためのものとして使うのが正しい使い方だと思います。
ランダムな検査は、必要なリソースが多い割に得られる有意な情報が少ないという事が如実に判る動画になりますね。
精々、傾向の把握について使えるかどうかというレベル。
(傾向見るだけなら、既に実施している抗体検査で十分事足ります)
個人の安心の為のPCR検査は、社会にとっては害悪でしかないです。
更新ありがとうございます。
「ヨビノリたくみ」先生、ベイズの定理、面白かったです。
片っ端から全員にPCR検査をやるのは、労多くして実り少なし、でしょうか。いや無駄そのもの。わざと医療崩壊を発生させようとしていた。
3〜5月にワーワー言ってた野党国会議員、知識浅薄なコメンテーター、芸人、一部医療関係者、、。もう少しで国が騙されるところだった。さ、除菌除菌。
初めて投稿させていただきます。
私も2ヵ月前に計算してみたことがあります。
参考にしたページはこちらです。
「ガン検査が「陽性」でも気に病む必要はない?――「ベイズ統計学」の推定のしくみ」
https://diamond.jp/articles/-/81971
統計学となっていますが、難しいことはさておき、新宿会計士様がされたような計算ですと、小学生でもできるような簡単な計算ですので、ぜひご自分でやってみられるのをおすすめします。
なお、検査には感度(感染している人が陽性と判定される確率)と特異度(感染していない人が陰性と判断される確率)が大事ですよね。
新宿会計士様はヨビノリ先生の例で挙がっていた値をそのまま採用されたようですが、PCR検査の場合はそれぞれ70%と99%と言われることが多いみたいなので、その値で市中感染率が0.1%の場合を計算しますと、
1回のPCR検査で陽性になった人の中で実際に感染しているのは1%しかいない、ことになりますね
検査を2回すれば33%に上がりますが、実際に感染している人のうち(70% * 70% = 49%)49%しか捉えられず、51%は野放しになりますね。
すみません、自己レスで訂正します。
>市中感染率0.1%の場合
市中感染率0.01%でした。新宿会計士様の計算と同じ値です。