PCR検査の偽陰性率を推定したKucirka論文の見方

はじめに

米国ジョンズ・ホプキンズ大学のL. M. Kucirka博士らの論文"Variation in false-negative rate of reverse transcriptase polymerase chain reaction–based SARS-CoV-2 tests by time since exposure"が、Annals of Internal Medicine 誌オンライン版2020年5月13日号に掲載されてから３ヶ月が経過しました。本論文 [1] は出版以来、テレビ、ウェブ記事、SNS上などで盛んに取りあげられてきており、今なおツイッターのTL上でも話題として流れてきます。

なぜ、この論文が注目されるかと言うと、タイトルにも現れているように、新型コロナウイルス SARS-CoV-2感染の確定診断に使われているPCR検査の偽陰性の発生確率を報告しているからです。そこから日本独自に起こっている「PCR検査の感度は低い」、だから「検査拡充は無意味」という謎の主張に、一見根拠となる数字を提供しているかのように思えるからです。つまり、検査抑制派、検査拡充非合理論者が、自説の主張の拠り所にしているのが、この論文というわけです。

あらかじめ言っておきますが、この論文は発症前で偽陰性の発生確率が高い（感度が低い）ことは示していますが、そこから「検査を広げることは無意味」などとは決して言っていません。先のブログ記事（→PCR検査の精度と意義）でも述べましたが、臨床的にCOVID-19が疑われる場合は、PCR陰性ということのみで感染を排除すべきではなく、臨床的および疫学的状況を慎重に検討する必要があるというのが結論の一つです。つまり「偽陰性を疑え、診断を誤るな」ということです。

ところが、日本のメディアや検査抑制派が「検査を行なっても偽陰性が発生する」として、「検査を広げないための根拠」として曲解してきたことで、問題が大きくなったように思います。

ここではあらためて、この論文の正しい解釈について述べながら、合わせて本論文自身にある大きな問題点を指摘したいと思います。

1. 論文内容の要約

Kucirka論文では、既往研究のデータ分析に基づいて、PCR検査における偽陰性の発生率と感度の変化を感染、発症、その後の経過という時系列で推定しています。自らの検査結果に基づくものではありません。

具体的には、中国、韓国、ドイツ、フランス、米国で行なわれた7つの既往研究のデータ（入院または外来患者、濃厚接触者の計1,330例）を採用して、プール解析しています（表1）。これらは、鼻咽頭または咽頭スワブ（一部血液やふん便）を検体とするRT-PCR検査で確定診断された事例に加えて、臨床診断+抗体検査、および臨床診断のみの事例（中国GuoおよびLiu）も含んでいます。感染（曝露）後および発症後の偽陰性の発生確率について、階層ベイズモデリング（Bayesian hierarchical logistic regression model）を用いて算出しています。

表1. プール解析に用いられた7研究群データの供給源

f:id:rplroseus:20200822115400j:plain

結果は図1に要約されています。偽陰性率は感染（暴露）1日目で100％（95％CI：100–100％）、4日目で67%（95％CI：27～94%）であり、COVID-19の典型的な発症日である感染5日目で38％（95%CI：18〜65％）となりました。そして、感染8日目（発症から3日目）の偽陰性率が20％（95%CI：12～30％）と最低となりました。その後、偽陰性率は上昇に転じ、9日目で21％（95%CI：13–31％、21日で66％ (95％CI：54–77％) となりました。

f:id:rplroseus:20200822111850j:plain

図1. ウイルス感染（暴露）からの時系列における偽陰性の発生確率（上）と検査陰性判定後の追検査陽性確率（下）(縦の破線は発症時）.

これらの結果から、偽陰性の可能性を最小限にするために、発症から3日間を経て検査を行なうべきと結論づけています。

本論文では、RT-PCRの特異度を米国食品医薬局（FDA）による報告に基づいて100%として計算しています。これは米国採用方式をはじめとする世界標準のマルチプレックス（多領域標的）プローブRT-PCR （TaqMan PCR）の原理から言って妥当なものですが、表1に示した韓国の事例ではTaqMan PCRではなく、通常のマルチプレックスRT-PCRが使われている可能性があります。さらに研究群で採用しているキットが異なるため、プライマーとプローブの配列は異なり、若干検出感度（分析上の）の違いがあるかもしれません。

著者らは特異度を90%にした場合の偽陰性の発生確率も推定していますが、少し偽陰性の割合が増えるものの、基本的は100%特異度の場合と変わりないとしています。

ここで少なくとも図1から言えることは、偽陰性の発生率（感度）は時系列によって変化するものであり、日本でよく見られるような「PCR検査の感度に固有値を当てはめて仮定する」ことはできないということです。

2. プール解析の問題点

Kucirkaらの研究の最大の問題点の一つは、著者自身も認めていますが、研究設計の異なる既往研究のデータセットを合わせて分析していることであり、そこからの推定が不正確になっていることです。表1に見られるように、対象群、検査時期、検査キット、確定診断などでまったく異なるデータ群を、しかも少ない事例数で、プール解析していることはちょっと強引です。とくに、中国の例に見られるように、PCR検査を経ずに確定診断している患者群を解析に加えていることは致命的とも言えます。またこれらは、流行初期の武漢での事例なので、検査精度にも問題があるかもしれません。

そして、これも大きな問題ですが、分析データのほとんどが発症後の入院患者のものであり、発症前のデータについてはDanis研究群（表1）しかないことです。これでは、そもそも発症前の確率を述べることには無理があるでしょう。カリフォルニア大学のS. Takhar博士らはこの論文に対するコメントで「発症前に関してはいかなる推定もできない、いつ陽性になるかも予測できない、発症初期と発症前において偽陰性が起こるだろうとシンプルに述べるだけでいいのではないか」と批評しています。

著者自身もそれぞれの研究データについて、限界や問題点について注釈しています。たとえば、中国Liuの研究データ（表1）における偽陰性の発生について、以下のようなバイアスを指摘していますが、この指摘自身は当たらない可能性があります。

Selection bias: only patients sick enough to be hospitalized are included; may have higher viral loads than a typical mild case. This would underestimate the false negative rate.

すなわち、「軽・中等症よりも重症患者を対象としているのでウイルス保持量が高く、偽陰性について過小評価している可能性がある」と述べています。しかし、無症状者と発症者は同等のウイルス量をもつことが、韓国の研究グループによって具体的なCt値に基づいて報告されています（→無症状感染者は発症者と同じウイルス量を保持する）。また、英国の研究チームによって、発症前から発症時にかけても、同等なCt値でウイルスが検出されることも報告されています（発症前から発症時の感染者の伝播力が高い？）。過小評価の可能性はきわめて小さいでしょう。

さらに著者らは、以下のように、Liuの研究群について、臨床診断のみあるいは抗体検査で確定診断しているケースについては、COVID-19ではない可能性やすでに治癒済みの可能性を述べており、偽陰性の発生を過大評価しているかもしれないとしています。

実際にCOVID-19患者でなければいくら検査してもPCRで陽性になりませんし、治った場合でも陽性になりません。これらを偽陰性と判定して解析に入れてしまえば、結果に大きく影響を与えてしまいます。過大評価の可能性は高いと言えます。要は、著者自身が、自らのアプローチの限界や推定値の不正確さの可能性について言及しているわけです（以下）。

Misclassification: Clinical and epidemiologic findings are not specific to COVID‐19, so it is possible that the subgroup diagnosed on the basis of symptoms only were not true positives. This could lead to overestimation of the true false negative rate. Antibodies persist long after acute infection, so it is possible those with positive antibody results had already cleared infection, thus were not true false negatives but had been previously infected. This would overestimated the false negative rate.

3. ベイズモデリングの問題点

Kucirkaらの研究のもう一つの問題点は、偽陰性率の算出に階層ベイズモデルを使っていることです。ベイズモデルについてはここでは詳しくは説明しませんが、ごく簡単に考えれば次のようになります。すなわち、互いに何の関係もない異なる研究データ群のパラメータ（ここでは偽陰性率）の傾向について解釈する場合に、単にデータを平均化しただけでは、個別性はまったく無視されます。そこで、パラメータσというものを考えて、個別性と全体性のバランスを調整できるようにしたのが階層ベイズモデルです。

注意しなければならないのはPCRを確定診断として使う場合には、その感度はPCRで陽性と判定された患者群の事前あるいは事後における陽性人数の割合で算出されるということです。つまりその患者群はどこかの段階で全員が陽性と判定されていて、これを100%とした時の別の日の検査における陽性人数の割合が感度（偽陰性発生率）ということになります。

ところが、異なる研究の患者群の時系列における陽性人数の割合を単に平均化してしまうと、たとえ確定診断100%があったとしても打ち消されてしまいます。ベイズモデリングでも同じことで、単なる確率論になっているため、図1に示すように時間を通じて最大80%（最小偽陰性率20%）にしかなっていません。つまり、どのタイミングで検査しても20%以上の偽陰性を生むような見え方になっています。これは上述したTakhar博士による「いつ陽性になるのか」という批評を生む原因になっています。

簡単に言えば、感度というのは、同じ条件で進行する確定患者群の時系列における実測の陽性率の変化によってのみ求められるものであり、異なる確定患者群をプール解析して確率論的に述べるものは、それとは区別しなければいけないのです。つまり図1が示すことは、真の感度（偽陰性率）ではなく、あくまでもモデル率であって、時系列でどの程度偽陰性に注意を払うべきか、どの時点で検査を行なえばよいか、の示唆以上のものではありません。

このことを誤解して、PCR検査の偽陰性率が高い（感度が低い）と言いながら、検査拡充不要と叫んでいるのが、日本の一部の人たちやメディアです。

4. 検査の繰り返しで偽陰性はなくせるか

本論文で著者らは、PCR検査の繰り返しことよる偽陰性を減らす効果についても言及しています。ただし前提として、偽陰性が高い確率で発生するメカニズムについてよりデータを得る必要があるとしています。たとえば、患者によってウイルスの保持量に差があるとするならば、検査の繰り返しによる効果は改善されないだろうと述べています。

そして検体によって検出の差があることにも言及しています。一例としてX線画像と吸入器からPCR陽性反応で感染が確定されたにもかかわらず、鼻咽スワブ検体からは終始陰性反応しか出なかった例を挙げています。

とはいえ、よく誤解されていることは、偽陰性は１回の検査でわかるものではありません。陰性の結果があり、その後に陽性の結果がなければ、事前の陰性が偽陰性であったことさえわかりません。すなわち、偽陰性の判定には最低でも2回の検査が必要であり、原理的にそれが繰り返されることで、偽陰性の発見確率と問題を減らす確率は高くなるということです。

実際に、COVID-19発症後のPCR検査で陰性となることはほとんどないと考えられますし、もし陰性となった場合でも再検査して確定していることが多いと推定されます。

おわりに

以上あらためて、Kucirka論文がなぜ日本人によって曲解されているのか、そしてこの論文のどこに問題があるのかを述べました。曲解されている原因の多くはおそらく論文をよく読んでいないか、情報リテラシーのなさによるものでしょう。そして、マルチプレックスプローブRT-PCRの原理を理解していない、実測による偽陰性率とモデル率の区別がついていない、PCR検査を確定診断とする場合の感度の算出法を理解していないというところにあるのではないかと思われます。

医学分野の研究者や医者が、COVID-19の事前確率、PCR検査の「感度70%」および「特異度95%」を持ち出してベイズ定理によって、検査結果の誤りの確率を論じるのは世界も日本も同じです。ただ世界的には、PCR検査の偽陰性の問題に対してそれを解決するには「検査陰性を単純に陰性と判断するのではなく総合的に判断せよ」、「検査を繰り返せ」という立場です [2、3]。すなわち、Kucirka論文の結論と基本的に同じです。

一方、日本の政府分科会の感染症専門家や医クラが、ベイズ定理の確率論に基づいて「検査抑制論」へ走るのは詭弁としか言いようがなく、世界の潮流に逆らう言動であり、科学レベルの低さを露呈しているだけです（→新型コロナ分科会への期待と懸念）。もうこのような馬鹿な議論はやめにして、科学的根拠に基づいて実効性のある感染症対策を打ち出してもらいたいと思います。

引用文献

[1] Kucirka, L. M. et al.: Variation in false-negative rate of reverse transcriptase polymerase chain reaction–based SARS-CoV-2 tests by time since exposure. Anal. Int. Med. 13 May 2020. https://www.acpjournals.org/doi/pdf/10.7326/M20-1495

[2] Watson, J. et al.: Interpreting a covid-19 test result. BMJ 369, m1808 (2020). https://doi.org/10.1136/bmj.m1808

[3] Woloshin, S. et al.: False negative tests for SARS-CoV-2 infection — challenges and implications. N. Eng. J. Med. 383, e38 (2020). https://www.nejm.org/doi/full/10.1056/NEJMp2015897

引用した拙著ブログ記事

2020年8月15日発症前から発症時の感染者の伝播力が高い？

2020年8月10日無症状感染者は発症者と同じウイルス量を保持する

2020年7月7日新型コロナ分科会への期待と懸念

2020年6月1日 PCR検査の精度と意義

カテゴリー：感染症とCOVID-19