「コロナは高齢者で重症化しやすい」は真実か?

f:id:emoriiin979:20200922212804p:plain


最近、新型コロナウイルス感染症が世界中で流行しています。この感染症は2020年9月22日現時点で約100万人の死者を出す恐ろしい病気ですが、一方で若者の致死率は低く、高齢になるほど致死率が高くなるといわれています。

本ブログは、「老化のメカニズム」の解明を目的としている研究報告ブログです。もし、上記の噂が真実なら、高齢者で致死率が高い理由を調べれば、若者と高齢者の生物学的な違いが分かるかもしれません。


しかし、「高齢者の致死率が高い」という情報が、デマである可能性もあります。もしデマだとしたら、この疾患を調べたところで老化のメカニズム解明には永遠にたどり着けません。なので、この情報が真実かどうかは念入りに確認しておく必要があります


今回は、北海道の陽性患者属性データを自分で分析し、年齢と重症化率の間に何らかの傾向が無いかを調べました。その結果、確かに年齢と重症化率には明らかな相関があることを確認できました

本記事では、今回の分析をどのように行ったか、また結果を受けてどのように考察したのかについて説明します。


新型コロナウイルスと高齢者

新型コロナウイルス感染症とは、2019年12月に中国の武漢にて初めて報告された病気[1]であり、現在(2020年9月22日)に至るまで、感染者数が約3000万人、死亡者数が約100万人[2]という大変危険な感染症です。

新型コロナウイルスによる死因としては、ウイルスに起因する肺炎の重篤化が挙げられます。コロナウイルスはサイトカインストームなどで肺炎を引き起こす能力[3]があり、一般的な肺炎と同じように呼吸困難によって死に至らしめるようです。


若年者での肺炎の予後は良好であるが、高齢者では死亡率は上昇する。
改定第9版内科学書Vol.2


ところで、一般的な肺炎においては、高齢であることが肺炎重症化のリスク因子だと定義されています。肺炎による30日死亡率を予測するための重症度分類法であるPSIでは、年齢が50歳を上回る際に重症度点数を加点するよう設計されています[4]。

実は、新型コロナウイルス感染症においても、高齢者において死亡率・重症化率が高くなるという共通認識が広まっています。実際に、年齢が70歳以上の場合は死亡率が跳ね上がるという情報も報告されています[5]。


もし、この情報が本当だとしたら、高齢者では、若者には無い「何か」が原因で肺炎にかかりやすくなっていると考えられます。もしくは、若者が持っている「何か」を、加齢によって失ってしまったともいえます。

どちらにせよ、新型コロナウイルス感染症を追跡することで、若者と高齢者の違いを明らかにできるかもしれません


デマ情報に注意

しかし、一つ懸念材料があります。それは、新型コロナウイルス感染症では高齢者の重症化率が高い」という情報が、真っ赤な嘘である可能性です。あり得ないかもしれませんが、現在公表されている情報が全て何者かが作り出したデマである可能性はゼロではありません。

以前に、デマ情報のせいで多大な混乱をもたらした事件がありました。それは、「トイレットペーパーの買い占め」です。在庫は十分あるにも関わらず、「トイレットペーパーが今後なくなる」というデマが広まった結果、深刻なトイレットペーパー不足が発生した[6]のは記憶に新しいと思います。


これまで、「新型コロナウイルス感染症は高齢者で特に重症化しやすい」を否定する情報は見たことが無いので、デマである可能性は限りなく低いです。しかし、もしデマだった場合、新型コロナウイルス感染症を調べても老化のメカニズムに迫ることは永遠にできないでしょう。

したがって、この情報がデマではないことを調べる必要があります。しかし、ニュースなどの二次情報をいくら漁ったところで、この疑いが晴れることはありません。より真実に近づくには、一次情報を自分で調べるのがよいでしょう。


現時点でコロナウイルスはホットな話題のため、様々な機関がオープンデータを公開しています。そこで、今回はこれらのオープンデータを自分でデータ分析することで、コロナウイルスに関する一次情報を手に入れます。

年齢が若い層と高齢者層のデータを集計して、それぞれの年齢層の重症化率を算出します。もし、若者と高齢者で重症化率に違いが見られれば、高齢者の方が重症化しやすいことを実証できます


オープンデータを探す

オープンデータとは,「機械判読に適したデータ形式で、二次利用が可能な利用ルールで公開されたデータ」であり「人手を多くかけずにデータの二次利用を可能とするもの」です。
つまり,誰でも許可されたルールの範囲内で自由に複製・加工や頒布などができるデータをいいます。
オープンデータとは?


まずは、分析に利用するオープンデータを探します。


新型コロナウイルスのオープンデータとして有名なものは、米国CDC欧州CDCが提供しているオープンデータです。これのデータは様々な研究で使われているのをよく見かけます。

ただし、今回は年齢と重症度を比較するだけなので、データ数はそれほど必要なさそうです。よって、本研究では比較的扱いやすい日本のオープンデータを使います


日本では、東京都など行政機関がコロナ患者数などのオープンデータを公開しています。いくつか調べてみましたが、患者ごとに重症度が記載されているデータセットが他に無かったので、今回は北海道の陽性患者属性データを利用します。

オープンデータ公開ページにアクセスしてCSVファイルをダウンロードし、全部で2,007件のデータを入手しました。


コロナ感染症の重症度分類と高齢は無関係か?

入手したデータには、「患者_状態」という項目があります。ここで、患者の重症度(軽症、中等症、重症、症状なしなど)が分かります。

そして、次に行うことは、この重症度分類に年齢の重み付けがされていないかを調査することです。


上述したPSIでもそうですが、一般的な肺炎の重症度基準では、年齢~歳以上は重症度を上げるなどがされています。つまり、年齢そのものが肺炎の重症リスク因子とみなされています。

もし、新型コロナウイルス感染症の重症度分類にも同じような基準が使われていた場合、非常にまずいことになります。なぜなら、分析の結果で年齢と重症化率に正の相関が見つかった場合、それは「重症度が年齢で嵩増しされているから」という結論になってしまうからです。


一般的な肺炎とコロナウイルスによる肺炎が全く同じだと証明されたわけではないはずなので、上記の結論に至ると「コロナ感染症は高齢者で重症化しやすい」という仮説を立証できなくなります。

なので、コロナウイルスの重症度分類が年齢で重み付けされていないことを調べておく必要があります。


新型コロナウイルスの重症度分類を色々調べてみたところ、「新型コロナウイルス感染症 診療の手引き」という資料を見つけました。ここで、医療従事者が評価する基準として重症度分類が定義されています。

診療の手引きによると、患者の重症度は「飽和酸素度」と「臨床状態」で判別すると記載されています。飽和酸素度(SpO2)とは、動脈血中の酸素濃度を表す指標で、肺炎などで呼吸困難になると数値が低下します。臨床状態とは、「息切れ」や「人工呼吸器が必要」などの定性的な判断基準のようです。

診療の手引きを見る限りでは、重症度を年齢で重み付けしているとは思えません


ただし、北海道のオープンデータにおいてもこの重症度分類が採用されているかは、現時点では判明していません。一応、オープンデータの問い合わせ先に本件を質問していますが、すでに1か月ほど経過していますが未だに返事が来ておりません。(与党総裁が替わったばかりなので多忙なのかもしれません・・・。)

なので、オープンデータの「患者_状態」への年齢の重み付けについては謎のままですが、ひとまずはこのような重み付けは無いと仮定して分析を進めることにします


期間によるグループ分け

コロナウイルスは当然ながら「ウイルス」なので、変異する能力を有しています。新型コロナウイルス感染症が初めて報告されたのは2019年12月のようですが、当時のウイルスと現在流行しているウイルスが同じものとは限りません。

すなわち、感染拡大初期では高齢者でのみ重症化しやすかったウイルスが、現在では若者でも重症化しやすいウイルスに変化している可能性があります


したがって、本研究ではオープンデータを「公表_年月日」に応じて4つのグループに分割しました。分割方法は、各グループのデータ数が少なくなりすぎないように割り振っただけなので、ある程度恣意的な分け方になってしまいますが、そこはご留意ください。

それぞれのグループのデータ数は、「1月~3月」が177件、「4月」が590件、「5月~6月」が496件、「7月~」が744件となりました。


ついでに、男女でもグループ分けしてみました。データ数は、男性が838件、女性が939件(+非公表が230件)となりました。

これらのグループごとに、年齢ごとの重症度の集計を行います。


データ分析

データ分析のためのプログラムは、Google Colaboratory上で、Python(Pandas)で実装しました。詳しい実装方法については、私が以前投稿したQiita記事を参考にしてください。ここでは、年齢と重症化率の関係を調べるための分析方法と結果に焦点を当てます。

今回は患者の年齢と重症度の関係性を調べたいので、この2つのカテゴリ変数でクロス集計を行いました。


f:id:emoriiin979:20200925085133p:plain


これは、グループ分けする前の、全てのデータの集計結果です。それぞれの年代ごとに、重症度別の患者数が集計できています。

このクロス集計テーブルを棒グラフで可視化します。


f:id:emoriiin979:20200925091202p:plain


こちらは、期間別の集計結果です。横軸は見ての通り各年代で、縦軸は各重症度の患者数を年代ごとのデータ数で除算した割合を表しています。

今回は重症化率を比較したいので、中等症および重症が目立つように配色しています。このように、各期間のグループを見てみると、それぞれにデータの傾向が見られます。


まず、3月以前については「症状なし」が一人もいませんが、これは感染初期ではコロナウイルスの確定診断方法が整っておらず、すでに呼吸器障害を有する患者からしか検体を確保していなかったからではないかと思われます。

4月から6月にかけては、重症者の年代の振れ幅が最も多い時期となっています。ただし、4月に緊急事態宣言が発令されたせいか、5月以降はいわゆる生産年齢人口の重症化率は減少しているように見えます。

7月以降は、重症患者の報告は一切見られませんでした。この時期では30歳以下の若者での感染が多く見られ、重症・死亡例が低下しているという報告[7]とも、この結果は一致します。


いずれの期間においても、重症例は40代以上に限定されており、20代以下に関しては中等症例すら見られませんでした


f:id:emoriiin979:20200925091249p:plain


こちらは、男女別の集計結果です。グラフを見たところでは、男性の方が比較的重症化率が高いような気がしますが、50代に関しては女性の方が重症化しやすいようです。コロナウイルスの感染数は女性の方が多いので、もしかすると女性は軽症例が比較的多いのかもしれません。


まとめ

この記事では、「新型コロナウイルス感染症が高齢者で重症化しやすい」という情報の真偽を確かめるために、実際に北海道のオープンデータを使ってデータ分析を行いました。

患者の年齢と重症度でクロス集計を行い、結果をグラフで可視化したところ、重症例は40代以降に限定されているので、確かに高齢者で重症化しやすいというのは本当のようです

一応、カイ二乗検定で年齢と重症度の相関分析を行ってみましたが、「年齢と重症度に関連はない」という帰無仮説のP値が3.11×10-49になったので、統計学的にもほぼ間違いなく「年齢と重症度は相互に関連している」といえます


「免疫機能が弱いとウイルスが肺胞に到達しやすい」など、高齢者が肺炎原因微生物に弱いのは医学的にも説明できるので、新型コロナウイルス感染症は高齢者で重症化しやすい」という情報は嘘ではなさそうです


今後の予定

それでは、コロナウイルスによる肺炎は高齢者で重症化しやすいので、この疾患を追跡することで老化のメカニズムに迫るべきか、という最初の問題に戻ります。


確かに、高齢であることと重症化の関係性は証明されましたが、今回色々と肺炎を調査した結果、この疾患を追跡するより別のものを調べた方がよいという結論に至りました。

というのも、肺炎が重症化しやすいのは加齢により免疫機能が落ちているからという医学的な見解がすでにあるようなのです。今回のコロナウイルスでも、健常者ならサイトカインストームのような免疫異常は起こりにくいようで、そもそも免疫機能がまともなら肺胞までウイルスが辿り着く可能性も限りなく低くなります。

また、高齢以外にも糖尿病患者など「基礎疾患」を有する患者も重症化しやすいようです。こちらについても、健常者と比較して免疫機能が落ちているのが原因のような気がします。


ですので、今回の研究結果を受けて、しばらくは「加齢によって免疫機能が低下する原因」を調べるのも面白そうだと思いました。


長くなりましたが、以上がコロナウイルスのデータ分析の結果と考察でした。