yProcessingClub

すみません、許してください

半数が中央値を下回るのは当然か?

政治やマスコミ批判(または擁護)をするつもりは毛頭無く、ワクチンに対しても何か強い気持ちがあるわけではないが、このツイートが気になったのでブログを書くことにした。

報道ではワクチンの抗体量について、「半数の人間が中央値を下回る」という記述があり、ツイッターでは「半数が中央値を下回るのは当然だろ」と炎上した。

中央値とは、データを昇順に並べた際に中央に来る値だ。
3人がいたら、2位の人の値が中央値となる。
4人いたら、2位と3位の平均値が中央値となる。

4人の点数を以下のように設定してみよう。

名前 点数
Aさん 10
Bさん 20
Cさん 30
Dさん 40

ここで、中央値はBさんとCさんの平均値25点だ。
中央値25点を下回る人はAさんとBさんの2人で、この場合は「半数が中央値を下回る」結果となった。

次に、設定を以下のように変えてみる。

名前 点数
Aさん 10
Bさん 20
Cさん 20
Dさん 40

こうなると、中央値は20点となる。
中央値を下回るのはAさん1人のみとなる。

このように中央値に同じ値が複数あって中央値未満の数が少なくなることがあるので、「半数が中央値を下回るのは当然」とは言えないのだ。

とクソみたいな揚げ足取りをしてみた。

冒頭でも述べたが、政治批判や擁護をする気は全く無い。
単に現在統計検定の勉強をしていて、中央値を習ったばかりだったので反応しただけである。


なお、上記の記事はすでに削除され、代わりに以下の記事が投稿された。

www3.nhk.or.jp

広島市医師会は11月、ワクチンの2回目の接種を終えてから3か月から7か月経過した10代から80代までの医療従事者、2744人を対象に血液中の抗体の値を調べました。
その結果、すべての人から抗体が確認されたものの、最も抗体が低いグループの値は中央値に近く、多くの人があてはまるグループに比べ10分の1程度だったことがわかったということです。

ウーン?
日本語が難しいが、「中央値に近く、多くの人があてはまるグループ」という区切り方をするのだと思われる。
また、グループというのがどういう基準で作られているのか説明されていないが、おそらく抗体量でグループ分けした感じだろうか。(例えば0~10をAグループ、10~20をBグループみたいに)



追記ここから
フォロワーの方が以下のような図を作成されていた。
こうだとすれば確かに「最も抗体が低いグループの値は中央値に近く」と「(最も抗体が低いグループの値は)多くの人があてはまるグループに比べ10分の1程度」を矛盾なく説明出来る。
追記ここまで


さて、このニュースでは以下のような疑問がある。

まず、最下位のグループは何人いるのかという点。
「中央値に近く、多くの人があてはまるグループ」というのがあるので、最下位のグループは「少数があてはまるグループ」だと思われる。
最下位のグループの人数が極端に少ない場合(例えば1人)には大勢には影響が無いと言えるかもしれないし、無視出来ないくらい人数が多いのだとすれば共通する因子を知りたいのだ。
例えば抗体最下位のグループは全員80代だったとか、基礎疾患があるだとか、ワクチンを打ってからかなり時間が経った(7カ月経過組)だとか。因子が分かれば必要な対策を打てるだろう。

なお、記事では以下のような記述がある。

広島市医師会の佐々木博会長は、「時間の経過とともに抗体の値が将来的に下がる可能性が高く、3回目の接種を受けてほしい」と述べ、

こういうことなので、抗体量が10分の1のグループはワクチンを打ってからかなり時間が経った人で構成されているかもしれないと想像することが出来る。


次に、抗体量が最も小さいグループは中央値の抗体量の10分の1だったという話だが、10分の1が良いのか悪いのか分からない。
10分の1でも感染予防(及び重体化の軽減)が期待できるなら全然良いし、逆に中央値ですらも抗体量が足りないのであれば大問題である。