2016年12月10日土曜日

平均寿命はほとんど意味がない数字だった?

The Numbers Behind Life Expectancy

CARL BIALIK

(中略)この論争を理解するためには、平均寿命がどのように計算されるのかを振り返ってみることが有益だ。それにより論争の元となっている数字が問題含みで、そもそもこの指標で国際間の比較を行うことに意味があるのかどうかということが明らかとなる。

人口学者は平均寿命を特定の年齢の個人が、平均で見てどのぐらいの年数生存すると予想されるかという意味で定義している。メディアでは、マイケル・ムーアとCNNの間で論争になったように、出生時の平均寿命が頻繁に用いられる。すべての平均寿命は生命表と呼ばれるものから計算されていて、ここには例えばxという年齢に到達した人々がx+1という年齢に到達する割合が示されている。例えば、2003年では70歳のアメリカ人は97.7%の確率で71歳に到達するとCDCは報じている。生存確率は各年齢で死亡した人数をその年齢の総数で割ることによって求められる。

平均寿命は架空のグループ、例えば10万人の人々などを想定して、それぞれの年齢で何人が亡くなると予想されるのかを計算することによって求められる。そして彼らの死亡時の平均年齢を計算する。この計算の最大の問題点は、例えば2007年に生まれて2077年まで生存すると仮定される架空の人々の70歳時点での死亡率が現在の70歳の人々と同じであると仮定していることだ。

「私たちは実際のコーホートを追跡して調査しているわけではありません」とCDCの死亡統計の主任責任者Robert Andersonは私に語った。彼は、薬が将来には改善されているだろうから現在の平均寿命統計は過少申告されていると付け加えた。だが新しい病気の出現などの予期せぬ出来事により、その逆の影響がもたらされるかもしれないと加えた(サハラ以南の多くのアフリカの国々ではエイズの拡散により平均寿命が大幅に低下した)。

平均寿命は自己申告による誤った数字やデータの収集法が一貫していないことなどによっても影響を受ける。1933年以前に生まれたアメリカ人は出生証明書を受け取っていないかもしれない。幾つかの州では届けが義務化されていなかったためだ。1933年以前生まれでさらに自分の年齢に確信を持っていない人は年齢を丸める傾向がある。恐らく特定の年齢に到達することは誇らしいことだと思われているからだろうと彼は語った。このように高齢層において他の年齢よりも5や0が相対的に多く見られるようになる現象は「age heaping」と呼ばれている。CDCは年齢の証明が求められるメディケアのデータを用いることなどによりこの問題を回避している。「この方法も完璧ではありません。ですが死亡率をより正確に反映しているのは確かだと思われます」と彼は語った。

より大きな疑問は、平均寿命が医療システムの全体的な質やアクセス性を本当に示しているのかどうかということだろう。ペンシルバニア大学のサミュエル・プレストンは、アメリカの平均寿命は過去に過剰に喫煙をしていた人々によって歪められていると記している。「医療システムの違いによって平均寿命の違いがすべて説明できるとほのめかすことはミスリーディングだ」とAndersonは語っている。

Why 'life expectancy' is a misleading summary of survival

David Spiegelhalter

所得を表すのに平均を用いることは非常にミスリーディングだと嫌になるほど教えられてきた。所得の分布は(正規分布からは)非常に歪んでいて、少数の豊かな人が平均を絶望的なまでに歪めてしまうことがあると教えられてきた。だから所得には一般的に中央値(所得分布の中央の値)がよく用いられる。そしてこの中央値が平均的な個人の所得として広く解釈されている。

だが話が平均寿命になると、誰もが先程の原則を忘れて平均の概念だけを用いるようになる。そして、所得の時にもそうであったように、平均寿命においても分布に歪みがあるために平均はミスリーディングな指標となっている。

このことはイギリスの生命表を見ることによりはっきりと確認できる。ここには各年齢での10万人あたりの予想死亡者数で表現された生存率の確率密度を示したdxdxとラベリングされている便利なコラムがある(死亡率は現在のままで一定と仮定されている)。女性と男性の生存率の分布を2010年から2012年の生命表を用いて以下に示す。分布はまずゼロ歳のところで小さなピークがあり、左に偏っている様子がよくわかる。それから急激に上昇しピークを迎え100歳までは再び急激に低下していく。死亡率の「圧縮」は明らかだ。



左側に偏った分布というのはむしろ珍しい。だがそれが意味するところは同じだ。平均値と中央値、それに最頻値は非常に大きく異なる可能性があるということだ。この生存率の分布を例とすると、最頻値が平均値からかけ離れているということが恐らく最も印象に残ることだろう。現在生まれた女性は、例え生存率が現在と変わらないと仮定したとしても、彼女たちが死亡すると思われる年齢は90歳だ。平均値である83歳よりも7年以上長い。現在生まれた男性が死亡すると思われる年齢は86歳で、これも平均値である79歳よりも7年以上長い。それが「平均寿命」がミスリーディングだと考える理由だ。

もちろんこれらの「期間生命表」は死亡率が将来においても変わらないと非現実的にも仮定している。一方では、平均寿命は年間に3か月のペースで増加している。これは年間の死亡リスクが2%ぐらいのペースで低下していっていることを示している。ONSは「コーホート生命表」と呼ばれるものも作成している。幾つかの死亡率の見通しを立ててそれに沿って平均寿命を計算したものだ。「中心的な見通し」では現在生まれた女性の平均寿命は94歳で、(私の大まかな計算によると)中央値と最頻値は100歳ぐらいだ。そして現在生まれた男性の平均寿命は91歳で、中央値と最頻値は96歳ぐらいとなっている。生存率の上昇が現在と同じペースで続くという少し妥当とは思いにくい「高い」見通しでは、現在生まれた子供は平均で見て100歳以上生きると想定されている。

以下、イギリス人のコメント?

alison@oconnell

Misleading life expectancy

この問題を取り上げてくれて感謝しています。この問題は私が博士号の論文のテーマとして取り上げて以来、20年経っても未だに悩まされています。期間平均寿命は最も悪質な意味でミスリーディングです。私たちがどれぐらい長く生きるのかを過小評価してしまうことにつながります。この問題は個人にとっても公共政策にとっても重要です。問題はすでに名称の中にも表れています。「life expectancy」は予想される生存期間を必ずしも意味するものではありません。de Moivreは1725年に「expectation of life」を大体そのような意味で定義しました。ですが平均寿命はせいぜいがある一時点でのあるグループの健康状態のようなものをサマリー的に表したものに過ぎません。メディアでは「平均寿命」がよく持ちだされますが、実際にはそのようなものを表しているというわけではないのにそれがどれぐらい生きることが出来るかを示しているものだと誤解されています。より詳しく知りたいのであれば、Longevity Bulletin 1 on actuaries.org.ukを見てください。

Nick Ergodos

The median is always better

実用的な目的のためであれば、すべての場面において中央値は平均値よりも優れていると思う。これは平均寿命や所得に限った話ではない。サンプルサイズが十分大きければ、いずれにしても中央値は平均値に近づくのだからすべてにおいて平均値を中央値に置き換えても失われるものは一つもないように思われる。私たちは合理的な理由があるからではなく、単にこれまでそうしてきたからというだけの理由で平均値を用いているに過ぎない。この問題に関してより詳細に記してあるので、http://philpapers.org/rec/ERGTEOを見て欲しい。

0 件のコメント:

コメントを投稿