2016年3月19日土曜日

2013年に全米を駆け巡った弩級のニュース?医療保険は加入者の健康状態も死亡率も改善させていなかった?パート12

How Not to Cherry-Pick the Results of the Oregon Study (Ultrawonkish)

Megan McArdle

先週、私はJim Manzi氏にオレゴンの実験のことをどう思うか尋ねてみた。彼は、他の会社が実験を行うのを手助けするという事業を行う非常に成功した会社を設立した非常に賢い人物だ。彼は、無作為化試験を用いてビジネス、政策、生活全般を改善することに関して書いたUncontrolledという素晴らしい本の筆者でもある。彼は非常に長く有益な考えを送ってくれた。それを以下に記そうと思う。もしオレゴンの結果に関心があるのであれば全文を読むべきだ。

Some Observations on the Oregon Health Experiment

政策議論に無作為化試験を用いることを強く提唱している身としては、最近のオレゴン州の実験にまつわる議論に深い関心を持っている。私が以前に医療費の自己負担額の話題に関して書いたのはRANDの医療保険実験のレビューだけだったと思う。それは、保険の寛大さの違いが肉体上の健康状態に影響を与えるかどうかをテストした他の唯一の無作為化試験だったと思う。RANDの実験は(1)寛大さの低下は「ほとんどすべての医療サービスの使用量を低下」させた、だが(2)そのサービスの使用量の低下は「肉体の健康状態に悪い影響を少しも与えていなかった」としている。その結果は非常に重要なものだと私に印象づけた。

オレゴンの方も、そのRANDの結果の前半部分を再現した。無料のヘルスケアを提供することにより医療サービスの消費量は増加した。だが、後半部分に関してAustin Frakt, Kevin Drum, Avik Roy, Meganと他の人たちの間で論争が持ち上がった。このサービスの使用量の増加は肉体的な健康状態の改善につながっているのか?

この論争は有益なものだったと思う。だがあまり大きくは触れられていない大事な点が幾つかある。

1.無料の医療保険を提示された人の半分ぐらいが応募用紙を送り返すのさえ面倒だからと断った。

9万人が抽選に参加した(単位は世帯単位ではあったが)。3万5000人が抽選に選ばれその人たちに応募用紙が送られた。だが実際に応募用紙を送り返したのは抽選に選ばれたうちのわずか60%の人だけだった。これは、保険に加入していない人が保険の価値をどのように見ているかを顕示選好という形で非常によく物語っていると少しでも常識があれば分かるはずだろう。

もしあなたの保険に加入していない人のイメージが、病院の外で、貧しい家庭が咳き込んでいる子供に抗生物質を与えるお金もなくて困り果てているというようなものであれば、この結果はそのイメージを大きく大きく覆さざるをえないものとなるだろう。貧しい家庭の抱える問題は些細なものだと言おうとしているのではない。だが抽選に選ばれた人がどうして応募用紙を送り返さないで保険に加入しなかったのかは2つの可能性しかない。(1)保険に加入することにより得られる利益が記入欄を埋めて用紙を送り返すだけの時間と労力に見合わなかった(2)抽選に選ばれた人が非合理的に行動した。保険の有効性という意味において、どちらの説明も都合の悪いものとなるだろう。前者であれば、それは保険が加入者に対して大して価値を持っていないことを意味する。後者であれば、今回の実験で測られたような指標(血圧、血糖値、コレステロール値など)の改善を達成するために必要な治療に対する患者側のコンプライアンスが非常に良いとは言い切れないことを意味する。

もちろん、この議論は応募用紙を送り返さなかった40%だけに当てはまると主張する人もいるだろう。だがそれにも大きな問題がある。

第一に、それは分析に深刻な問題を生み出す。それは抽選に選ばれた60%(順守者)と抽選に選ばれた40%(非順守者)との間に大きくてシステマチックな合理性プラス従順性(ここでは、これをまとめて慎重さと呼ぶことにする)の違いがあることを示唆することになるだろう。これは、抽選に選ばれて応募用紙をきちんと送り返した人と抽選に選ばれなかった人とを単純には比較できないことを意味する。抽選に選ばれなかった人の中で、もし選ばれていたら誰がきちんと応募用紙を送り返した人だったのだろうかを私たちは知らない。本来であれば、抽選に選ばれた人とそういう人とを比較しなければならない。もちろん、オレゴンの研究者たちは対照群の中から人種、性別、以前の健康状態などに基づいて計量モデルを用いて「そういう風に見える人」を選んできてそれと比較している。だが誰かが私に人種、性別、以前の健康状態などに基づいて誰が慎重で誰がそうでないのかを自信を持って(それも高い精度で)言えない限りは、順守者と非順守者との間に慎重さに大きな違いがあるとの仮説の下では、抽選に選ばれたすべての人と抽選に選ばれなかった人とを単に比較したものだけを正式な結果として公表している今回の結果は「治療に対する態度」の影響によって歪められたという方向により近づけざるをえないだろう。この研究の補論のデータによると、治療に対する態度の影響は順守者に対する効果の4分の1ほどの大きさとされている。これは推計された影響の75%を消し去るだろう。

第二に、これは非現実的な仮定だということがより重要だ。応募用紙にきちんと記入した人とそうでなかった人との間にそれほど大きな断絶があるとは極めてありそうもない。従順さは違いがあるとしてもその変化は遥かになだらかなもののはずだ。平均的に見て、順守者の方がそうでない方よりもより従順であるとは言えるかもしれない。だが従順さの欠如は無料の保険を受け取った方にも程度の問題として存在するはずだ。すなわち、無料の保険を受け取った人たちが健康に関する判断を行う際のその慎重さの平均は一般的なアメリカ人よりも低いと考えられる。その明らかな証拠として、オレゴンで今回無料の保険を受け取った人たちの半分(48.4%)は喫煙をしている。それに対して、アメリカ人の成人の喫煙率は25%以下だ。これは受給者を責めているのではない。無料の保険を受け取った人たちが平均的なアメリカ人よりも治療のプロトコルに従う傾向が低いとどうして思われるのかという議論をしている。保険に加入した結果として、どうして非常に小さな影響しかなかったのかが少しは不思議ではなくなる。それ故、この実験の分析において順守者の結果の方がより信頼を置けるものと言っていいだろう。それらの結果は衝撃的なものだった。

2.もし統計的に有意でないというこの結果を信頼できるものとして受け入れるのであれば、病気になっている人の心臓は保険に入ることにより悪くなる。

治験群は対照群と比較して血圧が高い、コレステロール値が高い、糖化ヘモグロビン値が高いと診断される割合が低かった。だがそれらのどれ一つが統計的に有意ではなかった。言い換えると、95%の確率でその違いが単なるノイズの結果であるということを棄却できないということを意味している。

これは、保険が何の効果もないと言っているのではない。実際、保険はそれらの指標に何らかの影響を与えたと私なら答えるだろう。ある程度大きな行動を取って、それが文字通り何の効果もないということはそうそうあるものではない。もし誰かが私を脅迫して保険に加入することによる真の影響を言えと言われたとすれば、この論文で示されている値をそのまま伝えるだろうと思う。だがその値に自信があるかと言われればほとんどないし、その値に従って政策当局者として行動するかと自問しても相当に躊躇われるだろう。

この実験がある程度の確証を持って私たちに伝えていることとは、それらの影響がほぼ間違いなくある値Xよりも小さいということだ(哲学的には、それでさえも確実には言えないのではあるが)。この話題の中心は、保険の真の影響がXよりも小さいのかどうか、小さいとしてもそれでも無視できないほどには大きいといえるのかどうかだろう。これは、本人たちは無自覚のうちによく尋ねている以下のような質問によく表れている。その実験の「検出力」はどうだったのか?

Frakt, Drumや他の人たちの考えは以下のように分類できると思う。(1)この実験には肉体的な健康状態へのあるXという影響を95%の有意差で検出する力があった(2)Xという影響は95%の有意差では検出されなかった(3)これは影響がXよりも小さいということを排除しない(4)これは影響がゼロであることも意味しない(5)実際、それぞれの影響は有意ではなくても正ではある。上で述べた欠点を考慮するとこれら一連の言明に賛同できる所もある。だが、それではまったく不十分だ。

死亡率の例を考えてみる。死亡率が少し変化しただけでも保険に加入していない人の人数と掛け合わせればある程度の人数になる。それを倫理的には重要だとここでは呼ぶことにしよう。それぐらいに小さな変化を検出できるかどうかには非常に懐疑的だ。それ故、「この影響は今回の実験では検出されなかった、だがそれでも無視できないほどには大きい」という議論は完全には反証できない。

では、そもそも分析自体を行うべきではないというのか?第一に、無料のものは存在しない。どのような介入にも費用が掛かる。そのような態度ではより効率のよい他の選択肢も閉ざされてしまうだろう。第二に、保険が死亡率を増加させるのではなく低下させるのかは定かでは全然ない。保険が負の効果を持つことは理論的にも十分に考えられる。

ここではフラミンガム・リスク・スコアを例に取り上げる。

フラミンガム・リスク・スコアは年齢、コレステロール値、血圧、血糖値、喫煙などに基づいて心臓病のリスクを予想するものだ。オレゴンの研究では、慢性的に疾患を抱えている人々(糖尿病、高血圧、コレステロール血症、心筋梗塞、うっ血性心不全などを研究の前に抱えていた人として定義)のフラミンガム・リスク・スコアへの影響を調べている。この調べによると、それらの人々に対して保険はリスクを引き上げている。言い換えると、保険は病気がちな人の心臓の状態を悪くしている。そしてこの影響は高血圧(p値が0.65)、高血糖値(p値が0.61)、高コレステロール値(p値が0.37)よりも遥かに有意水準に近い(p値は0.24)。

もし統計的に有意ではなくてもそれぞれの部分は正の効果を示しているという議論を受け入れるのであれば、保険の心臓病への効果は負であるという結果を拒否できる理由はない。

だが、この負の影響(有意ではないものの)は表面的には不可解に見える。血圧値、血糖値、コレステロール値がよくなっているのだとすれば全体のリスクが悪くなっているのはどうしてか?答えは、喫煙にある。

3.…大部分は、保険が喫煙を招くから。

保険に加入していない人たちの喫煙率は42.8%だ。保険に加入したグループでは、これが48.4%に上昇する。この違いも統計的に有意ではないが他の指標よりも遥かに有意水準に近い(p値は0.18)。これは難しいことでも何でもない。保険に加入した人たちは(四捨五入して)48%が喫煙するのに対してそうでない人たちは(四捨五入して)43%が喫煙する。これは、はっきりと保険に加入したグループの健康に対して悪い。

保険が人々に危険な行動を促すようになるというのはまったくもってありうることだ。保険に加入した人のうちの何割かが喫煙の害を無視してそれ故タバコを吸うようになるというのは直感的にも理解しやすい。もしあなたが社会的介入の非実験的分析により重きを置くようなタイプの人間であれば(私はそのようなタイプの人間ではない)、この結果は保険が実際に危険な行動を誘発するようになることを示した過去の幾つかの非実験的研究の結果をむしろ補強する。

従って、この一連の影響(有意ではないけれども)は皮肉かつ有害だ。誰かが保険を提供されたとする。これは医療サービスの消費量を増加させる。それが今度は非常に小さな肉体の健康状態の改善に繋がるとする。だが保険はそれらの人々に喫煙をも促す。最終的な結果はその実験の始めに病気がちであった人の心臓の状態を悪くするということになる。

公平を期すと、サンプル全体のリスクスコアはほんのわずかにそれも有意とはかけ離れているが(p値が0.76)低下している。これは心臓病のリスクが0.2%低下したことを意味する。従って、この統計的に有意ではないが的な論理を極限にまで押し上げると、保険が心臓病に与えた全体のリスクは、病気だった人(文字通り悪くなった)から健康な人(遥かに数が多い、ほんの少しだけ健康になった)へと健康を再分配することによってサンプル全体がほんの少しだけ健康になったと議論することが出来るだろう。

そして、この「健康の逆進的な再分配」やメディケイドに掛かっている費用(50兆円)、他の改革の選択肢を閉ざしてしまうことその他すべてを考慮しないとしてさえも、これが人口全体にとって改善を意味しているのかどうかは少しも定かではない。保険の影響の組み合わせを考えだすと(肉体的な健康状態の指標の非常に小さな改善に対して喫煙の増加)、信頼区間の左側が極めて重要な意味を持ち始めるようになる。今回の実験で、心臓の状態は本当に悪くなったというほうが遥かに妥当に思えてくる。それ故、保険を提供するのに掛かる費用を考慮するまでもなく、保険を拡大することのリスクに慎重にならなければならない。

以下のような賭けに参加していると仮定してみる。60%で1億ドルを得る、40%で1億ドルを失うとする。資産が1億ドル以下であればすぐに破産し以後は生存に必要な以上の賃金はすべてその借金の支払いに回されるとする。この賭けに参加するだろうか?期待値が正であるにも関わらず多くの人はこの賭けに参加しないだろうと自信を持っている。これは、リスクを取るのに代償を支払わなければならないからだ。この種のリスク調整は、95%の確率またはそれ以上でいえるならば特に問題とはならない。だが全体的な改善がほんのわずかで病気の人にとって負の効果が大きくその賭け率も76%であるならば、合理的意思決定の計算に非常に重要になってくる。

まとめると、(1)最も有意水準に近かった影響は保険が喫煙を増加させて病気の人の心臓の状態を悪くするというものだった(2)サンプル全体の心臓の状態の改善効果は信じ難いほどに小さい(3)この影響は病気の人をより悪くすでに健康だった人の健康をほんのわずかに改善することによって為されている(4)この影響はリスク調整ベースの下ではほとんど確実に魅力的でない。今回の結果からは、健康が改善したという議論を正当化することは出来ない。

4.結局、何なのか?

(それほど重要ではなかったので省略)

0 件のコメント:

コメントを投稿