2012年11月22日木曜日

医療費が個人破産の半数を占めるはエリザベス・ウォーレンの作り話?(後編)

筆者はカナダのシンクタンク所属、カナダ在住。

The Medical Bankruptcy Myth

by Brett J. Skinner

医療に関する議論は個人破産の2/3が医療費支払いか病気による所得の喪失が原因となっているという論争となった研究に影響を受けている。2005版のこの研究?によると個人破産の半分以上が医療費が原因になったという。これらの研究の筆者たち、David Himmelstein, Deborah Thorne, Elizabeth Warren, and Steffie Woolhandlerは医療破産の問題はカナダのような公的保険によって解決できるという。

この研究は政治家からの人気を集めたようだ。オバマ大統領は医療費支払いと個人破産との疑わしいつながりを例に挙げて自らの政策を正当化した。「医療費が30秒につき1件の割合で破産を引き起こしている」と彼は3月に宣言した。「今年の年末までに150万人が家を失うだろう」と彼は述べた。

7月28日の「医療費が個人破産を引き起こしているのか?」と題打たれた司法委員会の聴聞会で医療破産の研究が取り沙汰された。より最近ではUSA Today誌のコラムでNancy PelosiとSteny Hoyerが医療破産を例に挙げて政策を正当化した。

だが医療破産の研究は幾人かの研究者によって否定されている。これにはDavid Dranove and Michael MillensonとAparna Mathurらを含む。医療費の支払いにより多くのアメリカ人が破産に追い込まれているというのは作り話だ。

Dranove and Millensonは2005年版の医療破産の研究を批判的に分析した。彼等はHimmelsteinらの主張に仮に大幅に譲歩したとしても医療費支払いは17%に影響しているに過ぎないと結論した。彼等は司法省のものも含めた他の研究も調べ、破産申請者のうち医療費が破産の一因となったと答えた人でも医療費に関連する債務は全体の債務残高の12-13%を占めるに過ぎないことも発見した。

公的保険が破産を減少させるという考えに対してはアメリカとカナダの破産率を比較することが役に立つ。カナダは公的保険を持つ。Himmelsteinとその共著者のロジックに従えばカナダの破産率はアメリカよりも低いことが予想される。

比較可能な年度に限られるが個人破産率は実際はカナダの方が高い。国民全体に破産申請者が占める割合はアメリカで2006に0.20%、2007に0.27%だった。カナダでは2006、2007ともに0.30%だった。データは政府の公式統計からのもので両国共に同様の定義を用いており時期は2005のアメリカの破産法改正後、2008のリセッション前のものだ。

2005の改正はアメリカの破産法をカナダのものに非常に似通ったものにしたという点で注目に値する。2005の前まではアメリカで破産申請が極めて容易で国際間の比較はほとんど無意味となっていた。さらに2008には住宅ローンのデフォルトが起こった。住宅ローンのデフォルトは個人破産率と相関していると思われる。よってアメリカとカナダの2008の比較は医療に関連しない要因によって影響されているのであまり意味のないものとなる。

公的保険以外で破産率に影響する医療的、社会的、法的な違いを考慮する必要がある。両国共に失業保険がある。失業は両国ともほぼ同程度の頻度で起こっている。2007の失業率はカナダで5.3%、アメリカで4.6%だった。

カナダの人口の1/3しか処方箋薬に対しては公的保険に加入していない。従業員は薬の保険を給付として受け取るが残りの国民(低所得層、高齢者を除く)は現金で支払う。

長期の失業、障害、低所得層への医療のアクセスも両国で同一だ。非営利団体や、地域の医療センター、メディケイド等が提供している。

破産申請者の債務の大部分は医療支出と関連のない部分で成り立っているので医療保険とはほとんど関係がない。

医療費支払いが個人破産に直結する稀な出来事として、どちらにしても公的保険の支払い対象とならないような治療への患者からの要望(高額であったり、最新鋭であったり、または終末期医療)がある。カナダではこれらの治療に対して公的保険が適用されない割合が時と共に高まっている。

実際(彼らと同様の定義を用いた)カナダ政府により実施された調査によると公的保険にも関わらず、医療関連の支払いがカナダの高齢者の破産の主要な要因として挙げられていた。

公的保険がアメリカで個人破産を減少させる根拠はない。アメリカとカナダの比較は破産統計が政治的目的のために利用されたことを強く示唆している。

医療費が個人破産の半数を占めるはエリザベス・ウォーレンの作り話?(前編)

Medical Bankruptcy:Myth Versus Fact

by David Dranove Michael L. Millenson

David Himmelsteinとその共著者はこのケース(医療破産が半数を超える)が増加していると主張している。「医療費が個人破産の原因の半分を占めている」と彼等は書いている。「普通の世帯が困窮に追いやられている」と彼等は主張している。そして公的医療保険の導入を主張する。

メディアや政治家は彼等の発見に関心を持ち彼等の研究をケネディ大統領の言葉を引用しながら説得的だとして賞賛した。不幸なことに彼等の研究を詳細に調べればこの結論が非現実的だという3つの理由が浮かび上がってくる。

第一に医療費が個人破産の原因の半分を占めるという彼等の主張の因果関係を立証できていない。彼等のデータを用いて我々が分析したところ因果関係らしいと思われるものは個人破産の17%だった。のみならず彼等のデータは普通の世帯の生活が脅かされているという彼等の主張も支持していない。個人破産と医療費の関係を調べた40年間のこの分野の研究の蓄積が我々の見方を支持している。これらの研究では半分よりはるかに小さい数字を報告している。Himmelsteinとその共著者が普通のアメリカの世帯だと報告した世帯の平均世帯所得は250万円だが、その水準はむしろ低所得層に近いものだ。

第二に以下の政策的議題に対する回答を彼らは示していない。公的保険は個人破産にどのように影響を及ぼすのか?最大に大きく見積もって、彼等は医療費の支払いが個人破産の17%の要因になっていることを示したがこのことは医療費が最も重大な因果関係であることを意味しない。彼等は因果関係の強さを示していないばかりか、他の要因(失業、教育費、住宅費等)を制御していない。実際Himmelsteinとその共著者が引用した研究では(彼等は述べていないが)健康問題等の事態が起こったとき家計が破産に追い込まれるという主張に対してほとんど支持をしていない。

第三に彼等の主張である公的保険が個人破産を大きく減少させるはミスリーディングだ。彼等はその影響度は保険の範囲に依存していることを認める。我々の分析では彼等の意味するこの文脈での(包括性)ははるかに広範な定義を必要とすることを示す。

Himmelsteinとその共著者は2001に個人破産に分類された1771人の個人を調査した。彼等は同時に債務を持つ332の世帯に質問をしているがこれらの質問は医療破産の件数を計算するのに用いられていない。よって我々は前者に焦点をあてる。

彼等は(3つの節からなる)Exhibit 2に結果を纏めてある。第一の節では以下の特定の理由のうちから1つを回答した世帯の割合を報告している(病気または怪我、家族の誕生または死亡、アルコール、薬物、ギャンブルの問題)。彼等が示したという医療費と破産の間の因果関係を推量できる箇所は調査の中でわずかこれだけしかない。理由として最も頻繫に回答されたものは病気と怪我で回答者の28.3%だった。

第二の節では医療に関連する様々な質問に対して回答した人数を報告している(病気による少なくとも2週間の所得の喪失、前2年の間に医療費の支払いが10万円を超えた等)。筆者等はこれを医療に関連する破産としている。回答者が病気や怪我を破産の原因と主張していないにも関わらずだ。彼らはこのようにして回答者の54.5%が医療破産したと報告している。

彼等の論文が発表されてすぐにNational Review Onlineに批判が表われた。多くの批判は医療破産の定義に集中していた。特に2年間で医療費が10万円以上という定義に対して批判が向けられた。批判者はそれらの人々は支払い能力があったはずだと述べる。Himmelsteinとその共著者は それに対して2つの理由を挙げる。第一にこのグループの平均医療費支払いは110万円を超えていて負担になりうると主張している。だが平均はほんのわずかな外れ値に影響を受けている可能性が高い。Leslie Conwell and Joel Cohenは2002に20%のアメリカ人は医療に32万円消費したと報告している。そして5%が115万円以上消費した。それでも後者の集団が全体の消費の半分を占める。回答者の消費の中央値と分布を知ることは有意義な情報となるだろう。

第二にHimmelsteinとその共著者は回答者の何人かは支払い能力があったことを認める。しかし彼等は医療に関連する債務がなければその他の支払いにお金を費やすことができただろうと主張する。さらに医療に関連する債務の残高は過小評価かもしれないと述べる。クレジットカードで支払われたかもしれないからだ。第一の議論はすべての支出にあてはまりほとんど無意味だ。どのような支出でも破産の原因になりうるからだ。第二の議論はすべての債務は代替可能なので破産の原因を一つの債務形態に限定して特定することは不適当だという事実を単に強めたにすぎない。

低所得世帯の金銭的状況を統計局のデータから示す。年間所得が220~400万円の家計は平均で200万円を住宅に、90万円を食費に、80万円を交通に、25万円を衣服に、45万円を医療に消費する。

この所得水準はHimmelsteinとその共著者の言う平均所得と比較的近い。そして筆者等のいう「普通の世帯」よりも低所得層と普通の世帯の狭間という特徴に近い。年間所得250万円の世帯は中央所得よりも4人世帯の貧困線の水準により近い。

220~400万円の所得範囲にある多くの世帯にとって、(仮に破産したとしたら)破産の前の2年間に医療に費やした数千ドルは債務の一角を占めるに過ぎない。彼等は他に支払わなければならない多くの債務を抱えている。さらにいくらかの医療の支払いに対して前もって準備しておくことは合理的だろう。医療費の支払いはそのタイミングは予想できないだろうがそれが起こるかどうかはある程度予想可能だからだ。

さらに過去との比較は注意を要するとはいえ、1960年代の中頃から続けられている研究は一貫して医療の支払いは債務のマイナーな部分を占めるに過ぎないと結論している。

司法省はCharles Grassley議員からの要望に答えて5203件の個人破産の事例を調査している。調査は2000から2002の間でHimmelsteinとその共著者らと同時期だ。司法省は申請者の90%の医療費の債務残高は50万円以下だったと報告している。医療に関連する債務があると答えた申請者でそれらの債務残高は全体の債務残高のわずか13%を占めるに過ぎなかった。司法省はHimmelsteinとその共著者らの主張に対して「個人破産の50%が医療費に関連しているという主張は公式の文書からは立証されていない」と述べている。

Himmelsteinとその共著者らの方法論に関するより深い問題をはっきりさせなくてはならない。医療費が個人破産と関連していると示すだけでは不十分だ。医療費が破産を起こしているかどうか、そしてそうだとしたらその程度を判別しなければならない。つまり相関から因果へと進まなければならない。そうすることによりHimmelsteinとその共著者らのデータを再分析することができる。

彼等の研究で因果関係を述べた部分はExhibit 2の初めの部分だけに過ぎない。病気と怪我が破産の要因と答えた人でその支払いが破産にどの程度影響したのかを識別しなければならない。

Himmelsteinとその共著者によると回答者の28.3%が病気と怪我が破産の要因であると述べたという。彼等は医療費の支払いがこのグループの60%で要因になったという。2つの数字を掛けることにより(あくまでも彼らの言うことを真に受けるという前提のもとであれば)サンプルの17%が医療費に関連する破産だったというように結論することができる。その17%に対してさえ医療費が破産の最大の要因だったかどうかを判断することはできない。

多くの要因を考慮に入れた過去の研究はHimmelsteinとその共著者とは違った結論を導き出している。以下にその結果をまとめる。

CBOは1994から1998までに75%増加した個人破産申告者を夥しい量の文献を調べて分析した。調査期間中は従業員1人あたりの医療費の増加率は5%以下で、退職者まで含めた増加率は1994に初めて減少した。それにも関わらず破産率が急激に増加したのは医療費以外の要因が影響したことを示唆している。

CBOは破産に影響した多くの要因を挙げている。医療費支払い、離婚、失業による所得の喪失、債務管理の甘さなど。破産を容易にする法律の変更も要因に含まれるかもしれない。CBOは破産に至る要因でどの要素が相対的に重要だったのかを判断するにはまだ多くのことがわかっていないと報告している。

Fay, Hurst, and Whiteの研究はHimmelsteinとその共著者が唯一引用した経済学、ファイナンスの分野の論文だ。しかしそれもほんの一部分だけからに過ぎない。彼等の研究を全体に渡って読むとHimmelsteinとその共著者の結論とは対立する点がいくつも見つかる。個人破産の情報を含む1996からのパネルデータを用いてFayとその共著者は影響した要因を判別するためにプロフィット分析を行った。前年に家長か配偶者が健康問題を抱えていたかどうかもその要因の中に含まれる。債務水準を制御することにより彼等は破産と健康の間には何のつながりもないことを発見した。これは医療費に関連する債務は他の債務同様に一因ではあり得るものの最も重大な要因ではないという考えと整合的だ。彼等は破産は債務の累積に対する反応であって何か特定の一因によるものではないと結論した。

Domowitz and Sartainは1980に破産申請をした827世帯を調べ破産申請をしなかった1832世帯と照合させた。彼等はロジット分析を行って破産に至った特定の要因を識別しようとした。彼等は最初に高額な医療費に関する債務(所得の2%を超過)が破産の確率を引き上げる最大の要因だと述べた。彼等はこの結果に対して2つの考察を加えた。第一に国民のほんのわずかしか高額な医療費に関する債務を抱えていない。第二に雇用の喪失と相関しているかもしれない。この要因が破産に影響しているならば医療費に関する債務の係数には上向きにバイアスが掛かっているかもしれない。債務の元となる多くの要因を考慮に入れた後で彼等は破産の唯一最大の要因はクレジットカードの債務残高だということを発見する。

Himmelsteinとその共著者は以下の論点を暗示的に持ちかける。医療費支払いがどの程度個人破産を引き起こし、公的保険でそれがどの程度減少するのか?彼等の論文が事実を取り違えて非現実的な結論を導き出しているのはこの政策議題に関する部分だ。

彼等はカナダの医療破産率が低いことを要因としてあげる。彼等が挙げた数字の根拠となるものはカナダの個人破産の7.1-14.3%が健康に関連しているというTexas Law Reviewの記事だけだ。多くの研究が否定しているにも関わらず彼等は医療費と破産の間に強い結びつきがあると仮定している。実際両国の急激な破産率の上昇を分析したこの研究ではこの上昇を信用へのアクセスが容易になったことと結論している。

この要因はHimmelsteinの共著者の1人であるElizabeth Warrenが2001のインタビューではっきりと述べている。「今日では消費者が多くの債務を抱えるようになったのでわずかな医療費の支払いでさえ金銭的問題に追いやってしまう」と。このような要因がある中でHimmelsteinとその共著者の1人であるSteffie Woolhandlerが共同出資しているPhysicians for a National Health Planからのプレスリリースは正当化することが難しい。そこにはHimmelsteinとその共著者が公的保険だけがこの問題を解決できることを示したと書かれてある。

Himmelsteinとその共著者は公的保険が自己破産を減少させる程度は保険の範囲に依存していることを認める。彼等はこれ以上詳細に踏み込まないが、2004の肺がんと診断された女性の費用に関する調査が、彼等の言う範囲がどの程度なのかを示している。調査では月額の直接費用の平均値は$597(計算の便宜上1ドル=100円にしてきたが実際のレートは80円なのでここではドル表示にする)で総費用$1,455(労働から離れることによる費用を含む)の41%だった。これは雑多の費用(スピーチセラピー等)や備品(洗浄剤等)に掛かった$134を含む。治療に関連しない直接費用は$131(子供の世話等)で間接費用は$727(患者とその家族の労働から離れた時間等)だった。つまり雑費と治療に関連しない費用が月額支払いの2/3を占める。これらの費用を制限するためには現在のどの公的保険が持つよりもはるかに広い範囲の包括性を必要とするだろう。

2012年11月10日土曜日

公共事業をやると経済が悪化する?

Government Spending and Private Activity

by Valerie A. Ramey

1 Introduction

短期の経済活性化の目的のために政策当局者が政府支出を用いるかどうかを決定する際には次の2つのことが考慮されなければならない。(1)政府支出の増加は民間支出を押し上げる方向に作用するか?(2)政府支出の増加は雇用を増やし失業を減少させるか?第一の点に関して、仮に政府支出の増加が民間部門の支出を押し上げないなら民間の厚生が向上している保証はない。第二の点に関して、政策当局者は雇用の創出も重要だと述べるだろう。理論的にはオークンの法則を用いてGDP乗数を失業の乗数に変換することができる。だがこの法則のパラメータの時間に対する変動の大きさにより産出乗数から雇用または失業の乗数への変換は難しい。よって政府支出が産出に与える影響とともに雇用に与える影響に注意を向けることは意味がある。

ここでは政府支出が民間の消費と失業と雇用に与える影響を調べる。民間支出を(GDP-政府支出)と定義する。structural vector autoregressions(SVARs)を用いてもexpectational vector autoregressions (EVARS)を用いても、サンプルに第二次世界大戦時のデータを加えても朝鮮戦争時のデータを加えても、または除いても、政府支出の増加は民間支出の有意な増加にはつながらないことを示す。実際、大半のケースで有意に下落している。この結果は政府支出乗数が1を大きく下回っていることを示唆する。

ここでの推計は政府支出の増大が税でファイナンスされたケースを多く扱っている。よって債務でファイナンスされた場合に直接当てはまるとは限らないかもしれない。そこで二通りの方法でこの問題に対処する。一つ目はVARを用いて反実仮想のデータを作成する方法で、二つ目はより構造的な操作変数を用いて推計する方法だ。驚くべきことに二つの方法とも限界税率の変化が支出乗数にほとんど影響を与えていないことを示している。

最後の部分で政府支出の失業と雇用に与える影響を調べる。第二次世界大戦時の事例を調べることから始め、次にその他の事例にVARを用いる。政府支出の増加は失業を低下させていたが、その雇用の増加のほとんどすべては政府雇用の増大で民間雇用の増大ではないという驚くべき結果が得られた。

2 Background

2.1 Output Multipliers

支出乗数の研究には大きく分けて2種類ある。第一の種類はGDPの成長率を当期と一期のラグをとった防衛支出(または防衛支出を操作変数に用いた政府支出)で回帰分析するものだ。これらの研究は乗数が1を下回る傾向がある。

第二の種類は月次のデータを用いて推計されたVARだ。これらにはRamey and
Shapiro (1998), Blanchard and Perotti (2002), Mountford and Uhlig (2009), Fisher
and Peters (2010), Auerbach and Gorodnichenko (2011), and Ramey (2011a)が含まれる。

これらの研究のいくつかは政府支出の反応の山をGDPの反応の山と比較することにより乗数を求めている。その他のものは2つのインパルスレスポンスのエリアを比較して求めている。以前の記事で述べたように乗数の推計値の幅はしばしば同一の研究内でも異種の研究間でも広い。あまり述べられていないが興味深い特徴としてこの推計の幅にはあるパターンがある。特にBlanchard-Perotti型のSVARはexpectational VARs (EVARS)よりも低い乗数が求められる傾向にある。この結果は興味深い。なぜならSVARは消費の上昇を示す傾向があるのに対して、EVARは政府支出の上昇に対して消費の下落を示す傾向があるからだ。全体としてほとんどの乗数の推計値は0.5から1.5の間にある。

2.2 Labor Market Effects of Government Spending

最近増えてきた研究には政府支出の労働市場に与える効果に関するものがある。それらの研究の大半は州間の支出の変動、または地域の支出の変動が雇用や所得に与える影響に焦点をあてている。

Ramey (2011b)でまとめたようにそれらの研究は平均で見て一単位の雇用を生み出すのに350万円(1ドル=100円)の政府支出を必要とする。だがその雇用の増加の効果はすぐに消えてなくなることも報告されている。

最近発表された研究は、経済全体でみた政府支出ショックの労働市場変数に与える影響が分析されている。

その推計によると政府支出の増加は失業率と離職率を下げ、欠員率と就職率を上昇させる。だがそれらの推計は不完全でその推計値のほとんどは標準的な有意水準のもとでゼロと差がなかった。

その一方で、Bruckner and Pappa (2010)は政府支出の増加の失業に与える影響をOECD加盟国の月次データを用いて調査した。彼等が標準的なSVARを用いても、符号制約を用いても、Ramey-Shapiroの防衛支出のデータを用いても、政府支出の増加は失業率を上昇させることを発見した。ほとんどのケースで失業率の上昇は5%水準で有意だった。

2.3 The Distinction between Government Purchases and Government Value Added

なぜ産出の乗数と雇用の乗数の間に一対一の対応がないのかを理解するためには民間財に対する政府支出と政府の産出との違いを考慮することが役立つ。

National Income and Product Accounts(以下NIPA)では政府購入Gは民間部門からの財の政府購入と政府の付加価値(政府の雇用者への報酬(軍隊への支払い等のような)と政府資本の消費)とを共に含む。

Finn (1998)は動学的な新古典派モデルを用いてこの問題を調べた。彼女は政府雇用の増加としてのGの増加と民間部門からの財の購入としてのGの増加は民間部門の産出、雇用、投資に対してそれぞれ逆の効果があることを示した。

図1に産出を分割する2通りの方法を示す。上段はどの主体が財を購入したかにもとづいて財とサービスを分割する通常用いられる方法だ。ここでのGは通常のNIPAの分類である「財とサービスの政府購入」を示す。産出の残りは民間部門により購入され消費、投資、純輸出に割り当てられるかのいずれかだ。中段は誰が財とサービスを生産したかにもとづいて経済を分割してある。政府による生産は政府が直接労働者を雇用し資本財を購入した場合に発生する。付加価値はこの部門による生産として加算される。例として教育、治安、防衛、そしてその他の政府の活動が挙げられる。

残りすべての生産は民間部門で行われる。3段目はこの2通りの分割を重ね合わせてある。この段が示すように政府購入Gは政府の付加価値(Y Gov)(政府自身が産出し自身に購入する)と民間部門からの財とサービスの政府購入(GPriv)から成り立つ。軍備増強期間中では政府はより多くの軍人を雇うので政府の生産が増加しさらに民間から財(戦車など)を購入する。従ってGの両部分が増加する。

異なる種類の政府の支出でなぜ効果が異なるのかを理解するために以下の新古典派モデルを考える。まず初めに民間の付加価値に対する生産関数を仮定する。

(1) YPriv = F(NPriv , KPriv)

YPrivは民間の付加価値、NPrivは民間の雇用、KPrivは民間の資本ストックだ。民間部門が利用可能な労働者の人数は以下の労働資源制約により決定される。

(2) NPriv = T - NGov - L

Tは賦存された時間、NGovは政府雇用、Lは余暇だ。1つ目の方法として政府は労働資源制約に従って民間部門から資源を引き出す。2つ目の方法として政府は自身が民間財を購入することにより民間部門から資源を引き出す。この場合では資源制約は民間の産出そのものだ(注 政府は民間が生産する以上のものを購入できない)。

(3) YPriv = C + I + NX +GPriv

GPrivは民間部門からの政府購入だ。NIPAの各分類からのGの総和は次のようになる。

(4) G = GPriv +YGov

YGovは政府の付加価値で政府の資本と政府の雇用を以下のように組み合わせることにより生み出される(注 例えば教師(政府雇用)と学校(政府の資本)が組み合わさって政府の付加価値が生み出されるみたいな)。

(5) YGov = H(NGov , KGov)

労働市場と生産関数に関する妥当な仮定の下で民間と政府の産出の相対価格は同一になり、よってGDPの合計は以下で与えられる。

(6) Y = YPriv +YGov

この種類のモデルの文脈では政府支出の増加は総雇用を増加させる(注 明らかに民間から雇用を奪うケースがあるというのに)。だがその増加の程度はGの増加自体が民間財の購入によって生じた増加がより大きいのか政府の産出と雇用によって生じた増加がより大きいのかに依存している。我々は政府による民間財の購入の場合では民間部門の雇用が増加する(可能性がある)が政府の産出と雇用の場合では民間部門の雇用は減少すると予想する。従って全体の雇用が増加したからといって必ずしも民間部門の雇用が増加したことを意味するのではない。だから民間と政府の雇用を区別することが重要だ。

3 The Effects on Private Spending

大部分の研究では政府支出乗数は産出の山と政府支出の山を比較することにより求められる。またはインパルスレスポンス関数を特定の区間に渡って積分することにより求められる。普通は標準誤差は示されない。だが産出と政府支出の部分に関して誤差範囲が大きいので乗数の誤差範囲も大きいと考えられる。非耐久財消費や固定資本投資などの民間支出の構成部分に関する研究は誤差範囲に関して混み合った結果を示す。これから示すように単純なVAR変数の置換によってより正確に以下の疑問に答えることができる。平均で見て、政府支出の増加は民間の支出を増加させるのか?この疑問に答えるため変数に一つの修正を施した(ただしその他は多くの研究で用いられているものと変わりがない)。ここではGDPではなく民間支出(Y - G)を用いる。

3.1 Econometric Framework

民間支出に政府支出ショックが与える影響を調べるために以下のVARを推計する。

(7) Xt = A(L)Xt-1 + Ut ,

Xtは1人あたり実質政府支出の対数値G、1人あたり民間支出の対数値(Y-G)、平均限界税率、3ヶ月物T-billsの利子率、さらには以下で手短に説明する識別のための鍵となる変数を含むベクトルだ。利子率と税率変数は金融政策と税政策の影響を制御するために用いている。A(L)はラグ演算子の中の多項式だ。ここではすべての変数の4期ラグと2次の時間トレンド項を含む。

いくつかの主要な識別方法を考慮する。それらは以下のようになる。

1.Ramey News EVAR:政府支出の変化が予想されているかもしれないという懸念から。Ramey and Shapiro (1998)は外生的なショックとして防衛支出の大幅な増加につながる軍事衝突をダミー変数として用いている。Ramey (2011a)ではこの考えを拡張しBusiness Week誌などの情報源を用いて軍事衝突によって引き起こされた政府支出の期待割引現在価値の変化の系列を構築している。この系列を前期(前四半期)のGDPで割ることにより"news" seriesを作成した。この系列は行列"X"に含まれる変数の一覧を補足し、ショックはこの系列に対するショックとしてnews seriesを先頭に配置したコレスキー分解を用いて識別される。Perotti (2011)はニュースを組み込んだVARを"Expectational VARs"または"EVARs."と名付けた。

2.Blanchard-Perotti SVAR:Blanchard and Perotti (2002)は政府支出へのショックを総政府支出を先頭に配置した標準的なコレスキー分解によって識別した。VARの中にニュース系列は含まれていない。

3.Perotti SVAR:Perotti (2011)はSVARと私(論文筆者)のEVARはニュース系列を防衛支出、または連邦支出で置き換えれば等価になると主張した。ショックは先頭に配置されたこの変数に対するショックとして識別される(総政府支出もVARの中に含まれている)。私の返答で議論したように(Ramey (2011c))、この方法によって作り出されたインパルスレスポンス関数とオリジナルのBP(Barro Redlick)の方法にはわずかな違いしかない。念のために防衛支出を用いて補足した方法からの結果も示しておく。結果はBlanchard-Perotti SVARとほぼ同一だったのでこの結果はappendixで示す。

4.Fisher-Peters EVAR:Fisher and Peters (2010)は株式のリターンをもとに予想された政府支出の増加を計測する代替的な方法を開発した。彼等は防衛企業の株式の累積超過リターン(その他の株式市場に対する)を防衛支出の予想された増加の指標として用いた。この系列は1958から2008まで利用可能だ。従ってこの特定化は初めのものと同一ではあるがRamey news 変数をFisher-Peters news 変数に置き換えてある点が違う。

3.2 VAR Results

図3に私のニュース変数を用いたEVARの結果を示す。初めのうちの2つの例では政府支出は大幅に増加し6期頃に山となる。ニュース変数に対する「実際の」政府支出の遅延反応は、政府支出の変化は実際にそれが変化する少なくとも数期前には予想されているという私の仮説と整合的だ。1939-2008のサンプルでは民間支出は最初にわずかに増加するがその後ゼロをわずかに下回るまで減少しGDPの0.5%ぐらいで谷となる。1947-2008のサンプルでは民間支出は最初にGDPの0.5%ぐらいまで増加した後、ほんの数期のうちにゼロまで減少する。この結果はRamey (2009b)で述べた予想の効果と整合的だ。その研究で示したようにシンプルな新古典派モデルでは将来の政府支出の増加に関するニュースは政府支出が数期は増加しなくても即時の産出の増加につながる。従って理論的には民間支出は最初に増加しその後減少することが予想される。加えてRamey (2011a)で述べたように朝鮮戦争の影響が第二次世界大戦後のサンプルの中で大きい。耐久消費支出のデータやその当時の報道で騒がれていたように、朝鮮戦争の開始は耐久財の買占めなどの混乱につながった。多くの人が第二次世界大戦時のような配給制が差し迫っていると恐れていたからだ。これは初期の効果が正になるもう一つの経路になりうる。朝鮮戦争後のサンプルでは私のニュース変数のF統計量が低いのでこの期間のサンプルの結果には疑問がつく。それでも念のため結果を示しておく。この期間の誤差範囲はずっと大きい。民間支出は大きく減少するが統計的に有意ではない。

図4にBlanchard-Perotti SVARの結果を示す。EVARとは違い、この場合では政府支出は3つのサンプルすべてで即時に増加する。初めの2つのサンプルで民間支出は政府支出の増加に対して大幅に減少する。この減少は乗数が1を大きく下回ることを意味する。朝鮮戦争後のサンプルでは民間支出はゼロをわずかに下回るがこれも統計的に有意ではない。Appendix Figure A1にPerotti (2011)によって提唱されたSVARの結果がほぼ同一であることを示す。

図5にFisher-Peters type SVARの結果を示す。ここでは政府支出ショックは防衛企業の株式の超過リターンへのショックとして識別されていることを思い出して欲しい。前回までとは違い(前回までは6期で山となり12期から14期の間に元に戻る)今回はより長期間に渡って政府支出が増加する。政府支出は20期たってもわずかしか減少しない。民間支出はゼロ近辺で振動する。だが統計的に有意になるのは負の値が相対的に長期間続いた時だけだった。

従ってSVARの結果とEVARの結果はほぼ同一の回答を示す。政府支出の増加は民間支出を刺激しない。実際、多くの場合でむしろ減少させている。

興味深い点はVARの結果は乗数が時間によって変化している可能性を示していることだ。乗数は政府支出が山をつけた時に減少している。これはGordon and Krenn’s (2010)の政府支出の増加がより穏やかだった時の方が乗数が高かったという結果と整合的だ。

3.3 The Effects of Taxes and Implications for Multipliers

上記の結果はGDPに関する乗数が1以下であることを暗示している。すべての場合で政府支出が民間支出をクラウドアウトしている。だが、政府支出の増加は部分的に税によってファイナンスされている。表6にBarro and Redlick (2011)の平均限界税率のインパルスレスポンスを示す。6つのうち5つの場合で税率は顕著に増加している。税率はRamey News EVARでより増加している。

Romer and Romer (2010)はナラティブアプローチを用いて外生的な税のショックを計測する手法を構築した。彼等はGDP1%に相当する誘導型の税ショックの効果が3年目の終わりまでにGDPの2.5%から3%の減少につながることを示した。彼等の推計は政府支出が潜在的に国債でファイナンスされた場合の方が税でファイナンスされた場合よりも乗数が大きい可能性があることを示唆している。

税の増加が乗数をどれだけ減少させるのかを調べるために2種類の実験を行った。1番目は架空の分析を行うために推計されたVARを用いる。2番目は操作変数を用いる。1番目では、実際に推計されたインパルスレスポンスを、税率が変化しなかったという仮定のもとで得られたものと比較する。つまり税率式の中のすべての係数をゼロとする。それから残りの式から実際に推計された係数と税率式からのゼロの係数を用いて動学的シュミレーションによるインパルスレスポンスを求める。

図7に政府支出と民間の産出を示す。Ramey News EVAR、Blanchard-Perotti SVARともに政府支出、民間の産出でほとんど変化がない。結果がほとんど変化しなかったことは税率の係数はゼロとほとんど変わらなかったことを意味する。

VARは基本的に誘導型の関係式なので結果に対する経済学的な解釈を加えることは難しい。なので2番目の実験では政府支出と税が民間の産出に与える影響を操作変数を用いて個別に推計する。以下の基本となる4半期モデル(年間データを用いたBarro and Redlick (2011)のと構造的に同種の)を特定化する。

(8) ΔStPriv/Yt-1= β0 + β1 ΔGt/Yt-1+ β2Δ4 taxt + β3Newst + εt ,

SPrivは実質民間支出(Y - G)、Yは実質GDP、Gは実質政府支出、taxは税率、NewsはRamey (2011a)から、そしてこの変数は軍事衝突によって引き起こされた政府購入の期待割引現在価値の変化に等しい。残りは誤差項だ。税率の4期変化が用いてあるのはBarro-Redlickの同様の変数が一年に一回しか変化しないからだ。ニュース変数の当期の値を操作変数として加えることが重要だ。私の以前の研究によれば民間主体は実際に支出が起こる前に将来の政府支出に関するニュースに反応を示す。以前の研究では負の資産効果の重要性とその他の潜在的な要因(投資の調整費用と将来の配給制の懸念による消費財の買占め)が投資の前倒しを促す可能性があることを指摘した。

政府支出も税率も経済の状態に影響を受けるのでこれらの財政変数と税率が誤差項と相関すると予想する。従って推計には操作変数法が必要になる。税率に関する自然な方法はRomer and Romer (2010)の外生的な税の変化を記したナラティブアプローチによって構築された変数の系列だ。この変数は年間納税額の変化が財政赤字の懸念によって制定された法律によるのか長期の経済成長を促すために制定された法律によるのかを区別して求められている。従って税制の変化が税率の変化を通してのみ経済に影響を与えているのかが識別のための鍵になる。Romer-Romerの結果は1945-2007までしか利用可能できないので推計には第二次世界大戦のサンプルを除かなければならない。政府支出に対してはニュース変数のラグ値を操作変数として用いる。識別のための仮定は当期のニュース変数の値は独立に民間支出に影響を与える一方で、ニュース変数のラグは当期の政府支出の変化を通してしか経済に影響を与えないというものだ。この仮定は他にも効果を与えるラグ変数がある時には疑問符がつくようになる。よって支出成長率のラグ、政府支出のラグ、税のラグを加えて頑健性を評価する。1947-2007の期間のサンプルを用いて、操作変数のラグを12期まで調べる。Cragg and Donald (1993)の統計量を最大化したのでそれぞれの操作変数に対して4期のラグを用いる。

表1に推計結果を示す。上段は税率がBarro-Redlickの平均限界税率として定義されたケースで下段は税率が当期の税収がGDPに占める割合として定義されたケースだ。1列目は式から税率の変化が除かれた場合の結果を示す。政府支出の変化が民間の産出に与える効果は-0.7で標準誤差は0.26だ。この推計はGDPに対する乗数がわずか0.3であることを意味する。逆に将来の政府支出に関するニュースは当期の民間支出を増加させる。将来の政府支出の期待割引現在価値の1ドルの増加が当期の民間支出を5セント増加させる。この効果は正確に推計されている。高いCragg and Donald (1993)の統計量はweak instrumentsであるという帰無仮説を棄却できることを意味している。

2列目は税率が含められた場合の基本モデルの結果を示している。どちらの税率の特定化に対しても政府支出の係数は、政府支出の1ドルの増加が民間支出を55セント減少させることを示している。ニュース変数は正で有意である一方、税変数は負で有意ではなかった。Cragg and Donald (1993)の統計量は7-8の間で、Stock and Yogo (2005)の操作変数の関連性(適切性)の棄却限界値である15%の水準でweak instrumentsであるという帰無仮説を棄却できることを意味している。よって税の影響を制御することにより政府支出が民間支出に対して与える負の影響は-0.7から-0.55へと0.15減少する。誤差の大きさから考えてこの変化(0.15)はおそらく統計的に有意ではないだろう。

さらに当期のニュース変数の値を説明変数から取り除き代わりにそれを政府支出に対する操作変数として含めた場合の効果についても調べてみた(結果は表に示していない)。Barro-Redlickの税率が用いられた場合、政府支出の係数は-0.64で標準誤差は0.29だった。よって政府支出の負の効果はニュース変数が除外された時にさらに大きくなる。税変数の係数はわずかに正ではあるがゼロと変わりなかった。

表1の3列目に民間支出の伸びのラグを制御した場合の効果を示してある。この変数は統計的に有意ではあるものの政府支出の係数をほんのわずかだけ減少させるにすぎなかった。最後の列に政府支出と税のラグを加えてある。この結果はいくつかの係数に対して不正確な推計となり低いCragg-Donaldの統計量となった。その他の説明は表から外してある。年一回の税率の変化を四半期に置き換えたもの、政府支出の変化を年一回から四半期に置き換えたもの、Barro-Redlickの税率をGDPのラグに占める税収の割合で置き換えたものなど。結果はほとんど変わらなかった。

Ramey (2011b)では債務でファイナンスされた場合の政府支出の増加に対する乗数はおそらく0.8-1.5だろうと述べた。この時に私が下限を0.8に置いたのはRomer and Romer (2010)の結果から、税がGDPに与える影響は大きい、という考えにもとづいていた。ここでの結果はそれと食い違う。VARの推計から反実仮想的に構築された結果は当期の税率は政府支出乗数に対して何の影響も与えていないことを意味している。税率の変化を制御した操作変数による推計は乗数をわずかに0.15から0.2に増加させただけだった。操作変数による推計はGDPに対する政府支出の乗数が0.5であることを意味する。この結果はBarro and Redlick (2011)の結果と非常に近い。

4 The Effects of Government Spending on Unemployment
and Employment

(思いのほか長くなってきたので省略)

一言で言えばすでに述べてある通り、公務員を増やしただけで民間の雇用は増えなかった。

2012年11月4日日曜日

日本の医療費はアメリカの医療費を超えた?

長いので4章まで飛ばして興味を持ったら最初から見るのを推奨する。

The OECD’s Study on Health Status Determinant: Roles of Lifestyle, Environment, Health-Care Resources and Spending Efficiency: An Analysis

by H.E. Frech III

I. Introduction

II. Measuring Health

c. Adjustment for Disease Prevalence

OECDのレポートの筆者達は死亡率は有病率で調整されるべきと述べている。

有病率の高さは医療資源の利用の増加と悪い結果に結びつく。

レポートの中で有病率を調整していないことは見かけの非効率性にバイアスをかける。Kenneth Thorpe, David Howard and Katya Galactionova (2007)らによる最近の研究では最も費用の掛かる病気に対する有病率がアメリカで欧州より高いことを示している。これらの要因のいくらかは肥満やたばこなどの生活習慣(例、肥満、心臓病、呼吸器疾患)であるが、さらに検査の高頻度の使用や病気の初期段階での治療が関係している。

III. Discussion of the OECD Choices of Measuring Health

A. PYLL Explained

Potential years of life lost(PYLL)はある特定の潜在的生存期間を基準とした計測手段だ。基準となる年齢以前の死亡は理想化された世界では起こらなかったであろう喪失年数となる。その名前が示唆するように生命が損失された年数で計測される。基本的には1人あたりや百万人あたりの潜在的喪失年数を計測することができる。

レポートでは基準は70歳に置かれている。70歳以上の生存は無視される。他にも65歳で定義される場合がある。レポートでは10万人あたりのPYLLが使用されている。PYLLは喪失年数を全体に渡って加算することにより計算することが出来る。

このことを単純な例でみるために2400人の人口がいる国を仮定する。1000人が20歳、800人が50歳、600人が80歳だ。年内に5人の人が亡くなった。1人が20歳の集団から、2人が50歳の集団から、3人が80歳の集団から亡くなったとする。この時、PYLLは

(70-20)(1/1,000)(1,000/1,800)(100,000)
+ (70-50)(2/800)(800/1,800)(100,000) = 5,000.

レポートが述べるようにPYLLはLE(Life Expectancy)と比べて死因を特定して調整できるというメリットがある。これにより医療システムと関係のない事件や事故などその他の要因を除外することが出来る。死因が報告されているのでPYLLを用いればこのような拡張が可能だ。さらに医療との係わりについて議論のある要因も除外することができる。加えて病気の種類毎にPYLLを計算して医療システムとその他の要因がPYLLに与える影響を分析することができる。

PYLLはLE同様に乳幼児死亡率による影響を受ける。この影響は病気の種類により異なる。心臓病などに関するPYLLは一般のPYLLに比べて乳幼児の死亡からの影響が小さい。これらの病気による乳幼児の死亡は稀だからだ。呼吸器系の疾患によるPYLLはLE at birthよりも強く影響を受けるかもしれない。これらの疾患が乳幼児に特に多いからだ。OECDのレポートはいくつかの死因をPYLLの計算から排除している。輸送車両による事故、転落死、自殺、事件などだ。だがこのリストで十分か否かははっきりとしていない。

事故や事件の被害者は時間を置いて関連する病気によって死亡するかもしれない。さらに事故や事件の被害者は医療資源をより多く使うかもしれない。これらの要因は考慮されていない。さらに外的要因であるものの病気を介して起こった死亡(肥満、循環器系の疾患、公害、呼吸器系の疾患)も除外されていない。よって調整したPYLLを用いても外的要因の影響を除外できていない。

B. Infant Mortality and External Factors

OECDのレポートは乳幼児死亡率はPYLLの場合LEよりも外的要因による影響を受けにくいと述べている。だが実際には逆だ。乳幼児死亡率は医療の結果として見做すには2つの大きな問題を抱えている。第一にデータの定義の問題と各国の慣行の違いに影響を受ける。例えばアメリカの医師は後に死亡する非常に小さな乳幼児の蘇生を他国より試みる慣行がある。この慣行は乳幼児死亡率を引き上げる。同様に他の国では出産の直前?(出産前)に死亡した乳幼児は死産として分類される慣行がある。特に日本とフランスで顕著だ。アメリカでは生存の可能性の極めて低い乳幼児も生産(せいざん)として記録されることが頻繫にある。フィラデルフィアでの記録を詳細に調べたGibson et. al. (2000)の研究では生存の可能性の低い乳幼児を生産として扱うこの慣行だけで乳幼児死亡率が40%過大評価されていると述べている。同様の慣行がある国の医療システムを非効率に見せてしまう。この違いは定量的にも重要だ。Korbin Liu and Maryln Moon (1992, p. 109)はこの要因を調整することにより調査対象国内でのアメリカの順位を15番目に押し上げ、日本の順位を3番目に押し下げると報告している。

さらに別の問題がある。追加の治療は生産(せいざん)ではあるものの生存確率が低い乳幼児が誕生する確率を引き上げるかもしれない。もしそうなら追加の治療は見掛けの乳幼児死亡率を引き上げてしまう。この追加の治療を行う国の見掛け上の医療費を引き上げ見掛け上の結果を悪くしてしまう。

第二により重要なことに乳幼児死亡率はその他の外的要因(特に母親の生活習慣(肥満、たばこ、飲酒、薬物の使用))に強く影響を受ける。乳幼児死亡率は出生時の体重に強く関係している(出生時の体重自体が生活習慣の影響だ)。遺伝の影響に関しては議論がある。しかし個人レベルでは明らかに生活習慣の影響が大きい。10代での妊娠は低体重の出産の確率を引き上げる。未婚の母親から生まれた乳幼児が死亡する確率は既婚の母親から生まれてくる乳幼児の2倍高い。10代での妊娠による出産の乳幼児の死亡率は1.5-3.5倍高い。アメリカの10代での妊娠は非常に多い(主にアフリカ系アメリカ人が原因で)。カナダの2.8倍、スウェーデン、日本の7倍だ。アメリカの乳幼児の出生時の体重の分布がカナダと同一ならば乳幼児死亡率はカナダより低くなる。乳幼児死亡率とは離れてもこの要因は医療費を直接引き上げる(低体重の乳幼児への医療は費用が掛かるので)。

乳幼児死亡率は平均寿命の計算において重要な要因を占めているので医療の生産性を分析するにあたって平均寿命は平均余命よりも問題のある指標であることを示唆する。Martin Neil Baily and Alan Garberはこう述べている。

平均寿命は新生児の死亡率に強く影響を受ける。ある程度は医療の影響を受けるだろうが新生児の死亡率は医療とは直接の関連性がない社会的要因に強く影響されている。平均寿命は医療の生産性を計測する指標としては適していないかもしれない(Baily and Garber 1997, pp. 188-189)。

C. Adjusting the Measure for Non-Health-Care Causes

OECDのレポートでは輸送事故のような医療とは関連のない要因による死亡が推計に混入している可能性について言及されている。その議論はより多くの他の要因についても拡大されなければならない。すでに述べたように不完全ながらもPYLLに対して調整を加える方法が考えられる。LEに対しては医療と関連のない死因を調整する方法が2通りある。どちらもモデルを必要とするので判断の必要性と議論を呼ぶ。これについては3章で議論する。最初に部分的ではあるが簡単な方法から議論する。

2. Birthweight-Specific Infant Mortality

すでに述べたように出生時の体重は生活習慣の影響を強く受ける。そして乳幼児死亡率に強く影響を与える。出生時の体重を揃えることにより外的要因の影響を除外することができる。この効果は非常に大きい。出産時の体重に関連した乳幼児の死亡率はカナダよりアメリカの方が低かった。これは2国の乳幼児死亡率の違いのすべてを出生時の体重で説明が可能なことを示している。より多くの国に対象を拡大したLiu and Moon (1992, p. 115)の研究ではアメリカとその他の国の乳幼児死亡率の違いのほとんどを出生時の体重の分布の違いで説明できることを示した。

3. Life Expectancy and Non-Health-Care Causes of Death

a. Adjusting the Life Expectancy Variable

LEは標準化されたLEに拡張することができる。標準化されたLEは外的要因を除外したLEだ。実際の水準ではなく外的要因により引き起こされた死亡が平均的だったらと仮定した場合のLEだ。アメリカの場合は外的要因が平均だと仮定した場合の期待LEとなる。この方法のより一般化された手法がOhstfeldt and Schnider (2006, pp. 5-33)により試みられた。単に外的要因を標準化するのみでなく1人あたりGDPも標準化している。

Ohstfeldt and Schniderは1人あたりGDP、輸送や転落による事故、殺人、自殺等を考慮している。1980-1999までのOECDのデータを用いて各国のLEの違いの79%を説明した。その推計は標準化LEを作成するのに用いられる。その残差(各国の実際のLEとモデルによるLEとの差)は各国の過小評価、過大評価を示している。この残差は期待LEに加えられる。その結果は各国の外的要因(と1人あたりGDP)が平均水準であった場合の期待LEとなる。この期待LEはすべての独立変数をその平均値に設定した場合のモデルによる予想値だ。結果は標準化されたLEとなる。これにより外的要因を除外できる。

OECDのレポートと比較するならば次の段階はこの標準化したLEを用いて生産関数を推計することになる。Ostfeld and Schneiderはここでは替わりにあまり一般的でない手法を用いている。彼等はこの期間の平均LEを、元のデータと標準化したデータとで比較している。違いは大きい。元のLEではアメリカのLEは75.3だった。フランスは76.6、日本は78.7、スウェーデンは77.7だった。標準化したLEではアメリカは76.9、フランスと日本は76.0、スウェーデンは76.1だった。アメリカがこの基準ではトップだった。この分析では外傷による死亡を調整してあるが生活習慣などの要因は調整していない。元の調整を加えていないLEの差はこれらの外的要因に強く影響を受けていることが示唆される(注 このOhstfeldt and Schniderの研究に対してOECDから反論が寄せられている)。

IV. Specification of the Panel Data Regressions

1. Health Care Resources

a. Total Spending

OECDのレポートの中で医療に費やされた資源を計測する方法として2通り用いられている。総支出はそれぞれの部門毎の総和として示されている。これは治療の種類(薬に対する支出やその他の支出、または政府と民間等)によって生産性が異なる場合には問題がある。総支出に対する係数はそれぞれの部門の加重平均和として推計される。

おそらく、もっとも重要なことは医療支出は医療PPPレートではなく一般のPPPレートによって共通通貨に変換されていることだ。医療支出とは医療に投入された実質の資源の量を意味することを想起する必要がある。適切でない為替レートを用いることにより医療支出を正しく計測することができなくなってしまう。医療価格がアメリカで高いのでこの誤計測はシステム的なものになる。

よく用いられるものとして3つの為替レートがある。市場レート、経済全般に対するPPPレート、医療に特化したPPPレートだ。市場レートはここでの目的には明らかに問題がある。このレートは金融取引とインフレ期待に強く影響を受ける。このレートは変動が大きく実質的に用いられた資源を表現するのに明らかに適していない。例えば2001年の1月1日のドル/ユーロレートは0.95だった。7年後の2008年の1月1日では1.47になっている。55%の上昇だ。だから仮にユーロ圏の医療支出が域内通貨でみて変化しないと仮定するならば、ドルでみて55%上昇したようにみえるだろう(注 時々見掛けるアメリカでは盲腸が100万円は素人がこれを地でやっている)。この点をIan Castles and David Hendersonが説明している。

特定の2国の市場レートは両国の価格差を適切に表していない。よって適切な比較結果を生み出さない。価格効果を取り除くことによってのみ、そして各国のGDPを共通の価格で評価することによってのみ有効な評価を生み出すことができる(Castles and Henderson, 2005, p. 9)。

PPPレートは基準となる通貨一単位の購買力にもとづいている。フランスで0.85ユーロで購入できたものがアメリカで1.00ドルかかったとする。フランスのユーロでの支出に1.18を掛ける(1/0.85)ことによりアメリカでの対応する実質資源に変換することができる。これを経済全体に渡って行ったものが(GDP)PPPレートだ。さらに産業特有(医療、製薬)のPPPレートを定義することができる。OECDのレポートや他の資料でよく見掛けるようなGDPPPPレートを用いるのはGDPPPPレートと医療PPPレートが比例的な時にのみ正しい。つまりその他の財と医療の相対価格が一定という条件が国際間に渡って満たされている時にのみGDPPPPレートの使用が正当化されるだろう。おそらく国際的に取引されたり標準化されている財で構成される産業ではこの一定の相対価格という条件は近似的に正しいだろう。

だが医療の相対価格は国によって異なる。よって医療PPPレートはGDPPPPレートとは大幅に異なると思われる。表1と図1に1990の医療PPPレート、薬価PPPレート、GDPPPPレート、さらに医療PPPレート、薬価PPPレートとGDPPPPレートとの比率を示す。ここでのPPPレートは1ドルを購入するのに必要な他国通貨の単位量だ。イタリアのGDPPPPレートが1,421というのは1ドルを購入するのに1,421リラを必要とすることを意味する。これらのレートの比率が示すのはGDPPPPレートを用いることにより生じた他国が実質に投入した資源の過小評価の度合いを示している。医療支出に対する平均比率は0.67だ。薬剤支出に対する同様の比率は0.70だった。これらOECD各国で消費されたGDPPPPレートで換算された医療資源は医療PPPレートで換算された医療資源よりも30%ほど低いことがわかる。他国のドル単位での実質資源の推計値を得るためにはGDPPPPレートで換算された医療支出に表にある比率の逆数を掛ける必要がある。その逆数はGDPPPPレートと医療PPPレートとの比率だ。これはレポートの健康の生産に用いられている見掛けの医療資源に大きな影響を与える。

表2と図2に示すように、医療PPPレートの使用はその他のOECD各国の医療の実質資源投入量を大幅に引き上げる。最初はアメリカの支出の50%だったものが78%にまで上昇する。その差は56%ある(28%ポイントの上昇)。興味深いことに医療PPPレートが用いられた場合にはアメリカの支出は最も多いものではなくなる。フランスとノルウェーがアメリカの支出を凌ぐ。



この違いは医療価格がアメリカで高いことを原因としている(注 逆に価格差は3割程度)。GDPPPPレートを用いた表2の数字は医療支出の国際間比較の際によく目にするものだ。欧州内でも、その他様々な指標を用いても実質支出の推計には大きな幅がある。

注35 比率では混乱を招く恐れがある。概念を整理するために以下の例を考える。ある年のイギリスの医療支出が2000ポンドでGDPPPPレートが1.5ドル/ポンドだったとする。ドルでのイギリスの医療支出は、1500ポンド×1.5ドル/ポンド=2250ドルになる。

次に医療価格がイギリスで低いために医療PPPレートが2.0ドル/ポンドだったとする。用いられた資源を反映したイギリスの実質医療支出は、1500ポンド×2.0ドル/ポンド=3000ドルになる。

元のGDPPPPレートの2250ドルに戻って、同様の結果を医療PPPレートとGDPPPPレートとの比率を掛けることにより導くことができる。つまり、2250ドル×(2.0ドル/ポンド)/(1.5ドル/ポンド)=3000ドルになる。

これがテキストと図2で用いた手法だ。

OECDのPPPレートの研究プログラムの中で、Ian Castlesは医療PPPレートとGDPPPPレートのどちらを用いるかにより日本とアメリカの投入された医療資源の推計に大きな差が生じることを示した。GDPPPPレートを用いた場合は1993年のアメリカの支出は日本の支出の224.5%(約2.24倍)になった。医療PPPレートを用いた場合はアメリカの医療支出は日本の支出のわずか86.9%になる。この数字を真に受ければ、この差は医療の相対価格が日本で低いことから生じている。Castlesは価格差が大きいことは尤もらしくないと考え、この結果を医療PPPレートが信頼できるものではないことの証左であると受け取った。日本の見掛けの医療価格は上で分析した他のOECDの各国よりも低い。医療PPPレートが信頼できるものではないという信念は今も昔もOECD Statistics Directorateとレポートの筆者たちの考えだ。だが医療PPPレートに頼らなくても医療価格が国際間で異なることを示す多くの方法がある。以下でそれを示す(H.E. Frech IIIは言及していないが例えばアメリカ、カナダ、イギリスなどはそれぞれ行われた手術の回数などを記録している)。

注39 その他の可能性は日本の医療データは信頼できないというものだ。この懸念から以前の研究では日本のデータは取り除いてある。

Price Controls and Systematic Measurement Errors

b. Physical Measures of Health Care Resources

医療資源を計測するその他の方法としては物質的投入の総量を用いることが考えられる。レポートでは人口1000人あたりの医療労働者の人数の指標を作成している。この指標では看護士を医師の半分として評価している。この指標は医療支出の計測の代替として用いられている。レポートでは重み付けは限定的なものだと述べられているが、この種類の重み付けは客観的なデータから得られたものでMark Pauly (1993)によってなされている。Paulyはより多くの種類の労働者(多くの未熟練、半熟練労働者)を含め、アメリカでの相対賃金を用いて重み付け指標を作成している。よって他の限定された計測方法よりも信頼できるものになっている。さらに数量の違いも重要だ。医師と看護士は合計でアメリカの医療労働者の18.6%を占めるにすぎない。医師が3.4%で看護士が15.2%だ。Paulyの分析は1988のデータにもとづいている。医師のウェイトはその他の労働者の4.83倍とされている。OECDのレポートでは医師のウェイトは看護士の2倍だ。OECDの数字は人口1000人あたりの医療労働者の人数で示されている。この方法よりは労働人口の比率を用いたほうが良い。その他の改善方法は医師にのみ焦点を絞ることだ。

医療に投入される物質的資源を分析することにより興味深い点がいくつか浮かび上がる。第一にアメリカの医療で実際に用いられる資源の量は一般に用いられるGDPPPPレートでの支出とは大幅に食い違うということだ。医療PPPレートを用いた場合と同様に、だがより驚くべきことに、アメリカの医療は特に資源を多く使っているというわけではないことが分かる。例えば最も包括的なPaulyの指標を用いるとアメリカの医療資源の使用は12ヶ国中6番目で平均を下回る。医師と看護士のみのより範囲の狭い指標を用いても14ヶ国中4番目になる。医師のみでは18ヶ国中9番目でまた平均を下回る。アメリカでは相対的に看護師の割合が高くその他の労働者はOECDの平均よりも少ない。よってOECDのレポートはアメリカの医療資源の使用を過大評価している。最も重要なことはアメリカは医療において多くの労働資源を用いているのではないということだ。GDPPPPレートの使用は大いに誤解を招くものだ。そのデータを用いることは大きなバイアスを生み出し不正確な描写となってしまう。

V. Results of the Panel Data Regressions

A. Lifestyle Variables

肥満はよく国民の健康状態の決定要因と見做される。広い意味での生活習慣の代理指標と考えられるからだ。基本的には肥満は寿命を縮める。

レポートが肥満を考慮に入れるべきだと述べていることは正しいかもしれない。さらに肥満の人はより多くの医療資源を消費する傾向にある。Roland Sturm (2002)は肥満は36%医療資源の消費の増加につながり77%薬の消費の増加につながることを示した。Eric Finkelstein, Ian Flebelkorn and Guijin Wang (2003, pp. w3-219, w3-224)はアメリカの医療消費の5.3%は肥満が原因で9.1%は肥満と過体重が原因であることと示唆している。OECDのレポートはこう述べている。

肥満に関するデータは容易に比較可能なものとはなっていない。28の国でデータが集められているがしかし非常に不正確だ。さらにほとんどの国では自己申告である一方、他の国では実際の身長と体重とから計測されている。

同じ箇所でレポートは概念的な問題を挙げる。

より根本的には肥満を国民の健康状態の決定要因と見做すべきか(生産関数の右辺に入れるべきか)健康状態の計測そのものと見做すべきか(生産関数の左辺に入れるべきか)という問題がある。肥満は生活習慣に強く影響されていて医療にあまり関係していないというのははっきりしているように思われる。

VI. The DEA Approach

VII. The Productive Efficiency of Different Health Care Systems

A. Estimates

WHOの関連する仕事がOECDと同様に非難されている。観察できない異質性を医療の非効率性として割り当てている仮定に対してだ。

過去の研究には生活習慣の重要性を示したものがいくつかある。Victor Fuchsは年齢を調整したネバダ州とその隣のユタ州の死亡率を比較した。これらの州は乾燥した気候から医療までほとんど似通っている。それでもネバダ州とユタ州との死亡率の違いは驚くべきものだ。40-49歳の成人では男性で54%女性で69%高い。原因は生活習慣の違いではっきりしている。ユタ州のモルモン教徒は健康な生活を心がけておりアルコールとタバコの消費は少なく離婚率も低い。ネバダ州は逆だった。この2州の健康の違いを2州の医療の違いと見做すことは大きな誤りだろう。

OECDのレポート以外にも医療の効率性を調べた研究はいくつもある。これらの結果はレポートの主張とは完全に異なっている。Or, Wang and Jamisonの推計はレポートの推計と直接比較可能な数字ではない。彼等はレポート同様に各国の異質性を制御するためにダミー変数を用いている。だが彼等はこのダミー変数の係数を医療の効率性を示すものとしては解釈していない。レポートと違い彼等は医療資源投入(ここでは医師/人口比率)の効果が各国において異なることを許容している。彼等はこの変数の係数の違いが医療の効率性を示すものと解釈している。彼等の効率性指標は係数の傾きの違いでOECDのレポートの効率性の違いはダミー変数の違いとなっている。傾きの違いで効率性を推計することはレポートの説明よりも概念的に優れている。外的要因に対してより影響されにくい。それでもOr, Wang and Jamisonの方法はより弱い形でとはいえ同様の批判に対して脆弱だ。生産関数の傾きは交絡要因の影響によっても各国において変化する可能性がある。

Or, Wang and Jamisonの方法はレポートのものと違いがあるので、推計された年数に関して直接比較可能ではない。一方で各国の生産性の順位は比較可能だ。表10は異なる資源投入の指標、異なる統計アプローチ、異なるLEの計測方法に関してアメリカの順位の大幅な変動を示している。

これらはレポートのものと大幅に異なっている。特にアメリカの順位ははるかに高い。Or, Wang and Jamisonの女性の平均寿命の推計ではアメリカの順位は21ヶ国中12番目でイギリス、ノルウェー、スウェーデンより高い。男性では21ヶ国中5番目になっている。順位はそれぞれの計測指標に対して一貫したものとはなっていない。乳幼児死亡率では21ヶ国中9番目になっている。65歳での平均余命では女性で21ヶ国中17番目、男性で21ヶ国中9番目だ。心臓血管系の疾患による死亡を調整すればアメリカの順位はさらに高く女性で21ヶ国中7番目、男性で21ヶ国中1番目になる。

OECDのレポートはPYLLや乳幼児死亡率などのその他の健康指標に関する推計も行っている。PYLLの結果は示されていないが、Or, Wang and Jamisonのデータをもとに心臓病固有のPYLLを示すことができる。これらの推計ではレポートと違ってアメリカが効率的であるという結果になる。女性ではアメリカがOECDで最も効率的だ。これらの結果はレポートの結果と簡単に調和させることができる。Or, Wang and Jamisonの方法は医療資源の投入を医師のみで計測している。だが最も大事なことは上で述べたように各国の異質性を効率性の違いに割り当てていないことだ。さらにOr, Wang and Jamisonの心臓病に関する推計はより詳細なミクロの研究とも整合的だ。この研究ではアメリカの生産性はドイツやイギリスの生産性よりも高いことが示されている(Bailey and Garber, 1997)。

レポートでは、興味深いことにアメリカの自己負担率はOECDの平均よりも低い(13.3% vs 19.3%、自己負担率の高さの順位では28ヶ国23番目、低さの順位では28ヶ国中5番目)。さらになんらかの民間の保険でカバーされている人口の割合はフランス、スイス、オランダの方がアメリカよりも高い。

(以下省略)

VIII. Suggested Improvements

IX. Conclusion

(省略)

(追記)直近の日本の医療費がGDPに占める割合は11%を超えるといわれている。1993のアメリカと日本の支出比が224%だったらしいので現在は145-163%の範囲にあると思われる。同様の計算を当てはめると56-63%の範囲になる(計算違いだったらすみません)。これまた数字を真に受けるならば日本の医療資源投入(つまり医療費)はアメリカの2倍近くになる。