昭和のままの経済統計のしくみ -- このエントリーを含むはてなブックマーク

日経電子版が、「麻生財務相が10月16日の経済財政諮問会議で、消費や賃金といった経済統計の精度を高めるよう提案した」と報じた。これは日本に限った話ではないが、経済統計に関しては集計方法や利用方法があまりに旧態依然としており、経済予測の正確性に悪影響を及ぼしているので、少し解説しておきたい。

大局的に見れば、経済統計の正確性が問題になるのは、低成長下でより細かい数字が経済政策の方向性に影響を与えるからだ。経済成長率が10%の時には0.5%ポイントの誤差はあまり問題にならないが、成長率が0.5%の時に0.5%ポイントの誤差は政策の方向性に大きな影響を与える可能性がある。

一方で、経済指標の計測が近年難しくなっているという構造的な要因も存在する。例えば、個人や企業の経済活動を調査する際、時間に伴う変化を少ないノイズで観測できるのは、選ばれた標本を継続的に調査するパネル調査という方法だ。この方法は、企業の倒産や合併が少なく、新しい産業の勃興が起こらず、個人は同じ会社で正社員として働き続ける、というような安定した社会では調査が容易だが、近年のような世の中の変化の早さと、不安定な雇用の下ではどうしてもノイズが大きくなりやすい。日本の多くの経済統計は1970年頃に整備されたが、安定した時期に作られたこうした経済統計の仕組みは現代にそぐわなくなってきている。

それでは、経済統計や経済予測の精度はどのようにして高められるのだろうか。その答えは技術革新にある。役所が事務員に数字を打ち込ませて、何億円もかけたコンピューターシステムに平均だけ計算させて発表する、という旧態依然とした姿を変えなければならない。具体的には以下の通りだ。

1.調査方法 ー 調査は簡潔に。詳細は情報技術で

調査を行う側は基本的に「調査オタク」なので色々な項目を調べようとする。ところが、これは統計の精度向上にはむしろマイナスであることが多い。調査の負担を増やすと、時間などのリソースに余裕のあるグループしか回答しないという問題が生じるが、こうした標本数の減少や偏りを、事後の統計処理でカバーすることは非常に難しいからだ。例えば、ボランティアの回答者に丸一日かけて回答させた「仕事の繁忙度について」の調査結果がナンセンスであることはすぐに納得頂けるだろう。米国では、日本よりずっと多くの調査が行われているが、よりきちんとした機関が行う調査ほど項目が少ない。各項目の重要性や相関を統計的に考慮すれば、項目を絞ることができるからだ。全国民を対象にするセンサス調査などはかなり項目を絞っている。

より詳しい情報を得るためには、企業の会計システムと統計の集計をリンクさせたり、POSシステム、インターネットの検索データ、クレジットカード、携帯電話などから調査目的のデータ取得を進めることが必要だ。


2.集計方法 ー 誤差を減らすための統計手法の導入を

多くの経済統計は、発表される平均値を算出する際に単純に数字を足しあわせて回答数で割っているわけではなく、層化抽出という方法をとっている。例えば、人口比では60歳未満と60歳以上の調査対象が半々なのに、回答者は60歳以上が9割というような状況を考えよう。すると回答を単純に平均しても実体に即した値が出ないので、二つのグループ(層)を別々に集計して、あとで人口比を使って平均を取るという具合に集計している。

しかし、この方法でも対応出来ないことは数多い。例えば年齢の低い程回答率が低いならば、60歳以下の層に分けても回答が比較的高齢層に偏ってしまう。逆に、層を極端に細かく区切ると、回答が欠けた場合の影響が大きくなり、誤差を増幅するという問題が発生する。

こうした問題に対処するためには、集計ロジックの中で、例えば局所回帰分析などより進んだ統計手法を使う必要だが、経済統計の作成部門や、それを補助する集計システムの作成部門は、そこまで統計の専門家にリソースを割いていない。


3.利用方法 ー 個票データの直接利用を

当たり前だが1万人が回答した調査であれば、各項目に1万の数字が集まる。現在の経済統計で行われていることは、この1万の数字から平均というたった一個の数字だけを発表することだ。そして、経済学者は、たった1つの失業率、たった1つのインフレ率、たった一つの平均所得を取ってきて、ああでもないこうでもないと、何ヶ月も分析を重ねている(実際には県ごと、項目ごと、業種ごと等にも集計されるが大雑把に言えば大差ない)。こんな方法では予測の精度の改善は大して望めない。個票データを異なる統計間でひも付けて一カ所に集めた上で、膨大な数字から直接、経済予測を試みるべきである。

もちろん、機密情報の保護が担保できる限りは、個票データを利用しやすい形で(紙ベースや、神エクセルではなく、データベースの形で)一般に公開することも重要である。この公開に関しても、統計的な操作を施して機密性を向上させることが可能だ。ただし、データやそのひも付けが充実するほど個別企業や個人の特定は容易になるため、世論がプライバシーの保護にうるさい日本では公開できる範囲は狭くなるだろう。



このように見て行くと分かるように、経済統計の質を向上させるために必要なのは技術革新である。数字を聞き取って打ち込む事務員や、その管理職、数字を合計して回答数で割るシステムの細部を徹夜で詰めているシステム屋の尻を叩いても解決しない。

統計作成部門がトップレベルの専門家を雇い権限を与えて統計を設計し直す。統計屋とデータサイエンティストを擁するシステム業者を雇って開発させる。政府が組織横断的に統計作成部門と経済予測部門を統合する。そして、経済学者とデータサイエンティストを雇って、協力させて予測を行う。これが、これからの経済統計と経済予測の精度を向上させるために必要なことなのである。

スポンサーサイト


コメントの投稿

非公開コメント

No title

税務データは、最高精度の経済指標です。
虚偽の申告を厳しい罰則によって抑制している。
なのに、個別情報は一切利用されていない。
国税庁が他の政府部門に情報を出さないからです。
自分がよく利用する、厚労省の「賃金構造基本統計調査」は、雇用者に対して行われる一種のアンケートなのですが、税務データを参照すれば、調査するまでもない。

まずは、経済企画庁が国税庁を説得して、情報を提出させるしかない。

No title

inoueakihiroさん

そうですね。役所のセクショナリズムの問題ですね。税務情報は特にハードルが高そうです。

税務データ

 去年の統計委員会で、税務データの議論が。

 「なかなかデータも電子化されていないし、いろいろ難しい問題があるので、税務データが役立つかどうか、検証すらなかなか難しい」( http://www5.cao.go.jp/statistics/meetings/kihon_52/proceedings.pdf#page=12 )という...

No title

ちゃとらさん

情報ありがとうございます。なるほど、議論はされているのですね。
電子化されていないというのも驚きではありますが、
そんなことを理由に「活用できないかも」というのも額面通りには受け取れませんね。

旧態然とした公的統計・・・

willyさん、中々ナイスな記事でした。
日本の経済統計、確かに旧態然としています。ネット時代、もっと簡単に各種統計が取れれば、政府の政策もジャストインタイムができそうな・・・
個別情報の不使用は、確かにもったいない!とんでもない予算を使って集計しているのにね。

No title

ボブさん

コメントありがとうございます。ネット上のサーベイ等はどうしてもバイアスが排除できなかったり、カバレッジが低かったりするので、そうした弱点を補うためには、ある程度コストをかける必要がありそうですね。現時点のコンセンサスは、ネット情報は付加的情報としては役に立つが単独での精度には問題あり、といったところでしょう。
プロフィール

Willy

Author:Willy
日本の某大数学科で修士課程修了。
金融機関勤務を経て、米国の統計学科博士課程に留学。
2009年、某州立大数学科専任講師。2010年、助教。2016年、准教授。

検索フォーム
Twitter

Twitter < > Reload

お勧めの本
1.ルベーグ積分30講
―― 統計学を学ぶために。
   小説のように読める本。
   学部向け。


2.Matematical Statistics and Data Analysis
―― WS大指定教科書。
   応用も充実。学部上級。

全記事表示

全ての記事を表示する

最近のコメント
訪問者数 (UA)
アクセスランキング
[ジャンルランキング]
海外情報
28位
アクセスランキングを見る>>

[サブジャンルランキング]
北アメリカ
4位
アクセスランキングを見る>>
人気記事Top10


(はてなブックマークより)

カテゴリー
最近のトラックバック
お勧めブログ