スポンサーサイト -- このエントリーを含むはてなブックマーク

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。


データに基づく統計手法を軽視する自動車の監督官庁 -- このエントリーを含むはてなブックマーク

三菱自動車が、軽自動車などの燃費を水増し偽装していたと報じられた。昨年にはフォルクスワーゲンが排ガス規制逃れの不正をしていたことが報じられており、自動車業界は2年続けて大型スキャンダルとなった。いずれの不正も断じて許されるものではない。自動車メーカーの責任ある者が「良い車を作るため」ではなく「社内で上手く立ち回るため」に働いていたことは大変残念である。

しかしながら、日米欧各国の監督官庁の検査手法にも問題があると言わざるを得ない。三菱自、フォルクスワーゲンのスキャンダルはいずれも、実際のデータに基づいて試験を行っていないことが問題を誘発しているからである。

一般的に言って、「測定条件の多様性」と「正確な測定」はトレードオフの関係にある。燃費にしろ、排ガスにしろ、実際に道路を何度も走らせてあらゆる条件で測定をすればもっとも包括的な試験になるが、一方で走行した状態(走行速度、道路の形状や起伏、天候、ドライバーのクセなど)のばらつきによって測定誤差は大きくなる。例えば、ある車種の燃費を混雑した繁華街で土日にエアコンをかけながら試験し、別の車種を涼しい日に空いた高速道路で試験すれば、もちろん公平ではない。

これまで良く言えば監督官庁は、正確な測定を重視して、条件を決められた状態に固定して数値を測ってきた。しかし、こうした哲学をもとにした測定はもはや時代遅れだ。こうした手法が人為的な不正を誘発するだけでなく、コンピュータによる制御が進んだ現在の自動車では、特定の状態でのみ良い数値を出すような細工はますます簡単になってきているからだ。こうした測定方法によって、実際の燃費が決してカタログ値に近い値にならないという状態になっているが、これは消費者にとって全くナンセンスである。あくまで、実際の走行データに基づいて測定を行うのが科学的なアプローチというものだ。

実際の走行データに基づいて数値を測定すると条件のばらつきにより誤差が大きくなると書いたが、こうしたデメリットを低減できるのが統計学だ。以下の図はそれを概念的に示したものである。

燃費

平均走行速度は燃費に影響を与えられると考えられる。図では、実燃費は5km/lから20km/lとかなりの幅があるが、平均速度と燃費の関係を考慮した上で、35km/hで走行した時の平均燃費を公式な燃費とすれば、値が13km/l前後であることが見てとれる。平均速度以外にも多くの条件を統計モデルに取り込めば、誤差ゼロとまではいかないまでも、かなり実体に即した値を推定することができる。数十年前にはより複雑なモデルでこうした推定を行うことは計算上大変であった。しかし、現在のコンピューターの計算能力やそれに応じた統計手法の進歩を踏まえれば、こうした推定の精度はかなり上がっている。また、データの収集面においても、実際のユーザーの車に測定機器を取り付けてデータを送信するような芸当も昔に比べればハードルが下がっているはずだ。

国土交通省はすでに燃費試験の見直しを表明しているが、従来の手法の延長に拘泥することなく、統計学などの今日的な知見をもとに、より良い基準づくりを目指して欲しい

不正を行う人間の弱さを直すことはできないかも知れないが、テクノロジーで不正を困難にすることは可能なのだから。


スポンサーサイト

昭和のままの経済統計のしくみ -- このエントリーを含むはてなブックマーク

日経電子版が、「麻生財務相が10月16日の経済財政諮問会議で、消費や賃金といった経済統計の精度を高めるよう提案した」と報じた。これは日本に限った話ではないが、経済統計に関しては集計方法や利用方法があまりに旧態依然としており、経済予測の正確性に悪影響を及ぼしているので、少し解説しておきたい。

大局的に見れば、経済統計の正確性が問題になるのは、低成長下でより細かい数字が経済政策の方向性に影響を与えるからだ。経済成長率が10%の時には0.5%ポイントの誤差はあまり問題にならないが、成長率が0.5%の時に0.5%ポイントの誤差は政策の方向性に大きな影響を与える可能性がある。

一方で、経済指標の計測が近年難しくなっているという構造的な要因も存在する。例えば、個人や企業の経済活動を調査する際、時間に伴う変化を少ないノイズで観測できるのは、選ばれた標本を継続的に調査するパネル調査という方法だ。この方法は、企業の倒産や合併が少なく、新しい産業の勃興が起こらず、個人は同じ会社で正社員として働き続ける、というような安定した社会では調査が容易だが、近年のような世の中の変化の早さと、不安定な雇用の下ではどうしてもノイズが大きくなりやすい。日本の多くの経済統計は1970年頃に整備されたが、安定した時期に作られたこうした経済統計の仕組みは現代にそぐわなくなってきている。

それでは、経済統計や経済予測の精度はどのようにして高められるのだろうか。その答えは技術革新にある。役所が事務員に数字を打ち込ませて、何億円もかけたコンピューターシステムに平均だけ計算させて発表する、という旧態依然とした姿を変えなければならない。具体的には以下の通りだ。

1.調査方法 ー 調査は簡潔に。詳細は情報技術で

調査を行う側は基本的に「調査オタク」なので色々な項目を調べようとする。ところが、これは統計の精度向上にはむしろマイナスであることが多い。調査の負担を増やすと、時間などのリソースに余裕のあるグループしか回答しないという問題が生じるが、こうした標本数の減少や偏りを、事後の統計処理でカバーすることは非常に難しいからだ。例えば、ボランティアの回答者に丸一日かけて回答させた「仕事の繁忙度について」の調査結果がナンセンスであることはすぐに納得頂けるだろう。米国では、日本よりずっと多くの調査が行われているが、よりきちんとした機関が行う調査ほど項目が少ない。各項目の重要性や相関を統計的に考慮すれば、項目を絞ることができるからだ。全国民を対象にするセンサス調査などはかなり項目を絞っている。

より詳しい情報を得るためには、企業の会計システムと統計の集計をリンクさせたり、POSシステム、インターネットの検索データ、クレジットカード、携帯電話などから調査目的のデータ取得を進めることが必要だ。


2.集計方法 ー 誤差を減らすための統計手法の導入を

多くの経済統計は、発表される平均値を算出する際に単純に数字を足しあわせて回答数で割っているわけではなく、層化抽出という方法をとっている。例えば、人口比では60歳未満と60歳以上の調査対象が半々なのに、回答者は60歳以上が9割というような状況を考えよう。すると回答を単純に平均しても実体に即した値が出ないので、二つのグループ(層)を別々に集計して、あとで人口比を使って平均を取るという具合に集計している。

しかし、この方法でも対応出来ないことは数多い。例えば年齢の低い程回答率が低いならば、60歳以下の層に分けても回答が比較的高齢層に偏ってしまう。逆に、層を極端に細かく区切ると、回答が欠けた場合の影響が大きくなり、誤差を増幅するという問題が発生する。

こうした問題に対処するためには、集計ロジックの中で、例えば局所回帰分析などより進んだ統計手法を使う必要だが、経済統計の作成部門や、それを補助する集計システムの作成部門は、そこまで統計の専門家にリソースを割いていない。


3.利用方法 ー 個票データの直接利用を

当たり前だが1万人が回答した調査であれば、各項目に1万の数字が集まる。現在の経済統計で行われていることは、この1万の数字から平均というたった一個の数字だけを発表することだ。そして、経済学者は、たった1つの失業率、たった1つのインフレ率、たった一つの平均所得を取ってきて、ああでもないこうでもないと、何ヶ月も分析を重ねている(実際には県ごと、項目ごと、業種ごと等にも集計されるが大雑把に言えば大差ない)。こんな方法では予測の精度の改善は大して望めない。個票データを異なる統計間でひも付けて一カ所に集めた上で、膨大な数字から直接、経済予測を試みるべきである。

もちろん、機密情報の保護が担保できる限りは、個票データを利用しやすい形で(紙ベースや、神エクセルではなく、データベースの形で)一般に公開することも重要である。この公開に関しても、統計的な操作を施して機密性を向上させることが可能だ。ただし、データやそのひも付けが充実するほど個別企業や個人の特定は容易になるため、世論がプライバシーの保護にうるさい日本では公開できる範囲は狭くなるだろう。



このように見て行くと分かるように、経済統計の質を向上させるために必要なのは技術革新である。数字を聞き取って打ち込む事務員や、その管理職、数字を合計して回答数で割るシステムの細部を徹夜で詰めているシステム屋の尻を叩いても解決しない。

統計作成部門がトップレベルの専門家を雇い権限を与えて統計を設計し直す。統計屋とデータサイエンティストを擁するシステム業者を雇って開発させる。政府が組織横断的に統計作成部門と経済予測部門を統合する。そして、経済学者とデータサイエンティストを雇って、協力させて予測を行う。これが、これからの経済統計と経済予測の精度を向上させるために必要なことなのである。


統計屋はどこまで給料をもらうべきか -- このエントリーを含むはてなブックマーク

アカデミアでもビジネスでも統計解析のニーズは高くて、
データを分析して欲しいというような依頼は結構くる。
しかし、分析の対価としてどこまで給料をもらうべきなのか、
というのはなかなか難しい問題だ。

完全にビジネスとして外注して、博士レベルの統計屋に
分析をさせると、単価は1時間で100ドル前後のようだ。
以前に、コンサルティング会社が時給75ドルでそういった求人を
出していたから、マージンなどを考えれば大体そんなものなのだろう。
継続的に分析案件が発生するのであれば、
常勤で統計屋を雇えばもっと安く済む。
私も、大学院生の時は、医学部でデータの分析をして、
生活費や給料、健康保険料を払ってもらっていた。

一番厄介なのは、依頼者が案件をあくまで「共同研究」だと考えている場合である。
もちろん雑誌や学会等に投稿することになれば、
分析者として共著者に名前を入れてもらうことになるが、
それが統計屋にとってどれほどの価値があるかは別問題である。
もちろん無価値ではないが、オリジナルな統計手法の
リサーチと同じ価値がある訳でもない。

ウィスコンシン大にいた当時、ちょっとした縁から
疫学関係のデータの分析をすることになったことがあった。
このときは、依頼者が資金を持っておらず、
共著者に入れてもらうということで無料で分析をしたのだが、
後にその研究者が資金を獲得した際に追加の分析を請け負って、
いくらかの報酬をもらった。

先日、付き合いで参加した異分野交流会で、医学部の教授が
「病院のマーケティング関係のデータを分析したいんだけど」
と持ちかけてきた。なんだか嫌な感じがしたが、
何かメリットもあるかも知れないのでミーティングのアポを取る。
依頼者は向こうなのに、
問答無用に呼びつけるところも何だかなぁという感じである。

データを用意しておくよう依頼していたが、当日データは無し。
取りあえず話だけ聞いたところ、リアルには意味のある内容だが、
既存の手法で解析するだけで済むのでアカデミックにはほぼ価値のない内容だ。

ちょうど、私の修士の学生が修論用にデータを探していたので、
とりあえず、その学生に分析させてみるということで合意。
どのみち、その学生は私が指導しないといけないので手間は変わらない。
その教授には、
「スケジュールが大事だよ。修論用だから特別にタダで分析できるんだよ。」
と念を押しておいた。

しかし、その教授からはいつになってもデータが上がって来ない。
データ処理に関わっている人が多すぎる上に、真面目にやっている人が少ないようだ。
何回かプッシュしたところ、担当者から、
「はじめてしまえば、4〜5週間でできるけど。」
というふざけた返事が。
いや、最初に教授に依頼してからもう7週間くらい経ってるんだけど。
まだ始めてなかったということが驚きだし、
データのダウンロードごときに1ヶ月かかるという神経も理解できない。

そこで、
「学生には学位取得のスケジュールがあるので遅くなるようなら無理。
他の学生を捜すことも可能だけど、その場合は、(こちらにはメリットが
ほとんどないんだから)自分と学生に報酬を払って欲しい。」
と連絡。すると、
「えっ。君は共同研究者だと思ってたんだけど。」
と、ある意味、想定の範囲内のおめでたい返事が。
そんなのタダで引き受ける人がいるなら、私が別の分析を依頼するけど。

どうも、人間はデータ分析の結果のような形のないものの価値には疎いようだ。
例えば、その医学部の教授が業務上、特殊な医療機器が必要になって、
エンジニアに特注して作ってもらったとする。
エンジニアは新しい特殊な医療機器を作って勉強になるから、
教授は無料でその機器をもらおうとするのだろうか。

もちろん、特定の分野や構造のデータを統計屋が欲しがっていて、
無報酬でも双方にとってメリットがあるというようなケースもある。
上記の様に学生が勉強用にサンプルデータを使いたいということも珍しくない。

しかし統計屋としては基本的に、
実需から生まれたデータ分析の需要に対しては相応の対価を取るというのが、
プロとして正しい姿勢であるように思う。

日本ではもともと、サービスに対価を払うという考え方が希薄な上に、
大学の教官は、社会に無償で奉仕すべきというような考え方が強い。
しかし、他人のデータを分析することが義務でない以上、
そんなインセンティブの全くない状態では、
データの活用自体が停滞するだけだろう。

ここ1〜2年、「ビッグデータ」がバズワードになっているが、
データ分析にきちんと対価を払うという意識が定着すると良いと思う。
一方で、流行に乗って暴利をむさぼる一部の人たちが、
統計屋のイメージをぶち壊してしまわないようにして欲しいところである。

「ビッグデータの衝撃」(城田真琴)

「ビッグデータの覇者たち」(海部美知)


テーマ : ボランティア活動
ジャンル : 福祉・ボランティア

大数の法則と中心極限定理を恋愛小説風に語ってみる -- このエントリーを含むはてなブックマーク


拓也「ごめん、ちょっと遅れちゃったよ。課長が話し好きでさ。」

麻衣「いいのよ、私も今、一杯目のカクテル頼んだとこ。」

ウエイター「飲み物は何になさいますか?」

拓也「あ、僕はウォッカのロックで。」

麻衣「今週もお疲れ様!」

拓也「麻衣の方こそ、お疲れ様。今週はどうだった?何か変わったことあった?」

麻衣「いろいろあったけど、いつも通りだよ。インドに出した注文
   また納期遅れたけど、そんなのしょっちゅうだし。」

拓也「僕の方もぼちぼちかな。クライアントの希望する仕様が少し
  変更になって残業が少し増えそうだけど、よくあることだし。」

麻衣「・・・ねえ、拓也。」

拓也「なに?」

麻衣「こうして週末にバーで会うの、もう何回目かしら?」

拓也「そうだな、もう30回くらいにはなるかな。」

麻衣「私が拓也と会うときは、すごくテンション高い時もあるし、機嫌が悪い事もある。
   だから言い合いになっちゃたりすることもあるよね。」

拓也「そりゃあ、僕も麻衣も人間だからね。」

麻衣「でも、こうやって何十回も会ったのを今振り返ったら
   私はやっぱり拓也の事が好き。」

拓也「ありがとう。僕ももちろん麻衣のことが大好きだよ。」

麻衣「でも、毎週同じように会って、飽きたりしない?」

拓也「そんなことないよ。むしろ毎週会えることが僕は嬉しい。
   はじめて麻衣と会った時より、今の方がずっと麻衣のことが好きだ。」

麻衣「でもさ、私が今日実はすごい機嫌悪かったとするじゃん。
   それで、拓也に、何で遅れて来たの!、って言って怒って帰っちゃったらどうする?」

拓也「あれ、もしかして遅れて来た事、怒ってる?」

麻衣「いえ、あくまで仮定の話よ。」

拓也「じゃあそう信じることにして・・、そうだね、
   もし初めてのデートがそうだったら麻衣のことが嫌いになったかも知れない。」

麻衣「30回目ならOKなの?」

拓也「それはそうだよ。」

麻衣「どうして?」

拓也「だって、麻衣とは今まで30回も会って、麻衣が魅力的な人だって分かっているから。
   それが一度くらいうまく行かなくても、麻衣に対する気持ちは変わらないよ。」
   (↑大数の法則)

麻衣「なんか今の、すごく嬉しかった!でも、初めての時ってもっと気持ちが高ぶって、
   もっと、恋してるーって気分になるよね。」

拓也「それは、あくまで幸運な偶然に支えられてる部分があると思うんだよね。」

麻衣「どういうこと?」

拓也「もちろん僕は、麻衣を魅力的だと思ったから食事に誘った。
   それは初めて会ったときの印象が良かったからなんだけど、
   二人で会ってみたら合わなかった、ってこともありうるよね。」

麻衣「もしかして、私は地雷だったってこと?」

拓也「そうじゃないよ(笑)。ちょっと語弊があったかな。
   本当に魅力的な人だったら、また会いたいと思うことが多いだろう。
   でも、巡り合わせや第一印象の一部が幸運に支えられていたことも事実だ。
   でも何回も会ううちに、僕が麻衣に惹かれたのは単なる偶然じゃなくて、
   必然だったんだっていう確信に変わってきたということだよ。」

麻衣「相変わらず、語るねー。」

拓也「あ、自分ばっかり話してごめん。」

麻衣「別にそういう意味じゃないよ。ありがとう。」

拓也「ところで、麻衣はどうしてこんなおじさんばっかりいるバーが好きなの?」

麻衣「ちょっと、声大きいよっ。」

拓也「あ、ごめん、。」

麻衣「私ね、他にカップルがいるバーが嫌いなの。」

拓也「どうして?」

麻衣「付き合いの浅いうちって、自分たちの恋愛がすごくドラマチックな感じがするじゃない?(*1)
   でも長く付き合ううちに、現実が見えて来て、
   どのカップルも結局似たようなもんだなー、って。
   バーでお酒飲んで、
   レストランで食事して、
   彼氏の部屋に行って、
   時々は翌日ドライブにいって、
   友達呼んでBBQやテニスして、
   そのうち緊張しながら親に紹介して、
   雑誌見ながら個性的な結婚式計画して、
   バリあたりに新婚旅行に行って、
   たまひよ読みながら子育てして、
   フラット35で家買って、
   子供が大学出て
   苦労して就職して恋人でも見つけたら、また(*1)に戻るだけ。」

拓也「随分先まで読んだね・・。(*1)ってどこ?」

麻衣「文脈から判断しなさいよ。」

拓也「分かった。でもさ、それもまた必然だと思うんだよね。」

麻衣「どういうこと?」

拓也「もし一度しか会っていなかったら、その思い出は人によっていろいろだ。
   一緒にテニスをしたのか、合コンしたのか、仕事をしたのか、
   によってだって随分印象は変わるよね。
   でも何回も会った男女関係の形って結局そんなに変わらないんじゃないかな。」
   (↑中心極限定理)

麻衣「でも、映画やドラマの中だともっと劇的なことってあるじゃない?
   "今まで意識した事の無かった男性と、溺れた時に助けてくれたのをきっかけに結婚!"
   "順風満帆の結婚生活が夫の事業の行き詰まりと共に破綻!"とか。
   そういう人生って、やっぱり他の人とは違うと思うのよね。」

拓也「"両想いの二人だったが、ある日フィアンセが突然交通事故で死亡"とかね。」

麻衣「・・・・・。」

拓也「例えが良くなかったかな、。
   でも今迄の全てを覆すくらい本当に大きな出来事があれば、
   積み重ねた愛の姿も変わってしまうっていうことはあるよね。」
   (↑大数の法則、中心極限定理のモーメント条件)

麻衣「そんなことは滅多に起らないと信じるしかないわね。」

拓也「そうだね、きっと大丈夫だよ。」

麻衣「やっぱり、拓也の話って奥が深くて面白いわ。」

拓也「そうかな。」

麻衣「私、拓也に収束したくなっちゃった!」


テーマ : 恋愛
ジャンル : 恋愛

誰がどこで統計学を研究すべきか? -- このエントリーを含むはてなブックマーク

僕は今は大学で教員をやっていて、
その主目的は「統計学を研究すること」であるのだが
それが自分に向いていることなのか、
そもそも、統計学者は21世紀にも大学で統計を研究すべきなのか
ということに関して自信がない。

数学者、特に純粋数学者に関して言うと、
その社会的役割は比較的明確なように思える。
彼らは、教育と文化の伝承のために大学で教え、
その傍らで数学の研究を進める。
純粋数学者のリソースは大学(もしくはアカデミックな研究所)
に集中しており、彼らを上回る研究リソースを持つ集団は存在しない。
彼らの予算は、基本的には教育予算と国からの文化に対する予算だ。

一方で、
統計の話のネタであるデータは
ほぼ常に大学の統計学者とは関係ない場所で生成され、
それに関する分析需要もその近くで発生する。
統計学者は、それに無理やり素人として首を突っ込み
抽象化可能な部分を抜き出しているに過ぎない。

抽象化した部分が汎用的な知識として分野横断的に
活用されれば非常に有意義だが、
そこまでのイノベーションは非常に難しい。

もちろん、こうしたフラストレーションは統計学分野に限らない。
優秀な化学者が大学で働くべきか製薬会社で働くべきか、
優秀な物理学者が大学で働くべきかNASAで働くべきか、
優秀な経済学者が大学で働くべきか政府で働くべきか、
優秀な医学者が研究に専念すべきか臨床にも力を入れるべきか、
そうした悩みは知的好奇心を持つ全ての人にとって尽きない、
むしろ尽きるべきでないものなのだろう。


テーマ : 自然科学
ジャンル : 学問・文化・芸術

JSM 2011  (アブストラクト提出締切: 2/1) -- このエントリーを含むはてなブックマーク



今年も夏に Joint Statistical Meeting (JSM, 連合統計学会)が開かれる。
場所は、フロリダ の Miami Beach で、日程は7月30日~8月4日だ。

フロリダというとリゾート地だし夏にそんなところに行ったらさぞ楽しいだろう、
と容易に想像できるが、フロリダは温暖なため実は冬~春の方がピークシーズンだ。
一番いい時期は多くの大学が一週間休みになる3月あたりで、
その後人気は落ちていく。航空券も夏の間はあまり高くない。
夏に行くにしても、夏の終わりに近づくとハリケーンのリスクが高まっていくので
なるべく早い時期に行くのがセオリーであり、8月上旬はそれほど良い時期とは言えない。

そんなことはともかく、この学会で発表するための
abstract 締め切りは例年2月1日である。
今回は、論文ができていないので、見切り発車で
abstract だけ先に出してしまった。
締め切り時期が早いことや、後からキャンセルできること、
原則 reject されることがないことから、
abstract だけ先に出してしまう人は多いようだ。
発表当日に無断キャンセルが多いのには閉口するが、
最低限のマナーを守れさえすれば問題はなさそうである。
ともかく、2月1日を逃せば発表のチャンスはないので、
迷っている方は何でも良いのでとりあえず提出してしまうことをお勧めする。
(後から返品できるから何でも買ってしまえば良いアメリカの買い物と同じだ。)

ちなみに、セッションの日程が発表されるのは3月末であり、
航空券やホテルの予約はその直後に自分でネット予約するのが
経験上最も良い。5月になれば、学会がホテルを押さえて
予約が難しくなることがある。

昨年は、日本人の集まりや旧友との再会もあり、
滞米中の1年間(日本帰国時を除く!)で一番楽しい1週間を過ごすことができた。

フロリダは好きな場所だし
今年は、発表できなくなったとしても、
旅行気分で行きたいと思う。
(そもそも自腹なので文句を言われる筋合いは何もない。)


テーマ : 数学
ジャンル : 学問・文化・芸術

米国統計学会=JSM (学会編) -- このエントリーを含むはてなブックマーク

8月6日まで、カナダのバンクーバーで開かれたJSM
(Joint Statistical Meeting=米国統計学会)に参加してきた。
まずは真面目な話から。

感覚的には今回は計量経済系のセッションが結構多く、
その結果、専門に勉強している時系列の構造的な話なんかも
結構あって個人的には楽しめた。
前回は、就職活動なんかもしていて(下記参照)
なんだかストレスだったが、今回は発表も初日に終わってしまい
あとは好きな講演を聴くだけだったのでリラックスできた。

JSMはセッションの参加人数で
分野の流行り廃りが結構分かったりするのだが、
とりあえず感じた事は、
― 統計学科で時系列をやってる人は近年とても少ない
― 金融統計関係は香港・シンガポールの大学のプレゼンスが
  とても大きい(全体の約9割)
ということであった。

マイナーな時系列のセッションの中で割と盛り上がっていたのは、
離散的な値を取るデータを扱う Count Time Series のセッション(#101)と
Frontiers of Financial Statistics と題されたセッション(#604)であった。
やっぱり、オーソドックスなモデルはやりつくされているので、
ちょっと新しい趣が必要だということだろう。

Frontiers ... のセッションは、やはり高頻度データの分析がメインであった。
例えば株式市場には非常に多くの銘柄が存在するので、
その共分散行列は巨大になり正確な推定が難しいが、
データ頻度を上げていくとともに推定する行列も大きくしていったとき、
どんな推定方法の効率が高いかということを考察したりしていた。
一方で、高頻度データと言ってもあまりに高頻度になると金融時系列では
microstructure noise が大きくなってしまうので、
5分毎くらいで留めておこうというのは現在のところ、
割とコンセンサスっぽい感じであった。
これはなんだか腑に落ちない。

その他のセッションでも、個別に面白いと思った発表もいくつか。
今後のネタにするために内容は省略させていただく。

ブログ内の関連記事:
米国統計学会(2008) ~就職面接のまとめ~
米国統計学会(2008) ~プレゼン編~


テーマ : 数学
ジャンル : 学問・文化・芸術

Census 2010 -- このエントリーを含むはてなブックマーク


米国では今年は、10年に一度の国勢調査(Census 2010)の年にあたる。

今日はこんなお知らせが届いていた↓
Census2010.jpg

Censusはラジオでも宣伝しているし、アメリカの日本語フリーペーパーにまで
宣伝が載っていて相当に大掛かりな調査だ。調査の時期は、マクロに影響が
出るほど政府の雇用が増える。

社会基盤の計画の根幹となると同時に、
統計学、各種社会科学などの研究者のネタともなる貴重な調査なので、
在米の方は是非協力頂くようお願い致したい。


テーマ : アメリカ生活
ジャンル : 海外情報

統計学とは意味を考えずにデータを処理する方法 -- このエントリーを含むはてなブックマーク

Apeescape さんにリンクを紹介して頂いた xkcd の
「学問分野を純度の順に並べてみた」の一コマを見て
統計屋の観点から一つコメントしておきたくなった。

XKCD-purity.png

このマンガにおける
「社会学 < 心理学 < 生物学 < 化学 < 物理 < 数学」
という順番は、左側が右側の分野の応用になっているという関係になっている。
ここで注目すべき点は、左側は右側から演繹的に導けると仮定している点にある。
しかし、実際にはノイズの問題や、計算量の問題、実証の規模の問題があり、
社会学をこの経路をたどって数学を使って演繹的に導くことは事実上不可能だろう。

ここで、統計屋が取るのが以下の方法だ。
「社会学 <- 統計学 < 数学」
ここで、"<-"は演繹的ではなく帰納的な方法によっている。
簡単に言えば、観察された事象の意味は考えずに分析するということだ。
こうした方法によって、統計学は途中のステップを飛ばすことができる。

途中のステップを飛ばしている以上、
「データの意味を考えずに分析する」という事は、
統計学では特に重要なことである。

例えば、得られた1万件のデータのうち、異常値が5件あったとしよう。
個別にこの5件を調べれば、なんらかの理由が見つかるかも知れないが、
各々理由をつけてこの5個を除くのはいかにもad hoc だ。
5件だけを個別にいわば「演繹的に」処理し、
残りの9995件を「帰納的に」処理しているのが理由である。

9995件を帰納的に処理するのなら、
5件についても何らかの純粋に客観的な手続きに従って
除くべきだろう。

統計学では、データの意味を考えてはいけないのだ。


ブログ内の関連記事:
統計モデルは正しいか?
統計学=数学的基礎+モデリング
統計学に必要なもの
数学とは何か?


テーマ : 自然科学
ジャンル : 学問・文化・芸術

レモンの糖度を測ろう -- このエントリーを含むはてなブックマーク

アメリカの果物は美味しくない。
なんでも一つ一つが大きくて立派なのだがとにかく水っぽくて味が薄いのだ。

例えばいちごなどが良い例だ。
粒が大きくて中まで赤いが、甘さも酸っぱさも両方足りない。
昔はそうではなかったらしい。
M校にいたときにいた一番年上の友達と話したら、
「昔のイチゴはもっと濃厚な味がしておいしかった」
と言っていた。

私がアメリカに来たのは6年前だが、
最近6年の間にもブルーベリー、ラズベリーは
明らかに大きくなり、味が薄くなった。
今朝食べて気づいたのだが、ついにアメリカン・チェリーも
大粒で味の薄いバージョンが出始めたようだ。
巨大なリンゴを売っている店もあるらしい。

品種を改良しても、植物が果実をつけるのに費やせるエネルギーは
変わらないわけで、収量を多くしようとすると、必然的に味は薄くなる。

要するにスーパーに並べた時に、
重さあたりの価格が安い方が売れるから、
品種改良でどんどん大きくして味は二の次なわけだ。

もちろん、消費者が安いものを求めているのであれば
それは仕方がないわけだが、
私はどうも違うのではないかと思っている。

例えば牛肉などではブランドや部位による差別化ができているおかげで、
必ずしも高いものが売れないわけではない。

果物も量あたり単価以外に消費者にアピールできる統計量(指標)を
一つか二つ用意することができれば、
廉価品と差別化した商品を売ることができ、
生産者・消費者双方にとってプラスなのではないかと思う。


これは果物の市場だけに限らない。
日本メーカーの車のスペックは20年くらい前には
既に他国のメーカーを凌駕していたと思う。
しかし日本車はスペックに現れる部分だけは一番でも
他のクオリティーはかなり怪しかった。
それは数値化できない、塗装の技術であったり、
安全性の技術だったりした。
しかし、安全性が騒がれるだして
指標として数値化されるようになってから
日本車の安全性は明らかに改善したように思う。


統計や数字が嫌いな人は、何かあるとすぐに、
「大事なのは数字じゃない。」
「数字だけで本質は分からない。」
と言い出す傾向にあるが、
むしろ統計や数字をもっと使うことで
本質に近づける場合がほとんどだ。


ブログ内の関連記事:
学力偏差値の功罪
政策目標にできるインフレ指標とは


テーマ : 自然科学
ジャンル : 学問・文化・芸術

数学と処女率 -- このエントリーを含むはてなブックマーク

前回、出産に関する記事を書いたところ毒之介さんから

>僕が学部の時にも妊娠していたTAがいて、
>後半の数週間他のTAと代わってもらっていたことを思い出しました。
>そういえばこのクラスも数学でした。数学者って結構お盛んなんですね。

という指摘があったが、統計上はそうなっていない。
Wellesley College というアメリカでもっとも有名な女子大学が取った
専攻科目別の処女率という統計があり結果は下図の通りだ。

処女率

図から分かるとおり、数学専攻の女性の処女率はもっとも高い。
おおよその傾向として知能指数が高い専攻の方が処女率も
高いという傾向があるそうである。

もっとも、この統計はある程度留保してみる必要があるだろう。
すなわち、男女共学の総合大学では、数学、化学といった分野は
男性の比率が高いので、労働市場の求人倍率とのアナロジーで言えば、
女性に対する求「愛」倍率が高くなり、処女率は他の専攻対比で
低くなる要因もあるように思われる。

話はそれるが、こんな統計が存在することからも
アメリカでは様々な統計が比較的簡単に取られ
公表されていることが想像出来る。

日本の有名女子大で同じアンケートをしたら、
プライバシー侵害で人権問題になる可能性もあるだろう。

アメリカの多くの大学に統計学科があり
私の知る限り日本に一つしかない(*1)のは、
そうした統計のavailability の違いも影響している。

(*1) 統計数理研究所 

ブログ内の関連記事:
婚活で成功したい女性はまず数学を専攻すべき
統計学に興味を持った理由
数学とは自然科学と恋愛の道具
家族連れ留学と出産2


テーマ : 恋愛
ジャンル : 恋愛

JSM 2010 -- このエントリーを含むはてなブックマーク

7月31日~8月5日にバンクーバー(カナダ)で開かれる
Joint Statistical Meeting 2010 に参加します。

(いないとは思いますが)オフ会wご希望の方がいらっしゃれば
私だけに見えるコメントなどでメールアドレスをお知らせ下さいw

ブログ内の関連記事:
米国統計学会~プレゼン編~
米国統計学会~就職面接のまとめ~


テーマ : 自然科学
ジャンル : 学問・文化・芸術

ヘッジファンドの何が問題か? -- このエントリーを含むはてなブックマーク

2008年は、多くのメインストリート(*1)の人達が
強欲な参加者で成り立つ金融システムが瓦解した年だと信じた年だった。
2009年は、市況自体は相当回復したが、
今でも多くの人がその信念を変えずにいる。

(*1)ウォールストリートとの対比の意味で。

まず金融危機にはいくつもの構造的な理由がある。
代表的なものをあげれば、
住宅ローン市場におけるプリンシパルとエージェントの利益相反問題、
投資家と格付け会社の利益相反問題、
投資銀行の経営者と株主の利益相反問題、等である。

それでは、統計学的な側面から見るとどうであろうか?

リーマンショック後、盛んに言われているのは、
「金融工学は金融危機を予測できなかった」
というものだ。

まず、金融工学と統計学では若干の立場の違いがある。
金融工学では、あくまで理屈付けが重要とされている側面が強い。
仮定を比較的たくさん置き、それを元に例えばデリバティブの価格を算出する。
市場参加者はその価格が正しいという前提を元に取引をする。
推論過程で使われる数学は非常に高度だが、
仮定の部分の検証は比較的弱い。
技術的な観点から見ると、
格付け会社による信用格付が歪められたのは
その弱みにつけ込まれたという側面が強いと思っている。

それでは仮定の部分を推定や検定という手法で割と厳しくチェックする
統計学的な方法がうまく経済危機を予測できたかと言うと
残念ながらこれもそうではなかった。
統計的な運用手法を駆使していた多くの投資銀行やヘッジファンドが損失を出した。
これは、統計モデルが十分に精緻でなかったということもあるが、
社会の不完全な仕組みによるところが大きい。

ヘッジファンドが大きな利益を出すことができるのは
破綻した場合の損失を政府や社会にヘッジすることで
大きなリスクを取ることができるからだ。

もちろん、あからさまなモラルハザードと分かるような
投資手法は各種のリスク規制の網にかかり実行することができない。

そこで、ヘッジファンド等の人々が取る手法が統計的な手法である。
過去の一定期間のデータから統計モデルを構築し、投資に用いる。
このモデルはデータから検知できないリスクを暗黙のうちに捨象する。
しかし、人々はデータから観測できないリスクがあることを
データよりも長い史実を知ることによって理解しているのだ。
データから観測できないリスクは定量化が難しいので、
規制の目をくぐりやすい。

データの構造は、
大きなショックが起きたときにのみ変わることが多いので、
そうした事が起こると「必然的に」ヘッジファンドや投資銀行が破綻する。

こうした制度上の欠陥を埋めるリスク管理規制は
まだ十分に整っていないと思う。
金融リスク管理の次の大きなチャレンジは
規制当局の側にあると言っても過言ではないだろう。

参考:
ブラック・スワンのもつ科学への意味
白鳥と黒鳥の取扱いには要注意 - 『The Black Swan』



テーマ : 経済
ジャンル : 政治・経済

子供の名前は多様化している -- このエントリーを含むはてなブックマーク

明治安田生命保険から2009年生まれの名前ランキングが発表された。
子持ちの方は、このランキングをご存知の方も結構いるだろう。

今年は、男は「大翔(「ひろと」等)」、女は「陽菜(「ひな」等)」
が一番人気だったそうだ。しかし、
「そんな名前、聞いたことないんだけど。」
という人も多いのではないかと思う。
というのも、男子全体における「大翔」の比率はわずか0.83%、
女子の「陽菜」に至っては、0.59%に過ぎないのだ。
どうやら大半の親が子供に個性的な名前をつけようとした結果、
みんなが個性的な名前になってしまったということらしい。

みんなが個性的な名前を持っているというのは、社会的には
余り望ましいことではないだろう。ある程度パターンが限られていて
覚え易く、かつ、同じコミュニティーに同じ名前が頻繁に出現しない
という状態がもっとも便利であるように思える。
もっとも、ネット上で交流の場が広がるにつれて、
皆が個性的な名前の方が便利になってきていると言えないこともない。

個性的な名前が、印象の点で望ましいかについてもかなり疑わしい。
もし、自分の子供の名前を他の人に「個性的なお名前ですね。」
と言われたらどう思うだろうか。よっぽど鈍感な人以外は、
馬鹿にされたと感じるのではないかと思う。

なお、この調査は明治安田生命によると、契約者の家族から
男4,595人、女4,254人の計8849人の名前を集計したものである。
同種のもう少し大規模な調査はベネッセが行っていて、標本数は
3万7千人になる。こちらの調査では男の
1位は同じく「大翔」で占有率0.75%、女の一位は「凛」で0.69%となっている。

アメリカの名前ランキングはどうなっているだろうか。
さすが統計大国というべきか、
アメリカでは社会保障事務所(Social Security Administration) が
1879年以降の名前のランキングを全数調査し、
暦年ごとに1000位までデータベース化している。
2008年のランキングを見ると、
男の一位は「Jacob」で全体の1.04%、女の一位は「Emma」で0.90%
となっており、やはり最も多い名前でもわずか1%前後のシェアしかなく
日本ほどではないがかなり多様であることが分かる。
一方で、例えば30年前の1978年のランキングを見てみると、
Michaelが3.93%、Jenniferが3.43%となっており
特定の名前に集中している。
ポピュラーな名前ベスト100の全体における割合を見ると、
1978年が男67.04%、女45.21%であるのに対し、
2008年は男50.04%、女31.60%と多様化が進んでいることが分かる。

日米共に、子供の数の減少によって
名前の多様化が進んでいるのかも知れない。



テーマ : 初めての妊娠・出産・育児
ジャンル : 育児

応用数学セミナー)ベイズ的方法を用いたacceptance sampling -- このエントリーを含むはてなブックマーク

今日の応用数学セミナーは、Tachen Liang教授の
"Baysian Sampling plan for exponential distribution"。
製品の寿命の検査に高いコストがかかる場合に
どのように検査するのが最適かというのを
ベイズ的なモデルを作ってシミュレーションしたもの。

製品寿命が指数分布に従うと仮定してそのパラメータに対する仮説検定を行う。
寿命がある程度以上なら製品の質に問題がないのその個体の検査は途中で止めるし、
一定個数以上の製品が検査にパスすれば、そこで検査自体を終わりにする。
仮説検定に関するリスクと検査コストの兼ね合いをどうするかというのを
Bayes型のモデルを使ってやるとパフォーマンスが良いそうだ。

・・・・・と言っても、ベイジアンのシミュレーションは
事前分布の置き方や結果の見せ方でモデルの精度評価はかなり変わるので
きちんと細部まで結果を見ないとなんとも言えない。
背景の理論があったわけでもなかったし、なんだかなぁ、
とあまり感動しない自分がいた。

もっとも、WS大の数学科は大きいとはいえ、
統計のファカルティーは常勤が4人、客員が来ている人が1人(
といっても客員の人のやってることはほとんど確率解析)
の5人しかいない。
それなりに共通のテーマを探せれば研究にとってはプラスなのだが。。。

なかなか難しいものだ。




テーマ : 数学
ジャンル : 学問・文化・芸術

人間は確率を感覚で理解できるか? -- このエントリーを含むはてなブックマーク

よくある素朴な確率に関する疑問として、
「なんで、期待値が小さくてリスクが大きい
宝くじをみんな買うのだろうか?」

というのがある。

経済学をやっている人などは、
これに対して色々な説明を考え出す。
「横軸に利得、縦軸に効用をとると
効用関数は逆S次カーブをしており、
非常に大きな利得の効用が大きくなっている」

とか、
「いや、大きな利得によって可能になる
意思決定(会社を辞める等)の効用が
非常に大きいので効用関数が不連続なのだ」
とか説明する。

なんとなく尤もらしく聞こえるのだが、
どうも納得がいかない。一番大きな理由は、
人々はそんなに小さな確率をきちんと
評価できるわけがない、という直感だ。

脳が多層パーセプロトロンでできているとして
百万分の一単位の確率を2~3倍の誤差(*1)で
正確に判定できるように学習させられる
とはとても思えない。

(*1) 3倍の誤差があれば、宝くじを
買うかどうかは正しく判断できない。

脳を確率的に学習させる有力な手段は
ポーカーやマージャンだろうが、
子供の頃トランプが好きだった自分でも
フラッシュ(1/509)がストレート(1/255)より
難しいのが、なんとか分かる程度だ。
それも、強いハンドの方が確率が低い
ということを知らされていたので
先入観のせいかも知れない。

もっと、極端な例を出そう。
私は子供の頃、4人家族だった。
お風呂に入ると毎日シャンプーや石鹸が
減っていくが、他の人がたくさん使っている
のだろうくらいに思って気に留めていなかった。
それが、一人で暮らしてみると、
それが思いのほか早く減っていくのに少し驚いた。
数学をやっていた学生が、高々4分の1程度
の確率も正確に認識できていなかったということになる。
確率を直感で比較する事は比較的易しいが、
確率の水準自体を直感で認識するのは極めて難しい。

公平なサイコロを振った時
1の目が出る確率はもちろん6分の1だが、
よく考えてみると私は
これを直感で認識できていないと思う。

数と論理を使って確率を計算したから
6分の1だと分かるだけだ。

結局、正しい確率的な判断をするには
きちんと数学を使って理解することが必要で
数学を使わない確率的な判断の信頼性などというのは
サルと変わらないレベルなのだろう。




テーマ : 数学
ジャンル : 学問・文化・芸術

取引コストと最適な取引戦略(応用数学セミナー) -- このエントリーを含むはてなブックマーク

今日の応用数学セミナーのスピーカーは
ミシガン大の Qingshuo Song 氏で、タイトルは
"Existence of Optimal Impulse Control
on Portfolio Optimization with Transaction Cost."

連続時間のモデルなので、詳細は分からないのだが、
要は金融市場のの transaction cost の話で、
z を金融資産の取引量(任意の実数)としたとき、
取引コスト c(z) が少なくともz=0の近傍で
subadditivity: c(z_1) + c(z_2) >= c(z_1+z_2)
を満たさないと有限時間内の最適なstrategyが、
無限回の取引になっちゃうよ、というお話だった
(直感的には、そりゃそうだろ、という感じがする)。

feeのような限定された意味での取引コストの場合は
zが大きくなるにつれ取引単価あたりのコスト c(z)/z が
減少していくが、大きな取引の場合には、
より高い asking price を受け入れなければいけないので
c(z)/z はむしろ増加していく。
こうした現象を、liquidity cost と呼ぶ。
c(z) を exp(z) で表すことがよく行われるようだ。

金融市場では、価格、取引量、取引間隔といった
あらゆるものが離散であるにも関わらず
モデルのほうは連続であることが多いから
連続と離散のギャップを埋めるのは重要な作業だと思う。

ちなみに、Song氏は、WS大のPhDを取って、
U of South Carifornia、ミシガン大と移って
来年から、City University of Hong Kong に移るそうだ。

私も今年初めに香港の大学(HKUST)にフライアウトに行った
(残念ながらオファーはもらえなかった)が、
香港の大学というのは分野よりも大学によって
かなり待遇が違ってくるらしい。
香港には確か8つの大学があり、
HKU, Chinese U of HK, HKUST の3つがトップレベルで
City U of HK はその次くらいだと思う。

香港は食事もおいしく、地下鉄も便利で良いところだった。
中国本土と違って日本を尊敬している人が多いので
日本人にとっては住みやすい所だと思う。
日本人の英語のアクセントも問題にならない。
弱点は、実は大卒でない一般庶民には英語が通じないということだ。
郊外の商店街やタクシーなどでは英語はほとんど通じない。
つい10数年前まで、学校の中学の授業が英語で行われていた
というのに、驚くべきことだ。



テーマ : 数学
ジャンル : 学問・文化・芸術

政策目標にできるインフレ指標とは -- このエントリーを含むはてなブックマーク

最近いろんなブログを見て思ったのだが
デフレ対策論争がずいぶん人気らしい。

門外漢の私がいくらデフレについて論じても
ロゴフとかに勝てるわけもないので
あまり首を突っ込んでも意味が無いと思うのだが、
統計屋さんの視点から言えることがないか、考えてみたい。

日本のように中央銀行の政策の透明性も信頼性も不十分な国では
「インフレ・ターゲティングの政策を採るべき」
という議論がよく出る。

例えば、先日のエコノミストの飯田さんの記事
インフレ・ターゲティングの可能性について詳しく触れている。

それに対する根本的な反論の一つは、
「消費者物価だけみていても適切な政策が行えない」
というもの。極端な話、
「消費税を上げれば、消費者物価は上がるじゃん。」
ということになる。実際、日本の物価変動債市場は
ほとんど将来の消費税を予想するマーケットになっている模様だ。
政策運営のベンチマークとして使うには、
消費者物価のような指標を
それに適したものに作り変える必要がある(*1)


それでは具体的にはどうすれば良いだろうか。
税以外にも、生鮮食品は変動が多いから除くべき、
エネルギー価格は供給ショックで大きく動くから除くべき、
海外パック旅行も大半が燃料費だから除くべき、
公共料金もほとんど燃料費だろう、
銭湯だって燃料費じゃないのか、
といろいろやりだすときりがない。

結局のところ、金融政策に使うなら
物価を供給要因と需要要因に分けて
主に需要要因に注目する必要がある
のではないかと思う。

パンの値段が上昇したにしても、
悪天候のせいで原料価格上昇に起因する場合と
機械受注が好調なためにパン製造機の価格上昇した場合では
今後のインフレ期待に及ぼす影響には違いがある。

もちろん、全ての財・サービスは需給両面のバランスに
よって決まるわけで、これを分解するのは容易ではない。
しかし、試行錯誤して信頼性の高い指標を作っていく
ことには意味がある。

実際、サブプライム危機があそこまで深刻な問題を
引き起こしたのは、資源価格の上昇で各国中央銀行が
躊躇して利下げのタイミングが遅れたことが一つの原因だろう。
インフレ率に対する理解をもう少し深めておけば
需要要因のインフレが起こっていないという認識を共有でき
こうした問題を軽減できた可能性がある。

経済統計というのは地味だが、
政府や企業の意思決定を左右するという意味で
社会にとって重要なものである。
華々しい経済論争は面白いが、
こうした論争は政治的なレトリックの中に埋もれがちになる。
長い歴史の中で人間社会を豊かにしてきたのは
政治ではなく科学やテクノロジーだ。
統計の改良のような取り組みは
経済政策に使われるテクノロジーの進歩として
ゆっくりとだが確実に経済の発展に寄与するだろう。



(*1)
テイラー・ルールのように
需給ギャップや失業率などの他の指標を使うこともできるが、
パラメーターの設定はある程度主観的にならざるを得ず
インフレ・ターゲティングのメリットの一つである透明性は損なわれる。
例えば、政治家が政策運営に失敗した中央銀行総裁を糾弾するとして
テイラー・ルールのパラメーター設定の妥当性について
国会で建設的な議論ができるとは思えない。
物価指標そのものをターゲットすることには
透明性の観点からそれなりに意味がある。


テーマ : 政治・経済・時事問題
ジャンル : 政治・経済

吉田耕作教授の統計学的思考術(日経ビジネスオンライン) -- このエントリーを含むはてなブックマーク

日経ビジネスオンラインが
統計学者・吉田耕作教授の「統計学的思考術」
というコラムを始めたようだ。

既に2回分のコラムが出ているので今読んだが、
最も控えめに表現しても釣りとしか思えない。
連載一回目の要旨は、

「全体のうち半分の人々の成績は、平均以下」

ということらしい。申し訳ないが高卒以上の人に
説明は必要ないと思うので、省かせて頂きたい。

連載二回目の要旨は、要約すると、

時系列の情報 X(t)は tによって値が変動するので
X(t)の分布を見なければいけない

ということらしい。時系列データがわざわざ横軸に
時間を取っている理由は何なのか?
申し訳ないが2次元以上の世界に住む人にとって
説明は必要ないと思うので、省かせて頂きたい。

わざわざ学者まで雇って
なんでこんな連載コラムになってしまったのか。
マスコミは数学や科学に関して
難しいことを分かり易く説明しようとして
単に誤った情報を垂れ流していることが多いように思う。
編集者が内容をきちんと理解しないで
口を出すことが一因だろう。

正しいことが分かりやすいとは限らないし、
全ての概念が一つの図で説明できるわけでもない。

それにしても、もう少し納得のいく書き方はなかったのか。
例えば「統計でウソをつく方法」
というベストセラーがあるが
数学的知識を仮定することなしに、
面白くかつきちんと統計的な概念を説明している。
この本は50年以上も前にアメリカで出たものなので
例や構成を現代の日本人受けするように変える
だけでも、それなりに面白い本は書けるだろう。

いずれにせよ、
インターネットでは一番大事なのはattention だから、
統計学者にとっては
統計学に関心が集まるのは良いことだ。

このまま釣り路線でいくのか、
徐々に本格的になるのか、先は読めないが
3回目以降に期待したい。






テーマ : 自然科学
ジャンル : 学問・文化・芸術

時系列の定常性の判定は難しい -- このエントリーを含むはてなブックマーク

私は時系列解析の中で、
ボラティリティが変動するモデルというのをやっているのだが
このモデルでは「変動の大きさ」自体が変動していくので、
どんどん変動が大きくなって時系列の分散が無限大に発散して
しまうということが起こりうる。
実際、一分毎、一時間毎、といった高頻度の金融時系列データで
当てはまりが良いとされる fractional モデル(ショックの影響が長く続く
モデル)では、特にこの問題が難しく、定常解の存在が示されて
いないだけでなく、一部の研究者は定常でないということを
信じているほどだ。

このモデルに限らず、
現実の時系列定常性を持っているか
どうかというのは重要な点だ。


池田氏のブログに少し気になる主張があった。それは、

「金融政策によって自然産出水準は変わらない」

というものだ。経済の自然算出水準は deterministic な部分
(予め推定された労働者数、技術進歩、資本蓄積の増加率)
を除いて、定常なのだろうか?確かに、もし定常であれば金融政策は
短期的な算出水準にしか影響を与えないことになる。
だが、個人的には、金本位制下で極めてデフレ的な政策を長期間
採った国は、自然算出水準を下げた可能性が高いと思っている。

無論、彼の言うように自然生産水準を引き上げるために、
労働生産性を引き上げるとか、生産要素の効率的な再配分をする
といった努力が必要なのは確かだろう。

しかし上記のように「金融政策によって自然産出水準は変わらない」
とまで仮定してしまうのは、現在の日本の経済政策を考える上では
リスクが大きいと思う。確かに多くのマクロ経済学者がそう仮定して
しまっているが、少なくとも data-oritented に考えるべき問題だろう。
大きな供給過剰の経済で、労働者の生産性や生産要素の
効率的な再配分が果たしてどれほど進むだろうか?
私は、自然算出水準の構成要素自体が需給ギャップに大きく
影響されている可能性の方が高いと思う。

もちろん、デフレさえ解決すれば全部解決、という訳ではないけれど、
デフレが経済にとってかなり大きな問題であることは強調しておきたい。

じゃあ、現実問題、経済政策運営はどうすれば良いの?と思った方はこちら。
「インフレで財政赤字を解消する過程」




テーマ : 政治・経済・時事問題
ジャンル : 政治・経済

プロフィール

Willy

Author:Willy
日本の某大数学科で修士課程修了。
金融機関勤務を経て、米国の統計学科博士課程に留学。
2009年、某州立大数学科専任講師。2010年、助教。2016年、准教授。

検索フォーム
Twitter

Twitter < > Reload

お勧めの本
1.ルベーグ積分30講
―― 統計学を学ぶために。
   小説のように読める本。
   学部向け。


2.Matematical Statistics and Data Analysis
―― WS大指定教科書。
   応用も充実。学部上級。

全記事表示

全ての記事を表示する

最近のコメント
訪問者数 (UA)
アクセスランキング
[ジャンルランキング]
海外情報
30位
アクセスランキングを見る>>

[サブジャンルランキング]
北アメリカ
5位
アクセスランキングを見る>>
人気記事Top10


(はてなブックマークより)

カテゴリー
最近のトラックバック
お勧めブログ
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。