統計学=数学的基礎+モデリング -- このエントリーを含むはてなブックマーク

先日のエントリーで取り上げたように
「統計学は数学か」
というような議論は起こりやすい。

こうした議論が巻き起こる一つの理由は、
人の頭の片隅に、統計学は、現実の世界を完全に正しく説明できていない
という意味で、「厳密でない」という意識があるからではないかと思う。

現実に、例えば倒産のリスクを見積もる統計的なモデルが正しくない
(という可能性が高い)からこそ、銀行や証券会社が潰れたりするわけである。

しかし、これは統計学の数学的基礎の厳密性とは関係がない。
統計学は、
「現象を説明するためのモデリング」
「モデルを説明するための数学(確率論)的基礎」
という2段階に分かれているのだ。

モデルを説明する数学的基礎は、数学的に厳密であり、数学の一部である。
一方、モデリングは、現象を説明するための主観的な近似でしかない。
つまり、
統計学の数学的基礎は、
厳密な数学として切り離すことが可能である。

従って、統計学を数学として研究することも理屈としては可能である。
しかし、統計学の結果は、通常、
「実際に役に立つモデリング」と「その数学的基礎」を合わせたもので
あるべきだと統計学のコミュニティーでは認識されている。
そのため、必ずしも統計学を数学として研究することが
良しとされないのである。


スポンサーサイト

テーマ : 数学
ジャンル : 学問・文化・芸術

統計学に必要なもの -- このエントリーを含むはてなブックマーク

昨日、ネットサーフィンをしていたら
mathboy さんの「ブログで復活 数学少年の部屋」
「統計学は数学か?」というエントリーを見つけた。
2ちゃんねるにも、この問題を議論をしているスレッドがありなかなか面白い
(私もかなり書き込んでいる)。

そこで、数学を6年、統計学を4年、
3つの分野の統計実務を約2年ずつやった者として、
私も「統計学とは何か?」について考えてみたいと思う。

抽象論から入るのは少し難解なので、
まずは、「統計学をやるのに何が必要か?」
という側面から攻めてみたい。

誰が最初に言ったのかは知らないが、
「哲学をやるには、紙と鉛筆があればよい。」
「数学をやるには、紙と鉛筆と消しゴムがあればよい。」
という言葉を聞いたことがある。
哲学は自分の思ったことをそのまま書けば良いのに対し、
数学は普遍の真理を追求し、その過程で人間は間違えるので
消しゴムが必要だということだろう。

この格言に一行付け加えるとしたら、
「統計学をやるには、
紙と鉛筆と消しゴムとデータとコンピュータがあればよい。」
となると思う。

数学との差は、データとコンピュータが必要なことである。
これは、統計学の学問としての進歩を易しくしているに違いないだろう。

例えば、
遺伝子データが整備されることによって遺伝統計学の手法が発達したし、
コンピュータの性能向上によって推定が可能になった統計手法もたくさんある。

頭の外にイノベーションがあり、それを頭の中に入れると
内部から新たなイノベーションが起こる。
それが統計学の面白いところだ。

私の尊敬するある数学者は、
「重要な問題を解くのが一流の数学者、
重要な問題を見つけるのが超一流の数学者」
と言った。
統計学では、重要な問題を見つけるのは、数学に比べれば格段に易しいのだと思う。




テーマ : 数学
ジャンル : 学問・文化・芸術

統計学の応用分野の日米比較 -- このエントリーを含むはてなブックマーク

統計学というと、日本ではどちらかというと
アクチュアリー、デリバティブのプライシング、資産運用、
と金融関係の応用に関心を持つ向きが多いが、
こちらの統計学科についていうと、
バイオ関連の応用が7割で、
残りの人達が、エンジニアリング・コンピューターサイエンス関連、
金融関連、社会科学関連、環境関連などを細々とやっているイメージだ。
私の個人的な感覚では、
ヨーロッパの大学でも米国ほどバイオ関連に偏っていないように思う。

米国ではなぜそんなにバイオ関連の応用に偏っているのかというと、
最大の理由は国立保健研究所(NIH)が大学に配分する研究費が、
国立科学財団(NSF)など他の分野の研究費に比べ
圧倒的に大きいからである。
菅裕明著「切磋琢磨するアメリカの科学者たち」に、
そのあたりのことは詳しく書かれている。

一方日本では、特に医学関連については医学部の縄張り意識が強く、
統計学者と医・薬学関係の研究者の分業がまだまだ進んでいない
という側面もあるのではないかと思う。

日本で金融関連の応用に関心が高いのは、
東京が大きな金融センターを持っているという
地理的な面が大きいのだろう。
アメリカでも、コロンビア大の統計学科、NYUの数学科などには、
数理ファイナンス関連をやっている人が比較的多い。

中学生の時、友だちの女の子が「高校は場所と制服で選ぶ」と言っていたが、
アメリカの統計学科を場所で選ぶのも案外悪くないかも知れない。


テーマ : 教育
ジャンル : 学校・教育

クレカで割り勘 -- このエントリーを含むはてなブックマーク

入学以来の友人が卒業して、中国の一流大学の助教になることになった。
ということで今日は、(彼は中国人だが)アメリカ人好みのお洒落な
中華料理屋で彼の送迎会を開いた。

彼の来年度のサラリーは年5万ドルを超える模様で、
中国の物価水準に照らし合わせれば相当使い出のある額であろう。

ちなみに、彼が行く大都市の1LDKの家賃は米ドル換算で300ドル台らしいが、
大卒初任給の月500ドル程度では家賃が払えないので、
アパートの1つのベッドルームを複数人でシェアするのが流行っているという。
同様の理由で、ロンドンでもビジネスマンによるルームシェアが
流行っていると1、2年前に聞いた記憶があるが、
それは流石に2ベッドルームを二人でシェアということであろう。
中国のその都市では、ひどいところだと、
一つの物件に10人以上も住んでいることがあるらしく、
防災上の理由から政府は規制をしたがっているという。

ところで、会計を割り勘にして、恥ずかしながら今日はじめて知ったのだが、
アメリカではクレジットカードで割り勘ができる。

8人で175ドルだったのだが、現金の人は一人22ドル支払い、
カードの人はそれぞれクレジットカードをウェイターに渡し、
残額を人数で割った分を割り勘にした。割と便利である。

日本ではできないものなのだろうか?
日本にいる人、誰か試してみてください。


テーマ : クレジットカード
ジャンル : ファイナンス

冷房の設定温度を28度にしている人の時給は120円以下 -- このエントリーを含むはてなブックマーク

3年ほど前から省エネと称して、
冷房の設定温度を28度にするという
精神訓練が日本で流行っているらしい。
竹槍でB29を落とそうとした国民にとっては
このくらいは屁の河童といったところだろう。

尊敬の意を禁じえない。

幸いにも、私はこれが始まる前にこちらに来たので
こうした修行を受けずに済んでいるが、
今日のニュースによると、
25度から室温が一度上昇するごとに
作業能率は2%ほど低下するそうだ。

実際には、これは影響を過小評価しているだろう。
オフィスで行われる作業のうち大半は単純作業なので
頭脳労働ではもっと効率が落ちるだろうし、
室温が上昇する毎に作業能率の低下は加速するだろうからだ
(そうでなければ、室温50度でも通常の半分の作業をこなせることになる)。

まあ、ひとまずそうした細かい点は脇において、
これを機に冷房の設定温度を28度にすることが
いかに馬鹿げているか計算してみたい。

まず、本来であれば、オフィスの冷房の設定温度を
1度上げたときに節約できる費用を計算できれば良いのだが、
残念ながら良い資料がない。
そこで、家庭用の8畳~12畳用の標準的なエアコンを一人に
かかる冷房費用とみなして試算しよう。
資料によると、夏の112日間に一日8時間ずつかけたとして
冷房費用は合計で14,150円かかり、
設定温度を一度上げることで15%程度節約できるという。
従って、設定温度を一度上げても一時間あたりに直す
とわずかに2.4円の節約である事が分かる。

これで作業効率が2%落ちるとすれば、
時給120円以下の人でないと設定温度を上げる
経済合理性はないことになる。

私は、室温を28度に設定している会社では働きたくないし、
そんな企業の株にも投資したくない。

最近は、同じ室温でも快適に過ごせるように、
ということでクールビズなどというものも流行っているが、
そんなことは言われなくても私はずっと前からやっていた。
そもそもオフィスの24-25度という室温は、
男性にとって涼しい服装をしていてちょうど良い温度である。

エコというのは、例えば、
効率の良い冷房機の購入に補助金を出したり、
燃費の悪い車に多額の税金をかけたり、
原子力発電を増やしたりすることによって達成すべきだし、
そうすることによって企業もメリットを受けられる。
国は、そういう方向に対策を持っていくべきである。



ちなみに、私の部屋には残念ながら冷房がない。


テーマ : 環境・資源・エネルギー
ジャンル : 政治・経済

Amazonのカスタマーレビューは良い -- このエントリーを含むはてなブックマーク

はっきり言って自分は無趣味なほうだと思うが、敢えて言えば最近は(日本語の)本を読むのが割りと好きだ。ネットの情報を斜め読みするせいか、英語の本から重要な部分だけ探して読んでいるせいか、小説を除くと最近は本を読むのがずいぶん早くなった。一方、年をとったせいか、どうも内容を忘れるのも早くなったので一年ほど前からAmazon のカスタマーレビューをつけることにした。書評をつけると読んだ本が一覧できるし、どんな本かも思い出せるのでとても便利だ。レビューに対してアマゾン利用者から、参考になったかどうかの投票が行われるのも面白い。厳しい書評は反感を買うことが多いようだが、つまらないものはつまらないのだから、それは致し方ない。

一方、このブログに研究日記をつけるというのも、ほぼ同時期に同じアイデアで始めたものだが、こちらはなかなかうまく行かない。一つには、そもそも研究のアイデアを他の人に公開するには行かない、ということもあるし、数式が多いのでブログにあまり向かないということもある。結局、必要な時だけ、Latex を使って日記をつけるということに現在は落ち着いている。


テーマ : 本に関すること
ジャンル : 本・雑誌

学力偏差値の功罪 -- このエントリーを含むはてなブックマーク

 以前から日本の受験産業では学力偏差値の弊害が叫ばれており、一部の原理主義者は、詰め込み教育の元凶として偏差値を目の敵にしている。しかし、この問題は一見議論しつくされたようで、実際には統計学的な立場からのきちんとした考察はほとんどないように思う。

 まず数学的(確率論的)な立場から見れば、偏差値とは単に、各人の得点を平均点とその標準偏差を用いて加工した統計量なので、別に良いも悪いもない、ということになる。確かに、テストの点数そのままではテストの難しさによって点数が上下するし、パーセンタイルのような指標ではばらつきの度合いが分からなくなってしまうので、そういった指標に比べて偏差値が便利であることは間違いない。

 一方で、統計学的な視点からみると、偏差値にしろランキングにしろ合計点にしろ、総合的な学力が、主観的に決められた配点によって一つの数値で表現できるという発想には根拠がない。

 学力偏差値は主に入試の合否判定のために使われているが、そもそも入試を実施する大学にとって、試験問題を所与としたとき、統計学的に最適な選抜方法とはどのようなものであろうか。よくよく考えると、大学にとって入試の点数自体はいわばどうでもよく、「より良い学生」が取れれば良いということになる。「より良い学生」というのは大学での成績が良い学生のことかも知れないし、理系ならば、博士課程への進学率が高い学生かも知れない。あるいは、法学部であれば、投資銀行に行くか司法試験に合格するかというように成功のパターンが複数あることも考えられる。いずれにしても追跡調査をすれば、大学にとって、こうした入学後の学生のパフォーマンスを事後的に評価することはそれほど難しくない。

 つまり入学者の選抜とは、試験の結果から将来の成功を予測する作業である。したがって、望ましい選抜方法はこうだ。まず、過去の学生の入学試験結果と入学後のパフォーマンスを用いて、統計学的なパターン認識の手法を用いて標準的な予測モデルを構築しておく。新しい入試を行い、試験結果を得る。例えば試験問題が100問あったとしたら、各受験者に対して各問題に正答したかどうかで100個の情報が得られる。しかしこのままでは過去のデータとの対応がつかないので、問題の難易度、設問の仕方、分野別のスコアに標準化する。このスコアと標準化されたモデルを用いて、もっとも高い入学後のパフォーマンスを期待できる受験者から合格させる。

 なんだか複雑に見えるが、簡単に例を挙げるとこういうことになる。例えば試験科目が、外国語、世界史、数学、物理の4科目だったとする。いままでは、「世界史と物理が90点で他が50点」の生徒Aと「数学と物理が90点で他が50点」の生徒Bは、いずれも合計280点で偏差値も同じだった。しかし、恐らく生徒Bの方が将来成功する可能性はずっと高いだろう。大学で物理を専攻するには数学が必要だし、世界史をやるには外国語が必要だ。生徒Bのような成功の可能性の高い生徒をより入学させなければならない。生徒Aに対しての進学アドバイスは、「将来歴史をやりたいなら英語を勉強しなければならないし、物理をやりたいなら数学の基礎を固めましょう」となるし、生徒Bに対するアドバイスは、従来なら「点数の低い世界史を伸ばしましょう」であったが、いまや「数学と物理をもっと頑張りましょう」となる可能性が高い。従来の入試の方法では、まんべんなく出来る生徒になることが重要だったが、統計モデルに基づいて選抜を行えば状況は一変し、適度に個性を伸ばす教育が勧められるようになる。

いままでのAO入試などでは、個性を重視した選考ができる一方で、選抜は非常に主観的であり、客観的な裏づけを欠いていた。上のように、より進んだ統計手法を用いることで、こうした問題は解決できる。

 人々は固定観念として、統計を導入すると何か人間味のない近視眼的な世の中になると考えがちだ。それは、統計を中途半端に社会に導入した統計屋の責任でもある。しかし本当は、よりよい統計モデルを探求することによって、より客観的で説得力のある、人間的な世の中の仕組みを作ることができるのだ。


テーマ : 教育
ジャンル : 学校・教育

プロフィール

Willy

Author:Willy
日本の某大数学科で修士課程修了。
金融機関勤務を経て、米国の統計学科博士課程に留学。
2009年、某州立大数学科専任講師。2010年、助教。2016年、准教授。

検索フォーム
Twitter

Twitter < > Reload

お勧めの本
1.ルベーグ積分30講
―― 統計学を学ぶために。
   小説のように読める本。
   学部向け。


2.Matematical Statistics and Data Analysis
―― WS大指定教科書。
   応用も充実。学部上級。

全記事表示

全ての記事を表示する

最近のコメント
訪問者数 (UA)
アクセスランキング
[ジャンルランキング]
海外情報
33位
アクセスランキングを見る>>

[サブジャンルランキング]
北アメリカ
5位
アクセスランキングを見る>>
人気記事Top10


(はてなブックマークより)

カテゴリー
最近のトラックバック
お勧めブログ