●データアーカイブ

 ここで紹介するデータは,著書などに用いたデータです.自由にダウンロードして使ってください. ただし,私の分析結果と違った結果が得られた場合は,その内容を連絡ください.

 私自身,統計の学習にExcelを後いることに懐疑的です.大学でExcelを用いるのは単に, 優秀な商用統計ソフトを用いたいが値段が高いという金銭的な理由からExcelを用いているのではないでしょうか.機能限定版ですがJMP(http://www.jmp.com/japan/news/bluebacks.shtml)のような商用統計ソフトを用いる方ががはるかに知的生産性があがります.
 ただ,データの配布としてはExcelを用いる方が良いと考えています.


(1)「学生の生活実態調査」

 このデータは,当時青山学院大学国際政治経済学部の高森寛先生が作成したデータです.『統計処理エッセンシャル』(丸善)で,SASの解説に用いました.(本書はSASの初心者には適していますが,海外出張と重なり,統計書としては考え方と用語に問題があります.)
 その後,『SPSS for Windows入門』(丸善)でグラフを用いたSPSS for Windowsの解説書に用いています.
  またStatisticaを用い『パソコン活用 3日で分かる・使える統計学』(講談社)で,情報化時代の一般教養書のデータとして用いています.なんと,このデータで決定木分析の解説を行っています.
 今回さらに, JMPを用い『JMP活用 統計学とっておき勉強法』で、統計学を非常に分かりやすく説明しました。添付のCDは、WindowsとMacで使用できます。使用できる統計手法は商用版と同じです。CDには300件余りの学習用データがありますので、本書で解説している学生の生活実態調査データで統計学やJMPの操作法を理解した後、更なる勉強に活用して下さい。

  >> データのダウンロード  aoyama.xls


(2)フィッシャーのアイリスデータ
 このデータは,統計家の間ではつとに有名なデータです.セトナ,バーシクル, バージニカという3種類のあやめの4個の計測値からなります.判別分析,クラスタ ー分析などの研究にもテストデータとして良く用いられます.ただ,ちょっと使 ってみましたという例が多いようです.
 『パソコン楽々統計学』(講談社)は,このデータを用いて,データ解析の全般 をStatisticaで分析する方法を解説しています.最近では,大量のデータを扱う データマイニングの新しいアルゴリズムを開発している研究者の口からも,驚く 事にこのデータをテストデータに用いたという首を傾げる話も出てくるくらい有 名です.しかし,注意を要する相関係数の勉強に役立ちます.
 また,私の開発した最適線形判別関数の評価にも用いています.

  >> データのダウンロード  iris.xls



(3)銀行員のデータ

 このデータは,シカゴの銀行で,性差別や人種差別があったとして争われたデータ のようです.SPSSのサンプルデータであり,マニュアルにも引用されています.しか し,分析してみると非常に面白いデータです.その結果は,私の自信作『パソコンによ るデータ解析』(講談社)にまとめました.
 最初は,SPSSの研究者が作ったデータでないかと怪しんだくらです.しかし,マニュ アルにはその面白さが一つも取り上げられていないので,実際のデータを元にしたものと思われます.
 果たして,裁判の結果は如何に?
 データは,次からダウンロードできます.

 SPSS Japan サンプルデータ・スクリプトページ
  http://www.spss.co.jp/support/sample.html



(4)科学万博のデータ
 このデータは,筑波で開催された科学万博のデータです.SASを用いて『やさしく実践データ解析の進め方』(共立)で紹介しています.基本統計量、多変量解析、時系列分析が学べます。私の授業では、初心者用は「学生の生活実態調査」データ、中級や上級用にこのデータや「銀行員」データを用いています。

  >> データのダウンロード  banpaku.xls


(5)スイス銀行偽札データ

 このデータは,Flury,B.&Rieduyl,H.(1988).Multivariate statistics : A Practical Approach. Cambridge University Press.[田端吉雄(1900).多変量解析とその応用.現代数学社] に収録されています。私は、6個の計測値を用いて、真札と偽札を判別するIP-OLDFの研究に用いています。
  このデータは、逐次F検定やAICでは、5変数のモデルを選びますが、実は2変数か3変数で十分と言うミステリアスなデータです。そのうち、研究成果を分かりやすくまとめ、本にする予定です。

  >> データのダウンロード  SwissBank.xls


(6)児頭骨盤不均衡(CPD)データ

 このデータは,多重共線性,変数選択,最適線形判別関数の研究に広く用いています .そのうち,準備します.

  >> データのダウンロード<準備中>


(7)その他

 その他の統計に役立つデータは、リンクで紹介しています。