前回の課題の復習
残差に注目して、新たな説明変数を追加する。
質的変数を分析に組み入れるために、ダミー変数に変換してダミー回帰を行う。
回帰式
= 7.6 + 0.51 X1 + 12.4 X2 + 0.288 X3
被説明変数
:洋菓子チェーン店の予測売上高(万円/月)
説明変数
X1:乗降客数(百人/日) X2:店の間口(m) X3:取扱品目数(品)
他の条件が等しければ、
- X1の偏回帰係数:乗降客数が100人多い駅の店舗は、月5,100円だけ売上高が多いことが予想される。
- X2の偏回帰係数:店の間口が1m増加するにつき、月124,000円だけ売上高が増加することが予想される。
- X3の偏回帰係数:扱う商品が1品目増えれば、月2,880円だけ売上高が増加することが予想される。
回帰分析のあてはまりは、決定係数R2で測ることができる。それぞれの分析の決定係数を比較すると、変数を追加するごとに決定係数が増えている。このことから、あてはまりが改善していることが示された。
0 < R2(X1) = 0.465 < R2(X2,X3) = 0.594 < R2(X1,X2,X3) = 0.967 < 1
回帰式
= -778,007 + 22.77 X1 + 28892 X2
被説明変数
:アイスクリームの予測売上高(円/日)
説明変数
X1:入場者数(人/日) X2:気温(度)
気温が1度高いと、アイスの売上高が28,892円増加することが予想される。
回帰分析の予測誤差である残差は、分析に組み込んだ説明変数では説明できないチラバリ部分である。この残差のチラバリを観察すれば、回帰式のあてはまりを改善できる場合がある。
質的変数である分類尺度の説明変数を回帰分析に組み入れるためには、0または1を値とするダミー変数を用いる。偏回帰係数は同じだが、切片のみが異なる二つの回帰式が想定できる。
生産量で予測した製造費用の残差を時系列の折れ線グラフにすると。
夏・冬の残差は正、春・秋の残差は負である傾向が観察される。これは、生産量だけで製造費用を予測した場合、夏・冬には予測より多くの費用が発生し、春・秋には予測よりも少ない費用しか発生しないことを意味している。
調査の結果、夏・冬には、工場内のエアコンをフル稼働させるため、多くの電力費が発生していることが判明した。この季節要因を回帰分析に組み入れるために、ダミー変数を利用する。
季節要因を分析に加えたい。しかし、季節変数は質的データなので、直接説明変数にはできない。そこで、ダミー変数を導入する。ダミー変数は、0または1のみの値をとる変数である。
X2:季節{春、夏、秋、冬}→ Z2:季節のダミー変数{0,1}
- X2 = 夏 or 冬 → Z2 = 1
- X2 = 春 or 秋 → Z2 = 0
生産量(X1)と季節のダミー変数(Z2)を説明変数として重回帰分析を行う。
回帰式:
2=14.0 + 1.53 X1 + 874 Z2
2:製造費用の予測値(万円/四半期)
X1:生産量(ダース/四半期)
Z2:季節のダミー変数(1:夏、冬,0:春、秋)
靴工場の製造費用分析について、季節要因をダミー変数として組み込んだ重回帰分析を行う。 bda10.xls をフロッピーディスクにコピーしてから、以下の実習を行うこと。
|
提出期限:7/5(水) 提出方法:電子メールに実習ファイルを添付 添付ファイル名:bda10ユーザID.xls(例:「bda10ue985555.xls」) メール本文:分析結果をもとに、以下の問いに答えなさい |
宛先(To:) kawaji@mserv.cc.seikei.ac.jp
標題(Subject:) 課題9 ユーザID
本文:
Q1.
Q2.
Q3.
-----
添付ファイル名:bda10ユーザID.xls
メールへのファイル添付の方法は、『情報リテラシ』(センター発行)p.186を参照のこと。
余裕のある人は、実習3で推定した回帰式のグラフを作成しなさい。
2)
季節要因を組み込んだ回帰直線

ワークシート bda10a.xls は、「ドリーム遊園地」の入場者数、気温、天気と、アイスクリームの売上高のデータである。これをサンプルとして、アイスクリームの売上高の予測式を推定する重回帰分析を行いなさい。また、以下の問いに答えること。
| X3:天気 | はれ | くもり | あめ |
| Z1,Z2 | 1,0 | 0,1 | 0,0 |
Q1.この回帰式を数式で表しなさい。変数の定義を明記のこと
Q2.天気のダミー変数(Z1,Z2)の偏回帰係数が示すものをそれぞれ説明しなさい。
アイスクリームの売上高予測

注:前回同様、説明変数Xが複数あるので、XYグラフは作成できません。