![]() |
第10回: データの予測(3)
|
| [DAT3] | [Prev] [Next] | Update: 2003/06/13 | 河路 武志 |
- 分析の具体的イメージを意識する(数字遊びではない)
- 各係数から何が読みとれるか?
- この分析の前提(利用の限界)は何か?
Q1.この回帰式を数式で表しなさい。変数の定義を明記のこと
回帰式:
= 1.51 X + 469
(被説明変数):製造費用の予測値(万円/月)
X(説明変数) :生産量(ダース)
Q2.生産量1単位あたりの製造費用の増加分を特に「限界費用」という。この靴工場でのダースあたりの限界費用はいくらか。
回帰式の回帰係数は、X(説明変数)1単位あたりのY(被説明変数)の変化を表している。
限界費用 = 回帰係数 = 1.51(万円/ダース)
このことは、「追加的な1ダースの靴の製造には、15,100円の製造費用の増加が予想される」ことを意味している。
Q3.生産量が0の時、製造費用はいくらと推定されるか。また、なぜそう言えるのか、簡単に説明しなさい。
提出課題から
- A.回帰式で生産量X=0とすると、Y=469となるので費用は469万円
- B.何も生産しないのだから費用はゼロ
- C.予測できない
A.(Kさん) 生産量が0の時、生産費用は468.6479万円と推定される。これは、Q1の回 帰式の変数Xに当てはめた結果導き出されるものである。理由としては、靴工 場で靴を生産する際に必要な機械などの固定費用があるためと思われる。 B.(Kさん) 生産量が0のとき、製造費用は0となる。 なぜならば、製造費用は生産するときに発生するものであり、 生産量が0となる、つまり生産しないときには 製造費用は発生しないためである。 B.(Iさん) 回帰式に当てはめてみると、1.51×0+469で469万円という値になるが、普通 に考えて1つも生産してないのに費用がかかるはずがないと思う。 C.(Yさん) 生産量=0は適応範囲外なので、推定できない。 C.(Tさん) 生産量がゼロの時の製造費用は上の式に当てはめると469万円かかるというこ とになるが、生産量がゼロの場合は生産施設を稼動させるための費用もかから なくなると思われる。しかし、生産施設を稼動させなくてもその維持費はかか るので、製造費用は469万円以下だが0円より大きくなると思われる。 C.(Mさん) 回帰分析によると、生産量が0の時には製造費用は約468.6479万円かかる ことになる。しかし、このサンプルは、最低でも1087ダースの生産量を取り 扱っており、製造費用も最低で1849万円までである。つまり、「生産量が0 の時」という条件が、既にここで与えられている適用範囲を超え出ており、し たがってこのような予測は信頼できるものだとは言い難い。 それでもなおこの予測を信頼するならば、このように生産量が0であるにも 関わらず製造費用が正の値をとるのは、すなわちそれは製造設備の維持にかか る固定費用なのだと解することができる。解説
回帰式の推定に用いたサンプルの生産量(X)の範囲は、
である。生産量が0という状況は、この範囲から大きく離れているので、回帰式による予測の適用は保証されない。よって、製造費用の予想はできない。
0 << 1,087 ≦ X ≦ 3,634
《参考:原価計算の費用構造論》
原価計算では、製品の製造原価を変動費と固定費とに分けて考える。
変動費は、生産量に比例して発生する費用の合計である。変動費には、材料費や直接労務費など、生産に応じて必要とされる費用が含まれる。
固定費は、生産量に関係なく発生する費用の合計である。固定費には、機械設備の減価償却費、保険料、水道光熱費の基本料金、維持管理費など、生産量とは関係なく固定的に発生する費用が含まれる。
固定費は、その生産水準で固定的に発生する費用であって、生産量が0のときの費用ではない。
また、「生産量が0のときは製造費用も必ず0」とは限らない。長期的には、生産活動を行わない工場は閉鎖されるので製造費用は0となるが、短期的には、生産調整で一時的に生産を中止している工場を考えれば、水道光熱費の基本料金や維持管理費、賃借料などの費用は生産の有無に関わらず発生するはずである。
Q4.この回帰分析は、焼肉チェーン店の分析と比べて、予測のあてはまりが良いと言えるか。理由も一緒に簡単に説明しなさい。
靴工場の分析は、焼肉チェーン店の分析と比べて、あてはまりが良い。
理由:回帰分析のあてはまりは、決定係数R2で測ることができる。
0 < 焼肉チェーン店(R2=0.465) < 靴工場(R2=0.646) < 1
「相関係数・誤差の平均・標準誤差が小さい」という答えは、この分析では間違いではないが、最適な答えではない。
決定係数
- 回帰式の当てはまり度合いを測定する
- 決定係数R2 = 1 − Σe2/Σ( Y−Y平均 )2
Σe2:予測誤差(残差)eのチラバリ
Σ(Y−Ym)2:被説明変数全体のチラバリ+-------------R2------------+ 0 ←低い あてはまり 高い→ 1
- R2が高いとき…Yの変動のほとんどをXで説明できる
- R2が低いとき…
- YとXは関係がない
or- Yの変動の一部はXで説明できる ← Yに影響を与える他の要因が大きい
複数の説明変数による重回帰分析を理解し、分析ツールによる方法を実習する。 複数の説明変数から一つの被説明変数を予測する回帰分析を重回帰分析と呼ぶ。一つの説明変数による単回帰分析と、考え方や分析手順は同じである。
- 既知のサンプルデータから、回帰式を推定する(複数の回帰係数)
- 回帰式を利用して、未知のデータを予測する
(X1,X2,X3,...)→Yという相関関係と因果関係が観察されるとき、複数の説明変数(X1,X2,X3,...)からYの予測値(
)を説明するような回帰式を推定する分析を重回帰分析という。
回帰式:
=a0 + a1X1 + a2X2 + ... + anXn
e=Y−
: 被説明変数
X1,2...,n : 説明変数
a0 : Y切片
a1,2,...,n : 偏回帰係数
e : 残差(予測誤差)
回帰分析の仕組みや分析の手順、結果の解釈は、1変数による回帰分析の場合とほとんど変わらない。説明変数が一つのものを単回帰、複数のものを重回帰という。
組み入れ説明変数の選択
一般に、分析に含められる説明変数が多いほど、回帰式のあてはまりは良くなり、決定係数R2は大きくなる(1に近づく)。しかし、やたらと説明変数の数を増やすことは、分析の意味や結果の解釈を分かり難くする。
できるだけ少ない説明変数で決定係数が改善するように、組み込む説明変数の選択のバランスをとることが望ましい。
多重共線性
例えば、X1=3X2という線形関係がある場合には、回帰式は一つに決まらない。
回帰式:
=4X1 + 5X2
↑どちらも成り立ってしまう↓
回帰式:
=3X1 + 8X2
このように、説明変数間に直線的な関係がある状況を多重共線性という。説明変数間に極めて高い相関がある場合には、どちらか一方の変数を外さなくてはならない。
説明変数の追加
第8回では、ロードサイドに展開している焼肉チェーン店「牛楽」の売上高を説明する場合に、説明変数として「道路の交通量」のみを用いた。そこでは、ある程度のあてはまりは得られたが、よりあてはまりの良い分析を行いたい。そこで、売上高と相関の高い「看板の大きさ」「客席数」の二つを説明変数に加えた重回帰分析を行うことにした。
相関係数 交通量(X1) 看板の大きさ(X2) 客席数(X3) 売上高(Y) 0.68 0.63 0.76
Excelによる分析結果の解釈
(1)重決定係数R2 : 0.967 =1−
残差のチラバリ(2)/全体のチラバリ(3) (4)各パラメータの推定値
(5)偏回帰係数=0の帰無仮説を棄却できない確率
(6)回帰係数全体の有意性検定 全係数=0の帰無仮説を棄却できない確率
回帰式
= 79 + 5.1 X1 + 94 X2 + 2.7 X3
(被説明変数):焼肉チェーン店の売上高(予測値)(万円/月)
説明変数
X1:交通量(百台/日) X2:看板の大きさ(m2) X3:客席数(席)
焼肉チェーン店「牛楽」について、「交通量」(X1),「看板」(X2),「客席数」(X3)の三つの説明変数から、「売上高」を説明することを考えます。dat10.xls をフロッピーディスクにコピーして、以下の重回帰分析を行います。
- X1→Yの回帰分析を行いなさい。
- (X1,X2)→Yの重回帰分析を行いなさい。
- (X1,X2,X3)→Yの重回帰分析を行いなさい。
実習では扱いませんが、重回帰分析のグラフについて、例年質問が多く寄せられます。興味のある人は参考にしてください。
説明変数が複数ある重回帰分析では、単回帰のような散布図と回帰直線のXYグラフを作ることができません。説明変数がn個の場合、n+1次元グラフとなってしまうからでです。
そこで、重回帰の場合、説明変数一つと被説明変数のXYグラフをそれぞれ作成する場合や、被説明変数のY(実績値)と
(予測値)のグラフを作成する場合があります。
dat10a.xls は、ある遊園地での1日のアイスクリームの売上と、遊園地の入園者数、その日の気温を調査したデータです。
締切:6/19(木)
- 本日の実習を行い、ワークシートを完成させなさい
- その分析結果を読みとって、以下の問いに答えなさい
- Q1. 三つの変数すべてを分析に組み入れたとき、X1〜X3の偏回帰係数の示す具体的な意味をそれぞれ言葉で説明しなさい
例:「追加的に靴を1ダース製造すると、製造費用が15,100円増加することが予想される。」- Q2.組み入れる説明変数が増えるにつれて、回帰式のあてはまりが改善することを具体的な統計量を示して説明しなさい
- 保存するファイル名は、dat10ユーザID(例:dat10ue025555)とする
- ファイルをメールに添付する
《例》
宛先: kawaji@cc.seikei.ac.jp 表題: dat10 ue025555 課題10 成蹊太郎 Q1. (交通量X1の係数) ○○○○○○○○○○○○○○○○○○○○○○○○ ○○○○○○○○○○○○○○○○○○が予想される。 (看板X2の係数) ○○○○○○○○○○○○○○○○○○○○○○○○ ○○○○○○○○○○○○○○○○○○が予想される。 (客席数X3の係数) ○○○○○○○○○○○○○○○○○○○○○○○○ ○○○○○○○○○○○○○○○○○○が予想される。 Q2. ○○○○○○○○○○○○○○○○○○○○○○○○ ○○○○○○○○○○○○○○○○○○○○○○○○○ ○○○○○○○○○○○○○○○○