すべてのカテゴリ » インターネット・パソコン » 技術・プログラミング

質問

終了

基準化したデータより得られた回帰式に新たな説明変数の数値を代入し、従属変数の数値を計算(予測)する際、その代入される説明変数も基準化されている必要があると思いますが、その基準化の方法はどのように行えばよいのでしょうか?
例えば、サンプル数10、従属変数1、説明変数4というデータセットがあり、全変数を基準化し回帰係数を求めたとします。
得られた回帰式を用い新しいデータの説明変数の数値を代入することにより説明変数の値を予測したいと思います。
この際、この新たなデータも基準化される必要があると思うのですが、基準化する際には回帰係数を求めるために用いた10個のサンプルより計算された各説明変数の平均及び標準偏差を用いて、基準化を行うのでしょうか?
具体的には10個のサンプルから計算された説明変数a,b,c,dの平均がそれぞれ2,4,6,8、及び標準偏差が10,20,30,40であったとします。
新たなデータの説明変数a,b,c,dの値が3,6,9,12であった場合は、それぞれ(3-2)/10, (6-4)/20, (9-6)/30, (12-8)/40の値を計算し、その数値を回帰式に代入するのでしょうか?
長くなってしまい申し訳ありませんが、どなたか詳しい方がいましたら是非教えていただきたくお願いします。

  • 質問者:shachi954
  • 質問日時:2008-11-29 13:17:47
  • 0

重回帰分析のことでしょうか。
基準化(標準化とか正規化とか)とは平均0、標準偏差1となるようにデータを変換することです。基準化した回帰式を使うなら、新たなデータも上記の通り(新データ-元データの平均)/(元データの標準偏差)と変換しないといけません。ただし、これで得られる予測値も基準化された数値になります。
エクセルならツールのアドインから分析ツールを読み込んで、回帰分析を選んで実行すると係数その他を出して一覧表にしてくれます。

  • 回答者:じい (質問から2日後)
  • 0
この回答の満足度
  
とても参考になり、非常に満足しました。回答ありがとうございました。
お礼コメント

ご回答、有難うございました。
最も知りたかった情報が
>(新データ-元データの平均)/(元データの標準偏差)
の部分でした。
完璧な回答をありがとうございました。

並び替え:

いや、単純に、回帰式に代入するだけでしょう。
回帰式でおそらく、
予測式Y=b0+b1x1+b2x2+・・・
という形式になっているはず。例では4つなので、x1=a、x2=b、x3=c、x4=dです。なので、例だとY=b0+b1×3+b2×6+b3×9+b4×12となります。
今までのサンプルから最小2乗法で予測式を立てて計算するのが妥当かと。なので、平均とか標準偏差とかは関係ないような・・・
参考
http://aoki2.si.gunma-u.ac.jp/lecture/Regression/mreg/index.html

  • 回答者:とくめい (質問から5時間後)
  • 0
この回答の満足度
  
やや参考になりました。回答ありがとうございました。
お礼コメント

ご回答有難うございます。
偏回帰係数の場合でしたら、Rawデータの数値をそのまま回帰式に代入できると思いますが、今回計算した係数は標準偏回帰係数なのでRawデータの数値はそのまま代入できずに困っています。
代入する数値も基準化(標準化)してある必要があると思うのですが、その基準化の方法がわかりません。
質問の内容がわかりにくくてすみません。
もしご存知でありましたらご回答よろしくお願いします。

関連する質問・相談

Sooda!からのお知らせ

一覧を見る