morの解析ブログ

解析疫学、リスクにまつわるメモや計算

「推定」のまわりをさぐる.教科書では「解析はMHにより行う、因子が多ければ重回帰を用いる」という風で詳しい例は少ない.独自(のつもり)な思いつきで具体に試行.
 数理を用いるべきアセスメントにも切り込む.

余興 ペナルティー推定関数


 推定上、x=0でのy1は許せないものだった.疫学的に考えて、不自然だからだ(過去記事).余興として、推定関数の最小値がたどる線を操作したが、今回は数的ペナルティを加える.
 また、関係式と重ねて推定させてみる.


・ペナルティー推定関数
 下表、観察y、曝露xのパターンと最小二乗、ペナルティー項(ペナルティー項に定数を乗じたり、べき乗したりして、試算).


 まずは、試しに・・最小二乗項にペナルティーとして (y(1-pr))^2 を加え sum して minimizeする.
  
 結果、推定値は異常に変化する様子はなく、概して、icが大きめになる.その結果をIDごとにpiに入れ、yと比べてみると、はずれ数は変わらなかったが、pr 0付近ではねらいどおりy1を避けた(下図).

   図 推定確率によるy1割合(累計)   (赤 :lm、青:ペナ加モデル)


 推定関数を改良 
   sum( ( y-pr)^2 + ( y*(1-pr )/1.4 ) ^2.5 )
 としたとき、piは x=0 y1をうまく避けるようだった.


 推定関数の操作によるpiは概して極端な結果になりがちだったが、今回は幾分マトモ.


 はずれ数の改善がうまくいかないからには、僅かにリスクを持つ因子も再検討すべきかもしれない.  


 推定関数は、最小二乗にも最尤推定にも y-pi が含まれる.それだけにy=1、x=0のpiとy=0x=1とが対等に扱われてしまう.曝露があるからこそ発生が許されるという、あたりまえの状態を 最尤推定も最小二乗もあえてもたないのだ.だからy=1はx=0では許さない式を加えると妙な代償性変化は減らせ、モデルの改善も進みやすいということだろうか.



 図図

×

非ログインユーザーとして返信する