余興 ペナルティー推定関数
推定上、x=0でのy1は許せないものだった.疫学的に考えて、不自然だからだ(過去記事).余興として、推定関数の最小値がたどる線を操作したが、今回は数的ペナルティを加える.
また、関係式と重ねて推定させてみる.
・ペナルティー推定関数
下表、観察y、曝露xのパターンと最小二乗、ペナルティー項(ペナルティー項に定数を乗じたり、べき乗したりして、試算).
まずは、試しに・・最小二乗項にペナルティーとして (y(1-pr))^2 を加え sum して minimizeする.
結果、推定値は異常に変化する様子はなく、概して、icが大きめになる.その結果をIDごとにpiに入れ、yと比べてみると、はずれ数は変わらなかったが、pr 0付近ではねらいどおりy1を避けた(下図).
図 推定確率によるy1割合(累計) (赤 :lm、青:ペナ加モデル)
推定関数を改良
sum( ( y-pr)^2 + ( y*(1-pr )/1.4 ) ^2.5 )
としたとき、piは x=0 y1をうまく避けるようだった.
推定関数の操作によるpiは概して極端な結果になりがちだったが、今回は幾分マトモ.
はずれ数の改善がうまくいかないからには、僅かにリスクを持つ因子も再検討すべきかもしれない.
推定関数は、最小二乗にも最尤推定にも y-pi が含まれる.それだけにy=1、x=0のpiとy=0x=1とが対等に扱われてしまう.曝露があるからこそ発生が許されるという、あたりまえの状態を 最尤推定も最小二乗もあえてもたないのだ.だからy=1はx=0では許さない式を加えると妙な代償性変化は減らせ、モデルの改善も進みやすいということだろうか.
図図