morの解析ブログ

解析疫学、リスクにまつわるメモや計算

「推定」のまわりをさぐる.教科書では「解析はMHにより行う、因子が多ければ重回帰を用いる」という風で詳しい例は少ない.独自(のつもり)な思いつきで具体に試行.
 数理を用いるべきアセスメントにも切り込む.

 [曝露・係数分離]関係式~optim

■ 曝露と係数を分離して立式し、optimで推定する.因果関係を積とした関係式.


■ データ、式
                      dataのカラム
   卵焼      生起因子       ta   16
   鮭塩焼き    抑制因子     sak   14
   ポテトサラダ  生起因子(副)   pot     20
   めし      阻止因子    mes     8


 これらの因子は、係数絶対値または係数SEが、比較的大なもの.


・因果関係
 taにより多くの、potにより幾分の発生が起こる.sakがそれらの下で抑制効果を持つが、mesがsakの抑制を阻害する、という関係とした.
 そのような関係が ta、sak、mesに成り立ちうることは、過去記事のとおり.


・式 
 存在下の影響を積とする関係式を組む.


    p = x1(β1+x2(β2+x4β4)) + x3(β1+x2(β2+x4β4)) 


 以前、ある因子曝露∧他の因子曝露を積で考え、試行したが、係数が積となると計算がややこしい.
 阻止因子は生起因子の曝露のもとでのみ、係数をもち、阻止因子は抑制因子曝露のもとでのみ、係数をもつ.つまり生起因子に拘束される因子は、そのようなg内に限定される.
  x1-3 曝露があれば、曝露は積になり、β1 β2 β4は積にならず並立して、線形独立にも似る.曝露と係数を切り離して考えることは、(g)lm系で慣れた者からは気づかない.
 因子は相手によって値を変えるかもしれないが、簡単のためx2,x4(sak,mes)の効果は一定と仮定して試行する. 
     
・optimの記述
  (予測子部分)
  eta  <-   int +  data4[,16] *( ta +data4[,14]*(sak +mes*data4[,8] ))  
          +  data4[,20] *( pot + data4[,14]*(sak +mes*data4[,8] ))


  pr<- eta とし、sum(p-y)^2 を minimize する.
  因果モデルと呼ぶ.
 個々IDのpは、曝露は積となって効いているが、βの一次結合のままで表される.
■ 結果

 計算は成り立ち、推定係数は上下にメリハリがついて、なにやらよさそうにみえる.lmとかなり近似した.また、cRDとも対応を示している.


・評価 
     推定モデルの諸値
                            lm      因果モデル
   はずれ数        9             4
    Q        0.746         0.835
   ファイ         0.329         0.322 
  
 諸値を比べる.Q値は過去記事(「観察からはずれて欲しくない・・」)で考えた、頼れる指標だが、はずれ数ともども因果モデルで改善している..


■ 計算試行のため、単純化した関係を想定し、式を組んだ.
 曝露と係数を分離した式による因果モデルは、かなりの期待される値を示し、結果はわかりやすかった.
 よりよいモデルを作るためには、差分との食い違いを検討する必要があるかもしれない.

×

非ログインユーザーとして返信する