おい信じられるかよ,今日で新年度4月1日から100日たちましたよ( ゚∀゚)アハハ八八ノヽノヽノヽノ \ / \/ \


次のJAMS0827-28で金沢なんだけど,どの程度の強行軍にしようか思案中.できれば,金沢城公園のよこのホテルに一泊して朝走りたいんだけど(ここが個人的にはプライオリティ一番高い).26日金曜日にワークショップあるんだろうなあ.ポスターはおそらく初日の13時ぐらいだと思う.最短では,行きも帰りも深夜バスで土曜日だけってのありかな.日曜日家でひたすら寝て月曜日から働く.

んまあそれは置いといて,分析どこまでやろうか.最低限分析に耐えるだけの raw data は作った.さらにあと残ってる500票ぐらいのエディティングとクリーニングは日射までには必ずやる必要があるけど,JAMSにも間に合わせたほうがよいだろうか.8末は論文も投稿したいし,やめとこうかな.いまもってるデータでcsQCA走らせて,多元的結合因果のクロス表分析ってとこが萌芽的セッション的にもふさわしいような.


パネルデータで居住歴分析.というと広い意味では回顧データイベントヒストリーなんかもはいってしまうからなんて言えばいいかな.ライフイベントカテゴリカルデータの固定効果・ランダム効果っていまいち要領が連続量(テストの点数と勉強時間の xtreg)に比べるとつかめんな.朝食を食べた/食べなかった,晩酌した/しなかった,自主休講した/しなかったみたいなイベント(?)の配列だったらまだまともな問いがたてられそうだけど(むろん,べつにそれ頻度で聞いてOLSでいいんじゃねって問題はあるが).

100年後の居住歴研究者のために置いときます(まあ,ぼくのクレカが止まると,ここのサーバーは秒で落ちるわけだが).

*PY060のcsvデータを用意

*変数の作成*

*これ(type mismatch)に気づくのに5日かかった*
destring zq47a aq48a bq36a cq37a dq35a eq34a,replace
destring zq13_1 aq11_1 bq13_1 cq17_1 dq10_1 eq12_1,replace
destring zq50 aq52 bq42 cq45 dq43 eq41,replace
destring zq22b1,replace

*ワイドデータ*
*従属変数*
*想像以上に世帯票がカオスだったので,同居人数が1人の場合を別居とさしあたりみなす*
*けっこうひどい操作化ですが,ご容赦ください……*
*lht(全部に0をふる), 1 = yes(別居), 0 = no(同居) *

*ZQ13_1
*AQ11_1
*BQ13_1
*CQ17_1
*DQ10_1
*EQ12_1

 

gen lh1 = 0
gen lh2 = 0
gen lh3 = 0
gen lh4 = 0
gen lh5 = 0
gen lh6 = 0

replace lh1 = 1 if zq13_1 == 1
replace lh2 = 1 if aq11_1 == 1
replace lh3 = 1 if bq13_1 == 1
replace lh4 = 1 if cq17_1 == 1
replace lh5 = 1 if dq10_1 == 1
replace lh6 = 1 if eq12_1 == 1

*婚姻状態* marital status
*ZQ50
*AQ52
*BQ42
*CQ45
*DQ43
*EQ41

*とりあえず全員既婚にする

gen ms1 = 1
gen ms2 = 1
gen ms3 = 1
gen ms4 = 1
gen ms5 = 1
gen ms6 = 1

*未婚者だったら既婚ダミーに0をふる

replace ms1 = 0 if zq50 == 1
replace ms2 = 0 if aq52 == 1
replace ms3 = 0 if bq42 == 1
replace ms4 = 0 if cq45 == 1
replace ms5 = 0 if dq43 == 1
replace ms6 = 0 if eq41 == 1

*独立変数*
*収入 income*
*recode income median*
recode zq47a aq48a bq36a cq37a dq35a eq34a (1=0)(2=12.5)(3=50)(4=112.5)(5=200)(6=300)(7=400)(8=525)(9=725)(10=1050)(11=1500)(12=2000)(13=2500)(14=.)

*income(individual)*
rename (zq47a aq48a bq36a cq37a dq35a eq34a) (income1 income2 income3 income4 income5 income6)

*統制変数*
*性別 sex そのまま*

*都市規模(16大市ダミー) size*
*recode size
***
*時不変の変数として入れようと思ったけど,調査時点でいれると因果としておかしい...
*15歳時の情報は特別利用申請が必要
***

*15歳時母親専業主婦ダミー* mother_job
*とりあえず全部0にする*
gen mj = 0
replace mj = 1 if zq22b1 == 1

*年齢 age*
gen age1 = 2007 – ybirth
gen age2 = 2008 – ybirth
gen age3 = 2009 – ybirth
gen age4 = 2010 – ybirth
gen age5 = 2011 – ybirth
gen age6 = 2012 – ybirth

*ロングデータへ*
reshape long age income lh ms, i(panelid) j(wave)

*未婚ピリオド以外はドロップ
drop if ms == 1

*分析*
*xtset*
xtset panelid wave

sort sex

*pooling*
by sex: logit lh age income mj

*fe
by sex: xtlogit lh age income mj, fe

*re
by sex: xtlogit lh age income mj, re

xtlogit lh age income mj, fe

居住歴研究の闇はだいたい全部で100こぐらいあるんだけど,そのなかでも群を抜いてひどいのがこれ(出身地都市規模のハンドリング)である.

Screen Shot 2016-07-09 at 09.27.33

鈴木透,2003,「離家の動向・性差・決定因」『人口問題研究』59(4): 1-18.