検定計算を行う論文を投稿すると,サンプルサイズの妥当性を問われることがあるので, 統計計算が必要な研究を行うときには,目的の結論を出すためにサンプルサイズがどの程度必要かを事前に検討する必要がある。
p値にかわる統計的手法として,とりあえずの候補としてよく紹介されるのは,効果量と信頼区間に基づく議論。というわけで,必要に迫られてお勉強した内容の覚書。
テストの平均点がある二群で異なるかを探るには,t検定等の統計計算によってp値を求めて,優位水準より大きいか否かに基づいて有意差の有無を議論するのが一昔前まで主流だった。ところが最近は この方法はもうやめよう…という方向に世の中は変わりつつあって,学会の投稿規定もそのように変わりつつある。
ASA(アメリカ統計学会)は2016年にp値についてのASAの所見を発表。 冒頭に,2014年2月にG. CobbがASAのフォーラムに投稿した内容として以下を紹介。
Q: Why do so many people still use p = 0.05? (どうしてみんな,未だにp=0.05を使うの?)
A: Because that’s what they were taught in college or grad school. (だってみんなそう習ったからね)