英語論文: 統計に関連した表現の文例集

UB3/english/paper/results_statistics

このページの最終更新日: 2019/07/30

  1. 概要: 「同じ」なのか「差がみられない」のか
  2. 方法ごとの文例集
    • Student's t-test の結果の書き方
    • One-way ANOVA の結果の書き方
    • Two-way ANOVA の結果の書き方
    • Log-rank 検定の結果の書き方
  3. 有意差がなかった場合

広告

概要: 「同じ」なのか「差がみられない」のか

このページは、科学論文の結果の書き方 のサブセクションです。他に 比較表現図表の作り方 などのページがあります。


Results を統計結果とともに記載するときにまず理解すべきことは、「有意差がない」と「差がない」は異なる という点である。

これは 仮説検定 の基本であり、どのような帰無仮説を立てているかを考えれば理解できるだろう。したがって、「同じであった」という A and B were same のような表現は論理的に間違いであり、「この論文の条件では有意な差を認められなかった」we could not find significant difference というニュアンスで書かなければならない。


広告

方法ごとの文例集

分野によって違いがあり、査読者によっても指摘されたりされなかったりするが、統計のもっとも正式な書き方は次のとおりである。

  • 統計検定の名前、自由度、統計検定量の値、P 値そのもの (P < 0.05 等ではなく) を記載する。
  • 原則としては、重複を避けるために Results または Figure legend のどちらか一方に記載する。読みやすくするために両方に記載しても良いという意見の人もいるだろう。

Studen's t-test の結果

単に P < 0.05 としているものが多いが、以下のように自由度、t 値および P 値を書くのが望ましい。

  • Student's t-test, df = 5, t = **, P = 0.021.

One-way ANOVA の結果

詳細は更新予定。とりあえず two-way ANOVA と同様に自由度、F 値および P 値は記載すべき。

多重検定の結果を示すのに、A、B、C などの文字が使われる場合がある。これには以下のような legend がつく。

  • Different letters indicate significant differences by ** test (P < 0.05).

Two-way ANOVA の結果

Two-way ANOVA では、2 つの要素 factor の作用の有無およびそれらの間の交互作用の有無が統計的に検証されることになる。記載するべき要素は、自由度 degree of freedom、F 値および P 値 である。さらに、F 値は自由度と残差 residual の関数であるため、たとえば自由度 4, 残差 80 の場合は F (4,80) や F4,80 のようにこれらの値も記載する。


具体例:Results に書かれているもの

何種類かの薬を投与 Treatment) ラットを使って、5 日間連続して行動実験を行い (Days)、その結果に対して two-way ANOVA をかけている。対応のある検定にしなければならないような気がするが、とりあえずそこは考えないことにする。

The results of two-way ANOVA were as follows:
Treatment: F(3,20)=4.20, p=0.019; Days: F(4,80)=9.23, p<0.001; and Treatment x Days interaction : F(12,80)=3.86, p<0.001.

Timic et al. 2013a. Behav Brain Res 241, 198-205.


絶食と再給餌がアメリカゴキブリ Periplaneta americana の細胞分裂に及ぼす影響を調べた論文。腸 midgut が短くなるという結果を示した部分を抜粋。飢餓で死ぬまでに 6 週間もかかるらしい。自由度を d.f. として記載するのは比較的珍しい。文章が長くなるので、個人的には好ましくないと思う。残差は載せていない。

For the length of the midgut, two-way ANOVA showed a statistical difference in condition (fed and the starved) (d.f.=1, 216, F=89.862, p<0.0001), but not between weeks (1, 2, 3, and 4th week) (d.f.=3, 216, F=1.650, p=0.1789). No interaction was detected between feeding condition and week (d.f.=3,216, F=1.016, p=0.3867).

Park et al. 2008a. J Insect Physiol, 54, 386-392.

自由度および残差を F の下付きにするケース。

Measurements of mPFC thickness did not reveal any effect of training (two-way ANOVA, F1,13 = 0. 56, p = 0.5), lesion (F1,13 = 0.42, p = 0.5), or the training3lesion interaction (F1,13 = 0.04, p = 0.84), causing us to examine a marker that is related to oscillatory function.

Lee et al. 2012a. Neuron, 75, 714-724.

自由度および残差を F の下付きにして、さらに括弧をつける。参考に post-hoc test の部分も載せておく。

Two-way ANOVA with TRIAL (eight trials) and GROUP (two groups) as factors revealed an effect of TRIAL (F (7,182) = 26.79, p < 0.001) and GROUP (F(1,26) = 4.74, p < 0.04), and a tendency for a TRIAL x GROUP interaction ... 中略 ... Post hoc t test showed that subjects from the A1- group maintained the newly correct response longer than those from the A1+ group at all time points...

Jocham et al. 2009a. J Neurosci, 29, 3675-3704.

Log-rank 検定 の結果

Log-rank 検定で得られる検定統計量は chi square value である。したがって、正式な表記法は、Log-rank test, chi-square = 5.2, p = 0.02 のようになる。


有意差がなかった場合

統計検定は生物学実験につきものであり、有意差が欲しいところにつかなくて困ることがよくある。また、「何とか有意差がほしい」とか、「ここはちょっと都合が悪いけど、有意でないからあまり触れずにおこう」という気分になるのも、実験の結果をまとめる段階ではよくあることである。

しかし、統計の原則に立ち戻って考えると、以下の点を改めて意識する必要がある。そもそも、そのデータに統計検定をかけるべきなのかどうかという問題もある。

  • 「有意差がない」の意味するところは「影響がない」ではなく、「影響がない、または(サンプル数が少ない、ばらつきが大きいなどの理由で)影響を検出できないのいずれか」である。
  • 「有意差がある」 は、たかだか 95% または 99% の有意水準での議論である。
  • 「有意差がある」 は、「生物学的に意味のある差である」 ことを保証しない。

このセクションでは、統計の結果にを説明する英語表現を、残念ながら有意差が得られなかった場合にもちょっと自己主張したいときのテクニックを記録しておく。このあたりは、ちょっとした言葉の使い方で、統計の意味を理解しているかどうかわかってしまうので注意したい。


文例集

実際の P 値を載せて、惜しかったことを強調する。

Furthermore, testing for a common correlation for the two diagnostic groups approached significance (P = 0.09), suggesting a difference in correlation. Dorph-Petersen et al. 2007a. J Comp Neurol 501, 290-301.

When the two-way ANOVA was applied on values for the latency to reach the platform during the learning phase it revealed a statistically significant influence of the factor Days (F(4,80) = 29.27, p < 0.001) and interaction between Treatment × Days (F(12,80) = 2.42, p = 0.010), while the factor Treatment was close to significance (F(3,20) = 3.04, p = 0.053). Timic et al. 2013a. Behav Brain Res 241, 198-205.


差があったと先に言ってしまう。

The mean activity of the red muscle was considerably lower in the starved fish, though the difference was not statistically significant. Black & Skinner 1986a. J Comp Physiol B 156, 497-502.


トレンドがあったと言う。

Apart from the improved reversal learning performance, the mGlu5 PAM did not significantly affect performance of the extra-dimensional shift, although the deficit there was comparable to that of reversal learning. There was however a trend for improvement consistent with the downregulation of mGlu5 receptors observed in the mPFC, which is more implicated in set-shifting performance than the OFC. Gastambide et al. 2012a. Neuropsychopharmacology 37, 1057-1066.


サンプル数が十分でなく、statistical power が弱い

Given the lower numbers of subjects exposed to these drugs however, this may be attributable to a lack of power. Welch et al. 2011a. Schizophr Bull 37, 1066-1076.


limited effect という。no effect ではない。

This result implies that postsynaptic activity blockade has limited effect on the pattern of presynaptic callosal axon innervation. Mizuno et al. 2007a. J Neurosci 27, 6760-6770.

普通の場合は、has no effect とは言えない。no effect was observed のような言い方なら、我々が観察できなかっただけで、効果がないとは断言していないので間違いではない。


広告

コメント欄

各ページのコメント欄を復活させました。スパム対策のため、以下の禁止ワードが含まれるコメントは表示されないように設定しています。レイアウトなどは引き続き改善していきます。「管理人への質問」「フォーラム」へのバナーも引き続きご利用下さい。

禁止ワード: http, the, м (ロシア語のフォントです)


このページにコメント

Name:


Comment:



これまでに投稿されたコメント

Date Name Comment

References