英語論文 図表の作り方: 棒グラフの軸など

UB3/english/paper/figure

このページの最終更新日: 2019/11/08

  1. 概要: Figure 作成時の重要事項
  2. Table 作成時の重要事項
  3. 棒グラフ: 原点は 0 であるべきか、など
  4. Swarm plot, violin plot, box plot

広告

概要: Figure 作成時の重要事項

理想的な論文の図というのは、以下の条件を満たしているものである。

  1. 図の内容を理解するのに説明がいらない。
  2. 図を追って行けば、論文の内容も理解出来る。

チェックリスト

とりあえずはチェックするポイントをまとめる。内容が増えてくれば、グラフの種類ごとにこのページを分割していくことになるだろう。

  • 棒グラフや折れ線グラフの色分け。図中または legend に説明があるか?
  • 図中の略語は legend でスペルアウトされているか?
  • SE を使う場合、N がきちんと記載されているか?

Table 作成時の重要事項

レビューを書くときに、適当にピックアップした遺伝子などを表にする場合。Table のタイトルを A partial list of... とすれば、網羅してなくても全然 OK になり便利。Reference 1 でそういうタイトルの表があった。

18 (5) のように、カッコで 2 つの情報を含める場合の注意書き。Numbers in the parentheses indicate the number of mice examined. のように、"number" という語を繰り返すのが一般的。冗長に感じるが、文法的にもこれが正しいはず。


広告

棒グラフ: 原点は 0 であるべきか、など

しばしば議論になる問題である。No と Yes の両方の立場からまとめてみる。原点を 0 以外にすることのほか、原点を 0 にしつつ斜線などで一部を「省略」することも同じようなものと考える。

0 にすべき派

0 にすべき派の人は、棒グラフでは 棒の長さの比がデータの比になっているべき と考える。つまり、値が 0.8 と 1.0 のとき、棒の長さの比も 8 : 10 でなければならない。したがって、原点は 0 でなくてはならない。

この場合、値の比に意味があるわけなので、必然的に棒グラフで表されるデータは 比例尺度 のデータでなければならない。したがって、例えば摂氏温度で棒グラフを書くのも正しくない。ケルビン温度ならば、原点を 0 にとって棒グラフにできる。

「グラフの軸をゼロから始めないのはうそつきか」というブログ記事 (3) によると、この主張の根拠は Huff の著書 (Ref. 4) であるらしい。

妥協案として、軸やグラフに波線を入れる方法があるが、これも根本的な違いはない。


0 でなくて良い派

ネットでは「0 にすべき派」が優勢だが、私は、この点についてフレキシブルである。つまり、原点が 0 でないグラフを見ると「普通じゃない」とは思うものの、著者がそう示したいなら OK という立場。

そもそも、棒グラフで伝わる情報は非常に少ない。せいぜい平均値と エラーバー が示す標準偏差または標準誤差である。つまり、Results の地の文に数値で 120 ± 15 と書く以上の情報は何もないわけだ。

では、なぜこれをわざわざ図にするのか? 数値の差を目で見てわかりやすく示すためるためである。

別の言い方をするならば、棒グラフを載せている以上、心には「差を強調したい」という邪な意図があるわけである。それならば、なぜ原点を変えてもっとも強調できる形で示されたグラフを叩くのか? 「罪を犯したことのないものが、まず石を投げなさい」という話である。

著名な研究者であった加藤先生の稿に次の表現があるように (2)、「原点 0」は生命科学業界の統一ルールではない のもポイントである。


骨密度は、数%の差異で骨強度に重大な影響をあたえる.左に示す表わし方では、有意差があってもわかりにくい.そのため、骨代謝の研究分野では、右のように、下部を切り取ることで差異を強調したかたちで表わすのが普通である.これは、決して誇張したわけではない.


実際にいくつか例を拾っておこう。いわゆる ハイインパクト の雑誌から。雑誌名 + bar graph でイメージ検索すれば見つかる。もちろん、原点がゼロのグラフの方が圧倒的に多いが、「直ちにリジェクト」というレベルの誤謬ではないことは明らかだろう。


La Rosa et al. eLife 5, e20750, 2016a.


Krizman et al. PNAS 109, 7877-7881, 2012a.


Regenbogen et al. PNAS 114, 6400-6405, 2017.


数値を棒グラフで示すことによる強調はありだが、原点を 0 以外にすることによる強調はなし、というのを「自分ルール」として持っておくのは良いことだと思う。

しかし、私はこの「自分ルールを絶対的なルールのように語る」ことが好きではない。はっきり言って、怪しいグラフを作ることよりも反感を覚える。

もし、あなたがシニアな研究者として他人にグラフの作り方を教える機会があれば、さまざまな考え方を説明したあとに「自分はこの立場をとる。この論文では私が責任ある立場なので従って欲しいが、あなたに強い主張があるならば、その意思を尊重する」という議論をするべきだと思う。

結論: 原点が 0 でない棒グラフを見つけて鬼の首を取ったように叩くのは見苦しい。


Swarm plot, violin plot, box plot

実際、棒グラフはもはや時代遅れである。一番良いと思うのは、この swarm plot (J Neurol Neurosurg Psychiatry, 87, 650-655, 2015)。

Bee swarm box-plot data with means and SDs showing the differences between groups. Bee swarm box-plot data with means and SDs illustrate the differences (Δ) in patients with orthostatic headaches (Group A, green), without (Group B, red) and patients without an spontaneous intracranial hypotension (SIH) diagnosis (C1, grey, internal control and C2, black, external control).

Violin plot は Wiki がある。


広告

References

  1. Veleri et al. 2015a (Review). Biology and therapy of inherited retinal degenerative disease: insights from mouse models. Dis Model Mech 8, 109-129.
  2. 加藤 2009a. 微妙なデータをどう表現するか. 骨研究分野での実験データ解釈を例として. 化学と生物 54, 864-870.
  3. グラフの軸をゼロから始めないのは嘘つきか. Link: Last access 2018/07/27.
  4. Huff, 1954. How to Lie with Statistics. New York: W.W. Norton.

コメント欄

各ページのコメント欄を復活させました。スパム対策のため、以下の禁止ワードが含まれるコメントは表示されないように設定しています。レイアウトなどは引き続き改善していきます。「管理人への質問」「フォーラム」へのバナーも引き続きご利用下さい。

禁止ワード: http, the, м (ロシア語のフォントです)


このページにコメント

Name:


Comment:



これまでに投稿されたコメント

Date Name Comment