山田養蜂場運営の研究拠点「山田養蜂場 健康科学研究所」が発信する、情報サイトです。ミツバチの恵み、自然の恵みについて、予防医学と環境共生の視点から研究を進めています。
トップ > 研究所のご案内 > 所長からのメッセージ
健康情報ではグラフが頻繁に使われます。効果を一目で理解できる利点があるからです。その反面、グラフで示された結果は科学的に信頼できると思い込んでしまい、疑いを持つことはあまり無いのではないでしょうか。しかしグラフには、罠がひそんでいます。
ここでひとつ例を挙げてみましょう。図1をご覧ください。これは、あるヒト試験で(ア)という成分を摂取した高血圧患者のグループと、(イ)という成分を摂取した高血圧患者のグループの、収縮期血圧を比較した結果です。もしかすると、成分(イ)の方が血圧を下げる効果が高いように見えるかもしれません。しかし科学的には、成分(ア)と成分(イ)に効果の違いは無いと結論づけます。なぜなら、これらの数値には「有意差」が無いからです。
「有意差」とは何でしょうか。それは文字通り、「意味のある差」ということです。グラフで示された「差」にも、意味があるもの(本当に「差がある」と判断して良いもの)と、意味が無いもの(実際は差が無いのに、たまたま、差があるように見えるもの)があるのです。つまり、実際には効果が無いものを効果があるように見せかけるグラフがあるということです。これが「グラフにひそむ罠」です。
本当は効果が無いのに、効果があるように見える――そのようなことが、なぜ起きるのでしょうか。
例えば、ある成分の高血圧に対する効果を調べたいときには、世界中のすべての高血圧患者にその成分を摂取させる試験を行えば、最も確かな結果が得られます。しかしそのような試験を行うことは現実的に不可能なので、通常、何名かの患者で試験を行い、その結果から、世界中の患者がその成分を使用したときに表れる実際の効果を推定します。ですからどうしても、世界中の患者全員がその成分を使用した場合に表れる効果と、被験者から得られた結果との間にズレが生じるのです。そして、このズレが大きくなるような不適切な方法で試験を行うと、本当は効果が無いにもかかわらず効果があるように見える、あるいは、本当は効果があるにもかかわらず効果が無いように見える、“意味の無い”結果が偶然出ることがあるのです。
そこで研究者は、試験で得られたデータに対して「有意差検定」を行い、数値どうしの差に意味があるかどうかを判定します。グラフの罠にはまり、実際は効果が無いものに対して「効果がある」と判断するようなことがあってはいけないからです。図1に対しても、有意差検定を行った結果、有意差が無いと結論づけたのです。つまり図1は、被験者数が少ないなど、試験方法が不適切だったために偶然表れた結果なのです。
それでは、「有意差検定」とはどのように行うのでしょうか。図1で示したものとは別の例を考えてみましょう。
例えば、ある成分の高血圧に対する効果を調べるため、数十名の高血圧患者を対象にプラセボ対照二重盲検試験を行った結果、収縮期血圧の平均が、効果を確かめたい成分を含む試験食を摂取したAグループで140 mgHg、その成分を含まず、血圧に影響しないと考えられるプラセボを摂取したBグループで147 mmHgになったとします(二重盲検試験の定義は第2章をご覧ください)。さて、この7 mmHgの差に意味はあるでしょうか。つまりこの差は、試験した成分の作用によって生じたものといえるでしょうか。
有意差検定ではまず、「表れた差には意味が無い」と仮定します。上述の試験であれば、「AグループとBグループの間に生じた7 mmHgの差には意味が無い」、つまり、「試験した成分には血圧を下げる効果が無く、もしも世界中の高血圧患者を対象に同様の試験を行うことができたとしたら、試験後の両グループの平均の血圧がほぼ一致する結果が出る」と仮定するということです。その仮定の下で、実際に試験したAグループとBグループの血圧の平均値に7 mmHgの差が表れる確率を計算します。そしてその確率が、5パーセントあるいは1 パーセント以下と非常に低ければ、「表れた差には意味が無い」とした仮定に無理があると判断し、「AグループとBグループの血圧には有意差がある」、つまり「試験した成分には血圧を下げる効果がある」と結論づけるのです。
しかしこのような計算を自分で行うことは難しいものです。そこで最後に、有意差があるかどうかを見分けるポイントをご紹介します。
表やグラフにおいて、p < 0.05といった表示を見かけたことはありませんか。pは確率(probability)の頭文字で、p < 0.05は、「試験したものには効果が無く、世界中のすべての対象者に試験したとき差が表れない」と仮定した場合に、グラフで示された差が生じる確率は5パーセント以下である、つまり、これらは偶然表れた差ではなく意味があり、試験したものには効果があると判定できる、ということを示しています。1パーセントで検定した場合は、p < 0.01が示されます。図2として、pが示されているグラフの例を当研究所の研究結果から挙げました。pをグラフ中に示すときは、*(アスタリスク)や#(シャープ)がよく使われます。
健康情報をご覧になった際には、このp < 0.05やp < 0.01といった表示を探してみましょう。表示した上で「効果がある」と結論づけているならば、信頼できる情報です。
監修:山田養蜂場 健康科学研究所 所長 八巻礼訓