論文や調査レポートを読んでいると、数字のそばに「95%CI」や「95信頼区間」という表記が出てきます。何となく「信頼できる範囲」みたいなイメージで読み飛ばしていたこと、ありませんか?
わたしも最初はそうで、どこかのタイミングで意味が分かった気になっていました。でも「95%の確率で真の値がこの中にある」という理解、実はこれが一番多い誤解なんですよね。『ゴイノワ』のナギです。
この記事では、95信頼区間の意味をちゃんとほどきながら、どう読めばいいのか・どこで見かける言葉なのかを一緒に見ていきます。
95信頼区間、まず意味から
信頼区間とは、母集団の真の値(母平均など)がおそらくこの範囲に入るだろう、という推定の幅のことです。点推定が「平均は170cmと推定されます」という一点の答えを出すのに対して、区間推定は「170cm前後のこの幅の中に、おそらく本当の平均が入っています」という形で答えます。
そして「95信頼区間」とは、この方法で100回推定を繰り返したとき、95回はその区間の中に母平均が含まれるという意味です。数字は固定された真の値であり、確率で揺れているのは「推定された区間の方」だというのが、この概念の核心です。
ここがわかると、「95%の確率で真の値が入っている」という言い方が少し違うことが見えてきます。真の値は決まった値なので、ある区間に入っているか入っていないかのどちらかしかないんですよね。
よくある誤解をほどく
「95%信頼区間の中に、95%の確率で真の値がある」という解釈はとても直感的で、初めて学ぶ人の多くがここでつまずきます。わたしもそう読んでいた時期があるので、他人事じゃないなと思っています。
正確には、「95%」は一回の推定に対する確率ではなく、この推定手法を繰り返したときの頻度としての割合を指します。算出された区間そのものは、もう「入っているか、入っていないか」の二択です。確率としての95%は、区間が計算される前の段階の話なんですよね。
似た言葉に「信用区間(確信区間)」がありますが、こちらはベイズ統計学の用語で、意味がやや異なります。信用区間の場合は「母平均が95%の確率でこの区間に含まれる」という読み方ができるので、混同しやすいところです。同じ「CI」という略語でも、どちらの文脈かを確認してから読むのが安全です。
どうやって計算されるの?
95信頼区間の基本的な計算式は、標本平均 ± 1.96 × 標準誤差です。この「1.96」は正規分布の性質から来た数字で、上下2.5%ずつを除いた中央95%に対応しています。
- 標本平均±1.96×標準誤差で計算される
- サンプルサイズが大きいほど区間が狭くなる
- ランダム抽出でなければ信頼区間は意味を持たない
サンプル数が増えるほど推定の精度が上がり、区間が狭くなっていくのも直感的に納得しやすい話です。100人調査より1000人調査の方が、絞り込んだ幅で推定できますよね。
どこで見かける言葉?
95信頼区間は、医学論文・臨床研究・調査レポートの数値とセットでよく出てきます。たとえば「薬Aの効果量は0.5(95%CI:0.2〜0.8)」という形です。この表記を読んだとき、「この推定方法を繰り返せば95回はこの区間に真の値が入る」という前提で書かれていると意識するだけで、数字の受け取り方がぐっと変わります。
ナギ「CI」ってそういう意味だったのか!
論文だけでなく、世論調査の報告書や医療系のウェブメディアでもよく使われます。「統計的に有意」という表現と一緒に出てくることも多く、p値との関係を知っておくとさらに読みやすくなります。
似ている言葉との違いを見ておく
「信頼区間」と並べて覚えておきたい言葉がいくつかあります。混乱しやすい組み合わせを一度整理しておくと、次に見かけたときに止まらずに読めます。
- 信用区間(確信区間)
-
ベイズ統計学の用語。母平均が95%の確率でこの区間に含まれると解釈できる
- 点推定
-
母数を一つの値で推定する方法。区間推定と対になる概念
どちらも略語は「CI」なので、論文や資料を読むとき、その文章が頻度主義統計かベイズ統計かを確認する癖をつけておくと、解釈のズレが減ります。同じ略語でも意味が変わる組み合わせは、このあたりが特に紛らわしいので、一度ひっかかって覚えるのも手です。
「95%」の数字、最後に確認しておく
95信頼区間の「95%」は、特定の区間に真の値が入っている確率ではなく、「この推定手法を繰り返したとき、95回はうまく真の値を含む区間が作れる」という信頼性の指標です。この言葉に出合ったとき、その95%が何を指しているのかが見えていると、数字を読み流さずに済みます。
医療や調査の文脈では、95信頼区間の幅を見て推定の精度感をつかむ使い方も一般的です。幅が広ければ不確かさが大きく、狭ければ絞り込めているという読み方ができます。
次に「95%CI」を見かけたとき、まず区間の幅に目を向けてみてください。そこから「どれくらいの精度で推定されているのか」を感覚でつかめるようになると、数字との距離がもう少し縮まる気がします。












