yes, therapy helps!
信頼性と妥当性の4つの違い(科学における)

信頼性と妥当性の4つの違い(科学における)

四月 26, 2024

口語の言葉では非常に似た意味を持っているので、私たちが科学、特に心理測定学の話をするときに、信頼性と妥当性という用語を混同するのは簡単です。

このテキストで、我々は 信頼性と妥当性の大きな違い 。この通常の疑問を明確にすることが有用であることを願っています。

  • 関連記事:「精神測定学:データを通して人間の心を研究する」

信頼性とは何ですか?

心理測定において、概念「信頼性」は、 機器の精度を指します ;具体的には、信頼性係数は、このツールで得られた措置の一貫性と安定性を私たちに知らせます。


計測器の信頼性が高いほど、特定のアトリビュートを測定する際に使用されるランダムおよび予測不可能なエラーの量が少なくなります。信頼性は、予測可能なエラー、つまり実験的な制御を受けるエラーを除外します。

古典的なテスト理論によれば、信頼性は真のスコアによって説明される分散の割合です。したがって、テストにおける直接スコアは、ランダム誤差と真のスコアとの合計で構成されます。

信頼性の2つの主要コンポーネント 一時的な安定性と内部整合性です 。最初のコンセプトは、異なる機会に測定したときにスコアがほとんど変化しないことを示します。一方、内部整合性とは、テストを構成するアイテムが同じ心理的構成を測定する程度を指します。


したがって、信頼性係数が高いことは、テストの得点が内部的にも時間の関数としても変動しないことを示しており、要約すると、 計器には測定誤差がない .

  • 多分あなたは興味があります:「心理テストの種類:その機能と特性」

有効性の定義

妥当性について話すときは、テストが測定しようとしている構成を正確に測定するかどうかを参照します。この概念は、 テストで得られた得点と別の関連指標との関係 ;両方の要素間の線形相関の程度が妥当性の係数を決定する。

また、科学的研究においては、高い妥当性は、所定の機器または研究で得られた結果を一般化できる程度を示す。

妥当性にはさまざまな種類があり、計算方法によって異なります。これは非常に意味の異なる用語になります。基本的には、 コンテンツの妥当性、基準(または経験的)妥当性、および構成の妥当性 .


内容の妥当性は、心理テストの項目が評価される構造を構成する要素の代表的なサンプルであるかどうかを定義する。この楽器には、構成要素の基本的な側面がすべて含まれていなければなりません。たとえば、うつ病を測定するための適切なテストを行いたい場合、気分を評価し快楽を低下させる項目を必ず含める必要があります。

基準妥当性は、対象の特徴または関心領域に関連するアスペクトを予測するための計測器の能力を測定する。最後に、構成の妥当性は意図されている テストが測定しようとしているものを測定するかどうかを決定する 例えば、同様の試験で得られた得点との収束から生じる。

信頼性と妥当性の違い

これら2つの心理学的特性は密接に関連しているが、真実はそれらが明確に区別された側面を指すことである。 これらの違いが何であるかを見てみましょう .

1.分析対象

信頼性は、機器を構成する品目の特性を測定する意味で、機器の特性です。一方、妥当性は正確に機器を参照するものではなく、 結果から作られた一般化 それを通して得られた。

2.彼らが提供する情報

一般的に言えば、妥当性は、心理測定ツールが実際に測定しようとしている構成要素を測定することを示していると言われていますが、信頼性は誤差なしで正確に測定するかどうかを示します。

3.計算方法

信頼性を測定するには、基本的に3つの手順が使用されます。 2つの半分の方法、並行したものの1つと試験 - 再テスト 。最も使用されているのは2つの半分の手順で、テストに答えると項目が2つのグループに分かれています。 2つの半分の間の相関が分析される。

パラレルまたは代替フォームの方法は、2つの同等のテストを作成して、それらの間の項目をどの程度相関させるかを測定することから成ります。テスト再テストは、可能な限り類似した条件で、テストを2回渡すことに基づいています。両方の手続きを組み合わせることができ、第1形式のテストと第2形式の間に時間間隔を置くことからなるパラレル形式のテスト再テストが発生します。

その部分については、妥当性 タイプによって異なる方法で計算されます しかし、一般に、すべての方法は、客観的試験におけるスコアと類似の形質に関する同じ被験者の他のデータとの比較に基づいている。その目的は、その試験がその形質の予測因子として働くことができることである。

妥当性を評価するために使用された方法の中で、我々は階乗分析とマルチメソッド多特性行列の技法を見出す。また、コンテンツの妥当性は、しばしば合理的な非統計的分析によって決定される。例えば、それは見かけの妥当性を含み、それはテストの妥当性に関する専門家の主観的判断を意味する。

4.両概念の関係

心理測定器の信頼性はその有効性に影響を与えます: 信頼性が高いほど有効性は高くなります 。したがって、工具の有効係数は信頼性の係数よりも常に低く、妥当性は間接的に信頼性について私たちに知らせる。


京都大学大学院医学研究科 聴講コース 臨床研究者のための生物統計学「仮説検定とP値の誤解」佐藤 俊哉 医学研究科教授 (四月 2024).


関連記事