ケンダルの順位相関係数。 ケンダル順位相関係数 ケンダル順位相関係数

27.10.2021

定量的または定性的指標をランク付けできる場合、それらの間の関係を特定するために使用されます。 X インジケーターの値は昇順および割り当てられたランクで表示されます。 Y 指標の値がランク付けされ、Kendall 相関係数が計算されます。

どこ S = PQ.

P 大きいランクYの値。

Q- 現在の観測に続く観測の総数 小さいランクYの値。 (同じランクは考慮されません!)

研究対象のデータが繰り返される (同じ順位を持つ) 場合、調整された Kendall 相関係数が計算に使用されます。

t- シリーズ X と Y のそれぞれの関連ランクの数。

19.研究のテーマ、対象、主題、目的、目的、仮説を決めるときは何から進めるべきですか?

研究プログラムには、原則として、方法論と手順の 2 つのセクションがあります。 1つ目は、トピックの関連性の正当化、問題の定式化、対象と主題の定義、研究の目標と目的、基本概念(カテゴリー的装置)の定式化、研究対象と定式化の予備的な体系的分析を含みます。作業仮説の。 2 番目のセクションでは、研究の戦略的設計と、一次データを収集および分析するための設計と基本手順を明らかにします。

まず第一に、研究テーマを選択するときは、関連性から進めなければなりません。 関連性の正当化これには、教育と教育の理論と実践をさらに発展させるために、問題を研究し解決する必要性と適時性の示唆が含まれています。 現在の研究は最も差し迫った問題に対する答えを提供します 与えられた時間社会の社会秩序を教育科学に反映する質問は、実際に起こっている最も重要な矛盾を明らかにします。 関連性の基準は動的かつ柔軟であり、特定の特殊な状況を考慮して時間に依存します。 最も一般的な形式では、関連性は、科学的アイデアおよび実践的な推奨事項(特定のニーズを満たすための)に対する需要と、科学と実践が現時点で提供できる提案との間の矛盾の程度を特徴付けます。

研究テーマを定義する最も説得力のある根拠は社会秩序であり、緊急の解決策を必要とする最も差し迫った社会的に重要な問題を反映しています。 社会秩序には、特定のトピックに対する正当化が必要です。 通常、これは科学における疑問がどの程度発展したかを分析するものです。

社会秩序が教育実践の分析から導き出されるのであれば、 科学的な問題別の次元にいます。 それは科学によって解決されなければならない主要な矛盾を表現しています。 問題の解決策は通常、 研究の目的。目標は問題を再定式化することです。

問題の定式化には次のことが含まれます オブジェクトの選択研究。 それは教育的プロセス、教育的現実の領域、または矛盾を含む何らかの教育的関係である可能性があります。 言い換えれば、オブジェクトとは、明示的または暗黙的に矛盾を含み、問題のある状況を引き起こすものであれば何でも構いません。 オブジェクトとは、認識のプロセスが目的とするものです。 研究テーマ -物体の部分、側面。 これらは、直接研究の対象となる、実用的または理論的な観点から見たオブジェクトの最も重要な特性、側面、および特徴です。

研究の目的、目的、主題に応じて研究内容を決定します タスク、通常はチェックすることを目的としています 仮説。後者は理論に基づいた一連の仮定であり、その真実性は検証の対象となります。

基準 科学的な新規性完了した研究の品質を評価するために適用できます。 それは、現時点では知られておらず、教育学の文献にも記録されていない、新しい理論的および実践的な結論、教育のパターン、その構造とメカニズム、内容、原理、技術を特徴づけます。 研究の新規性は、理論的意味と実用的意味の両方を持ちます。 研究の理論的意義は、コンセプトを作成し、問題、傾向、方向性を特定するための仮説、パターン、方法、モデルを取得することにあります。 研究の実際的な意義は、提案書や勧告などを作成することにあります。 新規性、理論的および実用的重要性の基準は、研究の種類によって異なります。また、新しい知識を取得した時期によっても異なります。

計算するには ケンダル係数因子特性の値は事前にランク付けされています。つまり、X によるランクは厳密に定量的な値の昇順で書かれています。

1) Y の各ランクについて、指定されたランクよりも値が大きい後続のランクの合計数を見つけます。 このようなケースの合計数は「+」記号を使用して考慮され、P で示されます。

2) Y の各ランクについて、指定されたランクよりも値が小さい後続のランクの数を決定します。 そのようなケースの合計数は「-」記号を使用して考慮され、Q で示されます。

3) S=P+Q=9+(-1)=8を計算します。

4) ケンデル係数は次の式を使用して計算されます。

ケンデル係数は -1 から +1 までの値をとり、 に近づくほど特性間の関係が強くなります。

場合によっては、2 つの特性間の関係の方向を決定するために、次の計算が行われます。 フェヒナー係数。 この係数は、因子の個々の値とその結果として得られる特性の平均値からの偏差の動作の比較に基づいています。 フェヒナー係数は次の式を使用して計算されます。

; ここで、合計 C - 総数逸脱符号の一致の合計 N は、逸脱符号の不一致の総数です。

1) 因子特性の平均値を計算します。

2) 平均値からの因子特性の個々の値の偏差の符号を決定します。

3) 結果の特性の平均値を計算します。 .

4)結果として得られる特性の個々の値の平均値からの偏差の兆候を見つけます。

結論: 接続は直接的であり、係数は接続の近さを示しません。

ランク付けされた 3 つの特性間の関連性の近さを決定するには、係数を計算します。 一致。次の式で計算されます。

ここで、m はランク付けされた特徴の数です。 n はランク付けされた観測ユニットの数です。

産業 X1 X2 X3 R1 R2 R3
電力業界 7,49
燃料 12,70
チェルナヤ M. 5,92
ツベトナヤ M. 9,48
機械工学 4,18
結果:

X1- 従業員数(千人) X2- 産業売上高(10億ルーブル)。 X3- 平均月収。

1) すべての特徴の値をランク付けし、定量的値が増加する順に厳密にランクを設定します。

2) 各行について、順位の合計を決定します。 合計行はこの列から計算されます。

3) 計算する .

4) 各行について、ランクと T 値の合計の二乗偏差を求め、同じ列を使用して、S で示す最終行を計算します。 一致係数は0から1までの値をとり、1に近づくほど特性間の関連性が強くなります。

ランク付けする場合、専門家は評価対象の要素を好みの昇順(降順)に並べ、自然数の形式でそれぞれの要素にランクを割り当てる必要があります。 直接ランキングでは、最も優先される要素はランク 1 (場合によっては 0) を持ち、最も優先されない要素はランク m を持ちます。

専門家が、いくつかの要素の優先順位が同じであると考え、厳密なランク付けを実行できない場合は、そのような要素に同じランクを割り当てることが許可されます。 ランクの合計がランク付けされた要素の順位の合計と等しくなるように、いわゆる標準化ランクが使用されます。 標準化されたランクは、優先順位が同じであるランク付けされたシリーズ内の要素の数の算術平均です。

例2.6。専門家は 6 つの項目を次のように優先順位でランク付けしました。

次に、これらの要素の標準化されたランクは次のようになります。

したがって、要素に割り当てられたランクの合計は、自然系列の数値の合計と等しくなります。

項目をランク付けすることで好みを表現する精度は、一連のプレゼンテーションの力に大きく依存します。 ランク付け手順では、評価される要素の数が 10 個以下の場合に、(明らかにされた好みと「真」の間の近さの度合いに関して) 最も信頼できる結果が得られます。プレゼンテーション セットの最大パワーは 20 を超えてはなりません。

ランキングの処理と分析は、個人の嗜好に基づいてグループの嗜好関係を構築することを目的として実行されます。 この場合、次のタスクを設定できます。 a) 一連のプレゼンテーションの要素に関する 2 人の専門家のランキング間の関係の近さを決定します。 b) 2 つの要素のさまざまな特性に関するグループメンバーの個人的な意見に従って、2 つの要素間の関係を決定する。 c) 3 人以上の専門家からなるグループにおける専門家の意見の一貫性を評価する。

最初の 2 つのケースでは、係数は接続の近さの尺度として使用されます。 順位相関。 厳密なランキングのみが許可されるか、非厳密なランキングのみが許可されるかに応じて、Kendall または Spearman の順位相関係数が使用されます。

問題 (a) の Kendall の順位相関係数

どこ メートル− 要素の数。 r1i –最初の専門家によって割り当てられたランク −番目の要素; r2i – 2人目の専門家も同様。

問題 (b) の場合、コンポーネント (2.5) は次の意味を持ちます。 m - 評価される 2 つの要素の特性の数。 r1i(r 2 i) - ランクi専門家のグループによって設定された、1 番目 (2 番目) の要素のランキングにおける特性。

厳密なランキングには順位相関係数が使用されます rスピアマン:


そのコンポーネントは (2.5) と同じ意味を持ちます。

相関係数 (2.5)、(2.6) は -1 から +1 まで変化します。 相関係数が +1 の場合、ランキングが同じであることを意味します。 -1 に等しい場合、- は反対です (ランキングは互いに反対です)。 相関係数がゼロの場合は、ランキングが線形に独立している (相関がない) ことを意味します。

このアプローチでは (専門家はランダムな誤差を伴う「測定者」です)、個々のランキングはランダムであるとみなされるため、結果として得られる相関係数の有意性に関する仮説を統計的に検定するというタスクが発生します。 この場合、Neyman-Pearson 基準が使用されます。基準 α の有意水準が設定され、相関係数の分布の法則を知って、しきい値が決定されます。 、相関係数の結果の値が比較されます。 クリティカルエリアは右手系です(実際には、通常、最初に基準値が計算され、そこから有意水準が決定され、しきい値レベルと比較されます) α ).

m > 10 の場合、ケンダルの順位相関係数 τ は次のパラメーターで正規に近い分布になります。

ここで、M [τ] – 数学的期待値。 D [τ] – 分散。

この場合、標準正規分布関数のテーブルが使用されます。

そして臨界領域の境界 τ α は方程式の根として定義されます。

係数の計算値 τ ≥ τ α の場合、ランキングはよく一致していると考えられます。 通常、α の値は 0.01 ~ 0.05 の範囲で選択されます。 t ≤ 10 の場合、t の分布を表に示します。 2.1.

スピアマン係数 ρ を使用した 2 つのランキングの一貫性の重要性のチェックは、m > 10 のスチューデント分布表を使用して同じ順序で実行されます。

この場合の値は

の分布は Student 分布によってよく近似されています。 メートル– 2 つの自由度。 で メートル> 30 では、ρ の分布は通常の分布とよく一致し、M [ρ] = 0 および D [ρ] = になります。

m ≤ 10 の場合、ρ の有意性はテーブルを使用してチェックされます。 2.2.

ランキングが厳密でない場合、スピアマン係数は

ここで、ρ – は (2.6) に従って計算されます。

ここで、k 1 、k 2 は、それぞれ第 1 位と第 2 位の非厳密ランクの異なるグループの数です。 i は同じランクの数です。 -番目のグループ。 実際に順位相関係数 ρ Spearman および τ Kendall を使用する場合、最小分散という意味では係数 ρ の方がより正確な結果が得られることに留意する必要があります。

表2.1。ケンダルの順位相関係数分布

Kendall の相関係数は、関連するランクがない場合に、変数が 2 つの順序スケールで表される場合に使用されます。 Kendall 係数の計算には、一致と反転の数をカウントすることが含まれます。 前の問題の例を使用してこの手順を考えてみましょう。

問題を解決するためのアルゴリズムは次のとおりです。

    表内のデータを並べ替えます。 8.5 なので、行の 1 つ ( この場合× i) ランク付けされたことが判明しました。 言い換えれば、ペアを並べ替えます ×そして y 正しい順序で、そして テーブルの列 1 と列 2 にデータを入力します。 8.6.

表8.6

×

y

2. 2行目の「順位」を決定します( y私)。 この手順は次の順序で実行されます。

a) ランク付けされていない系列の最初の値「3」を取得します。 ランク数のカウント 下に指定された番号、 もっと比較した値。 そのような値は 9 つあります (数字 6、7、4、9、5、11、8、12、および 10)。 「一致」列に数字 9 を入力します。 次に、その値の数を数えます。 少ない三つ。 そのような値は 2 つあります (ランク 1 と 2)。 「反転」列に数値 2 を入力します。

b) 数値 3 を破棄し (すでに処理済み)、次の値「6」について手順を繰り返します。一致の数は 6 (ランク 7、9、11、8、12、および 10) です。反転数は 4 (ランク 1、2、4、および 5) です。 「一致」列に数字 6 を入力し、「反転」列に数字 4 を入力します。

c) 行の終わりまで同様の手順が繰り返されます。 それぞれの「計算された」値はそれ以上の考慮から除外されることに注意してください (この数値を下回るランクのみが計算されます)。

注記

計算を間違えないように、「ステップ」ごとに一致と反転の合計が 1 ずつ減少することに留意する必要があります。 毎回 1 つの値が考慮から除外されることを考えると、これは理解できます。

3. 一致の合計が計算されます (P)そして反転の和 (問); データは、ケンダル係数 (8.10) の 1 つおよび 3 つの交換可能な式に入力されます。 対応する計算が実行されます。

t (8.10)

私たちの場合:

テーブル内 XIV 付録には、このサンプルの係数の臨界値 τ cr が含まれています。 = 0.45; 0.59。 経験的に得られた値が表に基づいた値と比較されます。

結論

τ = 0.55 > τ cr. = 0.45。 相関関係はレベル 1 で統計的に有意です。

注記:

必要に応じて(たとえば、臨界値の表がない場合)、統計的有意性 t Kendall は次の式で決定できます。

(8.11)

どこ S* = P – Q+1の場合 P< Q 、 そして S* = P – Q – 1 の場合 P>Q。

価値観 z対応する有意水準はピアソン測定に対応しており、対応する表に記載されています (付録には含まれていません。標準有意水準の場合) z kr = 1.96 (β 1 = 0.95 の場合) および 2.58 (β 2 = 0.99 の場合)。 Kendall の相関係数は、次の場合に統計的に有意です。 z > z cr

私たちの場合 S* = P – Q– 1 = 35、および z= 2.40、つまり、最初の結論が確認されます。特性間の相関は、第 1 レベルの有意性に関して統計的に有意です。

ケンダルの順位相関係数

2 つの確率変数 (特徴) Xi の依存関係のサンプル尺度の 1 つ Yさんサンプル要素のランキングに基づいて (X 1、 ), .. ., (Xn、Yn). K.k. したがって、それを指します 統計学者のランキングそして次の式で決定されます

どこ - U、そのカップルに属しています ( X、Y), カット用 Xequal i、S = 2N-(n-1)/2、N はサンプル要素の数であり、j>i と r j >r iいつも

K. k.r. の依存性の選択的な尺度として。 K. は M. Kendall によって広く使用されました (M. Kendall を参照)。

K.k. 確率変数の独立性の仮説をテストするために使用されます。 独立性仮説が正しい場合、E t =0 および D t =2(2n+5)/9n(n-1) になります。 サンプルサイズが小さい場合、統計を確認する 独立性仮説は特別なテーブルを使用して作成されます (参照)。 n>10 の場合、m の分布に正規近似を使用します。 . その場合、独立性の仮説は拒否され、そうでない場合は受け入れられます。 ここで、 X、Y- 有意水準、u a /2 は正規分布のパーセント点です。 K.k. k. は、他のものと同様に、サンプル要素をこれらの特性に関連して順序付けることができれば、2 つの定性的特性の依存関係を検出するために使用できます。 もし

相関係数 p を持つジョイント法線がある場合、K. k.r と K. k.r の間の関係は次のようになります。 k であり、次の形式になります。 こちらも参照

スピアマンのランク相関、ランクテスト。点灯。

: Kendal M.、順位相関、トランス。 英語から、M.、1975年。 Van der Waerden B. L.、数学、翻訳。 ドイツ人M.より、1960年。 ボルシェフ L. N.、スミルノフ N. V.、数学統計表、M.、1965 年。


A.V.プロホロフ。数学百科事典。 - M.: ソビエト百科事典

    英語 効率的なランク相関を備えた Kendall。 ドイツ語 Kendalls Rangkorlationskoeffizient。 2 つの変数に従ってオブジェクトのすべてのペアの順序間の一致度を決定する相関係数。 アンチナチ。 社会学百科事典、2009 ... 社会学百科事典

    ケンダルの順位相関係数- 英語 係数、順位相関 Kendall; ドイツ語 Kendalls Rangkorlationskoeffizient。 相関係数。2 つの変数に従ってオブジェクトのすべてのペアの順序の一致度を決定します... 社会学解説辞典

    独立した観測結果 (X1、Y1) のランキングに基づく、2 つの確率変数 (特徴) X および Y の依存関係の尺度。 。 .,(Xn,Yn)。 X 値の順位が自然順序である場合、i=1、. 。 ., n,a Ri ランク Y、対応する ... ... 数学百科事典

    相関係数- (相関係数) 相関係数は、2 つの確率変数の依存性を示す統計的な指標です。相関係数の定義、相関係数の種類、相関係数の性質、計算と適用... ... 投資家百科事典

    確率変数間の依存関係。一般的に言えば、厳密には機能的な性質を持ちません。 関数依存とは対照的に、K は、原則として、量の一方が他方の量に依存するだけでなく、他にも依存する場合に考慮されます。 数学百科事典

    相関 (相関依存) は、2 つ以上の確率変数 (またはある程度の許容可能な精度でそのようにみなされる変数) 間の統計的関係です。 この場合、いずれかの値の変更または... ... ウィキペディア

    相関- (相関) 相関とは、2 つ以上の確率変数間の統計的関係です。相関の概念、相関の種類、相関係数、 相関分析、価格相関、FXコンテンツ上の通貨ペアの相関…… 投資家百科事典

    S. m.v. の始まりは、一般に受け入れられています。 または、よく呼ばれるように、「小さい n」の統計は、20 世紀の最初の 10 年に W. ゴセットの著作の出版によって確立されました。ゴセットは、その中で、受け取ったものによって仮定された t 分布を配置しました。もう少ししたら世界中で…… 心理学事典

    モーリス・ケンダル サー・モーリス・ジョージ・ケンダル 生年月日: 1907年9月6日 (1907 09 06) 出生地: イギリス、ケタリング 死亡日 ... Wikipedia

    予報- (予測) 予測の定義、課題と予測の原則 予測の定義、課題と予測の原則、予測方法 内容 内容 定義 予測の基本概念 予測の課題と原則... ... 投資家百科事典