UGMJC-3PSYCHOLOGYSEM-3

UG-PSYCHOLOGY, SEMESTER-3, MJC-3, UNIT-3

рд╕рд╣рд╕рдВрдмрдВрдз (Correlation): рдЕрд╡рдзрд╛рд░рдгрд╛ рдФрд░ рдкреНрд░рдХрд╛рд░

рдкрд░рд┐рдЪрдп

рд╕рд╣рд╕рдВрдмрдВрдз (Correlation) рд╕рд╛рдВрдЦреНрдпрд┐рдХреА (Statistics) рдХрд╛ рдПрдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╡рд┐рд╖рдп рд╣реИ, рдЬреЛ рджреЛ рдпрд╛ рдЕрдзрд┐рдХ рдЪрд░реЛрдВ (Variables) рдХреЗ рдмреАрдЪ рдХреЗ рд╕рдВрдмрдВрдз рдХреЛ рдорд╛рдкрддрд╛ рд╣реИред рдпрд╣ рдпрд╣ рдмрддрд╛рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддрд╛ рд╣реИ рдХрд┐ рдпрджрд┐ рдПрдХ рдЪрд░ рдмрдврд╝рддрд╛ рдпрд╛ рдШрдЯрддрд╛ рд╣реИ, рддреЛ рджреВрд╕рд░рд╛ рдЪрд░ рдХрд┐рд╕ рдкреНрд░рдХрд╛рд░ рдкреНрд░рднрд╛рд╡рд┐рдд рд╣реЛрддрд╛ рд╣реИред

рд╕рд╣рд╕рдВрдмрдВрдз рдХрд╛ рдЙрдкрдпреЛрдЧ рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди, рдЕрд░реНрдерд╢рд╛рд╕реНрддреНрд░, рд╡реНрдпрд╡рд╕рд╛рдп, рдЪрд┐рдХрд┐рддреНрд╕рд╛ рдФрд░ рд╢рд┐рдХреНрд╖рд╛ рд╕рд╣рд┐рдд рдХрдИ рдХреНрд╖реЗрддреНрд░реЛрдВ рдореЗрдВ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди рдореЗрдВ рдпрд╣ рдкрддрд╛ рд▓рдЧрд╛рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИ рдХрд┐ рдЕрдзреНрдпрдпрди рдХреЗ рдШрдВрдЯреЛрдВ рдФрд░ рдкрд░реАрдХреНрд╖рд╛ рдХреЗ рдЕрдВрдХреЛрдВ рдХреЗ рдмреАрдЪ рдХреЛрдИ рд╕рдВрдмрдВрдз рд╣реИ рдпрд╛ рдирд╣реАрдВред

рдЗрд╕ рд▓реЗрдЦ рдореЗрдВ, рд╣рдо рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рд╡рд┐рд╖рдпреЛрдВ рдХреЛ рд╡рд┐рд╕реНрддрд╛рд░ рд╕реЗ рд╕рдордЭреЗрдВрдЧреЗ:

  1. рд╕рд╣рд╕рдВрдмрдВрдз рдХреА рдЕрд╡рдзрд╛рд░рдгрд╛
  2. рд╕рд╣рд╕рдВрдмрдВрдз рдХреЗ рдкреНрд░рдХрд╛рд░
  3. рд╡рд╛рд╕реНрддрд╡рд┐рдХ рдЬреАрд╡рди рдореЗрдВ рд╕рд╣рд╕рдВрдмрдВрдз рдХреЗ рдЙрджрд╛рд╣рд░рдг

1. рд╕рд╣рд╕рдВрдмрдВрдз рдХреА рдЕрд╡рдзрд╛рд░рдгрд╛

рдкрд░рд┐рднрд╛рд╖рд╛

рд╕рд╣рд╕рдВрдмрдВрдз рд╡рд╣ рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рдорд╛рдк рд╣реИ рдЬреЛ рдпрд╣ рджрд░реНрд╢рд╛рддрд╛ рд╣реИ рдХрд┐ рджреЛ рдЪрд░ рдПрдХ рджреВрд╕рд░реЗ рд╕реЗ рдХрд┐рддрдиреЗ рдЬреБрдбрд╝реЗ рд╣реБрдП рд╣реИрдВред рдпрд╣ рдпрд╣ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХрд░рддрд╛ рд╣реИ рдХрд┐ рдпрджрд┐ рдПрдХ рдЪрд░ рдмрдврд╝рддрд╛ рдпрд╛ рдШрдЯрддрд╛ рд╣реИ, рддреЛ рджреВрд╕рд░рд╛ рдЪрд░ рдХрд┐рд╕ рд╣рдж рддрдХ рдЙрд╕реА рджрд┐рд╢рд╛ рдореЗрдВ рдмрдврд╝реЗрдЧрд╛ рдпрд╛ рдШрдЯреЗрдЧрд╛ред

рд╕рд╣рд╕рдВрдмрдВрдз рдХреА рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдБ

  • рджрд┐рд╢рд╛ (Direction) тАУ рд╕рд╣рд╕рдВрдмрдВрдз рд╕рдХрд╛рд░рд╛рддреНрдордХ (Positive), рдирдХрд╛рд░рд╛рддреНрдордХ (Negative), рдпрд╛ рд╢реВрдиреНрдп (Zero) рд╣реЛ рд╕рдХрддрд╛ рд╣реИред
  • рд╢рдХреНрддрд┐ (Strength) тАУ рд╕рд╣рд╕рдВрдмрдВрдз рдХрд╛ рдкрд░рд┐рдорд╛рдг рд╕рд╣рд╕рдВрдмрдВрдз рдЧреБрдгрд╛рдВрдХ (Correlation Coefficient) рджреНрд╡рд╛рд░рд╛ рдорд╛рдкрд╛ рдЬрд╛рддрд╛ рд╣реИред
  • рд╕рдВрддреБрд▓рди (Symmetry) тАУ XX рдФрд░ YY рдХреЗ рдмреАрдЪ рд╕рд╣рд╕рдВрдмрдВрдз рд╕рдорд╛рди рд╣реЛрддрд╛ рд╣реИ, рдЪрд╛рд╣реЗ рдЙрд╕реЗ XX рд╕реЗ YY рдХреА рдУрд░ рдпрд╛ YY рд╕реЗ XX рдХреА рдУрд░ рдорд╛рдкрд╛ рдЬрд╛рдПред

рдЧрдгрд┐рддреАрдп рдЕрднрд┐рд╡реНрдпрдХреНрддрд┐

рд╕рд╣рд╕рдВрдмрдВрдз рдХреЛ рдкрд┐рдпрд░реНрд╕рди рд╕рд╣рд╕рдВрдмрдВрдз рдЧреБрдгрд╛рдВрдХ (Pearson Correlation Coefficient, r) рджреНрд╡рд╛рд░рд╛ рдорд╛рдкрд╛ рдЬрд╛рддрд╛ рд╣реИ, рдЬрд┐рд╕рдХрд╛ рд╕реВрддреНрд░ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рд╣реИ:

r=nтИСXYтИТ(тИСX)(тИСY)[nтИСX2тИТ(тИСX)2][nтИСY2тИТ(тИСY)2]r = \frac{n \sum XY – (\sum X)(\sum Y)}{\sqrt{[n \sum X^2 – (\sum X)^2][n \sum Y^2 – (\sum Y)^2]}}

рдЬрд╣рд╛рдБ:

  • rr = рд╕рд╣рд╕рдВрдмрдВрдз рдЧреБрдгрд╛рдВрдХ
  • X,YX, Y = рджреЛ рдЪрд░
  • nn = рдХреБрд▓ рдбреЗрдЯрд╛ рдмрд┐рдВрджреБ рдХреА рд╕рдВрдЦреНрдпрд╛

рд╕рд╣рд╕рдВрдмрдВрдз рдХрд╛ рдорд╛рди -1 рдФрд░ +1 рдХреЗ рдмреАрдЪ рд╣реЛрддрд╛ рд╣реИ:

  • r=+1r = +1 тЖТ рдкреВрд░реНрдгрдд: рд╕рдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдз
  • r=тИТ1r = -1 тЖТ рдкреВрд░реНрдгрдд: рдирдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдз
  • r=0r = 0 тЖТ рдХреЛрдИ рд╕рд╣рд╕рдВрдмрдВрдз рдирд╣реАрдВ

2. рд╕рд╣рд╕рдВрдмрдВрдз рдХреЗ рдкреНрд░рдХрд╛рд░

рд╕рд╣рд╕рдВрдмрдВрдз рдХреЛ рджрд┐рд╢рд╛, рдЪрд░реЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛, рдФрд░ рдорд╛рдкрдиреЗ рдХреА рд╡рд┐рдзрд┐ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рд╡рд░реНрдЧреАрдХреГрдд рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИред

A. рд╕рдВрдмрдВрдз рдХреА рджрд┐рд╢рд╛ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рд╕рд╣рд╕рдВрдмрдВрдз

1. рд╕рдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдз (Positive Correlation)

  • рдЬрдм рдПрдХ рдЪрд░ рдмрдврд╝рддрд╛ рд╣реИ, рддреЛ рджреВрд╕рд░рд╛ рднреА рдмрдврд╝рддрд╛ рд╣реИ рдФрд░ рдЬрдм рдПрдХ рдШрдЯрддрд╛ рд╣реИ, рддреЛ рджреВрд╕рд░рд╛ рднреА рдШрдЯрддрд╛ рд╣реИред
  • рдЙрджрд╛рд╣рд░рдг: рд▓рдВрдмрд╛рдИ рдФрд░ рд╡рдЬрди тАУ рдЕрдзрд┐рдХ рд▓рдВрдмрд╛рдИ рд╡рд╛рд▓реЗ рд▓реЛрдЧ рдЖрдорддреМрд░ рдкрд░ рдЕрдзрд┐рдХ рд╡рдЬрди рд╡рд╛рд▓реЗ рд╣реЛрддреЗ рд╣реИрдВред
  • рдЧреНрд░рд╛рдлрд╝ рдкрд░ рдпрд╣ рдКрдкрд░ рдХреА рдУрд░ рдврд▓рд╛рди рдХреЗ рд░реВрдк рдореЗрдВ рджрд┐рдЦрддрд╛ рд╣реИред

2. рдирдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдз (Negative Correlation)

  • рдЬрдм рдПрдХ рдЪрд░ рдмрдврд╝рддрд╛ рд╣реИ, рддреЛ рджреВрд╕рд░рд╛ рдШрдЯрддрд╛ рд╣реИ рдФрд░ рдЬрдм рдПрдХ рдШрдЯрддрд╛ рд╣реИ, рддреЛ рджреВрд╕рд░рд╛ рдмрдврд╝рддрд╛ рд╣реИред
  • рдЙрджрд╛рд╣рд░рдг: рддрдирд╛рд╡ рдФрд░ рдиреАрдВрдж рдХрд╛ рд╕рдордп тАУ рдЕрдзрд┐рдХ рддрдирд╛рд╡ рд╕реЗ рдХрдо рдиреАрдВрдж рдЖрддреА рд╣реИред
  • рдЧреНрд░рд╛рдлрд╝ рдкрд░ рдпрд╣ рдиреАрдЪреЗ рдХреА рдУрд░ рдврд▓рд╛рди рдХреЗ рд░реВрдк рдореЗрдВ рджрд┐рдЦрддрд╛ рд╣реИред

3. рд╢реВрдиреНрдп рд╕рд╣рд╕рдВрдмрдВрдз (Zero Correlation)

  • рдЬрдм рджреЛрдиреЛрдВ рдЪрд░реЛрдВ рдХреЗ рдмреАрдЪ рдХреЛрдИ рд╕рдВрдмрдВрдз рдирд╣реАрдВ рд╣реЛрддрд╛ред
  • рдЙрджрд╛рд╣рд░рдг: рдЬреВрддреЗ рдХрд╛ рдЖрдХрд╛рд░ рдФрд░ рдмреБрджреНрдзрд┐рдорддреНрддрд╛ тАУ рдЗрди рджреЛрдиреЛрдВ рдХреЗ рдмреАрдЪ рдХреЛрдИ рд╕рдВрдмрдВрдз рдирд╣реАрдВ рд╣реИред
  • рдЧреНрд░рд╛рдлрд╝ рдкрд░ рдбреЗрдЯрд╛ рдмрд┐рдВрджреБ рдмрд┐рдирд╛ рдХрд┐рд╕реА рдкреИрдЯрд░реНрди рдХреЗ рдмрд┐рдЦрд░реЗ рд╣реБрдП рджрд┐рдЦрддреЗ рд╣реИрдВред

B. рдЪрд░реЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рд╕рд╣рд╕рдВрдмрдВрдз

1. рд╕рд░рд▓ рд╕рд╣рд╕рдВрдмрдВрдз (Simple Correlation)

  • рдЬрдм рдХреЗрд╡рд▓ рджреЛ рдЪрд░ рд╢рд╛рдорд┐рд▓ рд╣реЛрддреЗ рд╣реИрдВред
  • рдЙрджрд╛рд╣рд░рдг: рддрд╛рдкрдорд╛рди рдФрд░ рдЖрдЗрд╕рдХреНрд░реАрдо рдХреА рдмрд┐рдХреНрд░реАред

2. рдмрд╣реБ-рд╕рд╣рд╕рдВрдмрдВрдз (Multiple Correlation)

  • рдЬрдм рддреАрди рдпрд╛ рдЕрдзрд┐рдХ рдЪрд░ рд╢рд╛рдорд┐рд▓ рд╣реЛрддреЗ рд╣реИрдВред
  • рдЙрджрд╛рд╣рд░рдг: рд╡реЗрддрди, рдХрд╛рд░реНрдп-рдЕрдиреБрднрд╡, рдФрд░ рд╢рд┐рдХреНрд╖рд╛ рд╕реНрддрд░ рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдзред

3. рдЖрдВрд╢рд┐рдХ рд╕рд╣рд╕рдВрдмрдВрдз (Partial Correlation)

  • рдЬрдм рддреАрд╕рд░реЗ рдЪрд░ рдХреЗ рдкреНрд░рднрд╛рд╡ рдХреЛ рдирд┐рдпрдВрддреНрд░рд┐рдд рдХрд░рдиреЗ рдХреЗ рдмрд╛рдж рджреЛ рдЪрд░реЛрдВ рдХреЗ рдмреАрдЪ рд╕рд╣рд╕рдВрдмрдВрдз рдХреА рдЧрдгрдирд╛ рдХреА рдЬрд╛рддреА рд╣реИред
  • рдЙрджрд╛рд╣рд░рдг: рд╡реНрдпрд╛рдпрд╛рдо рдФрд░ рд╡рдЬрди рдШрдЯрд╛рдиреЗ рдХрд╛ рд╕рдВрдмрдВрдз, рд▓реЗрдХрд┐рди рдЖрд╣рд╛рд░ рдХреЗ рдкреНрд░рднрд╛рд╡ рдХреЛ рд╣рдЯрд╛рдХрд░ред

C. рдорд╛рдкрди рд╡рд┐рдзрд┐ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рд╕рд╣рд╕рдВрдмрдВрдз

1. рдкрд┐рдпрд░реНрд╕рди рд╕рд╣рд╕рдВрдмрдВрдз (PearsonтАЩs Correlation Coefficient, r)

  • рдЬрдм рджреЛрдиреЛрдВ рдЪрд░ рд╕рддрдд (Continuous) рдФрд░ рд░реИрдЦрд┐рдХ (Linear) рд╣реЛрддреЗ рд╣реИрдВред

2. рд╕реНрдкреАрдпрд░рдореИрди рд░реИрдВрдХ рд╕рд╣рд╕рдВрдмрдВрдз (SpearmanтАЩs Rank Correlation, rтВЫ)

  • рдЬрдм рдбреЗрдЯрд╛ рдХреНрд░рдордмрджреНрдз (Ranked) рд╣реЛред
  • рдЙрджрд╛рд╣рд░рдг: рдЫрд╛рддреНрд░реЛрдВ рдХреЗ рдкрд░реАрдХреНрд╖рд╛ рдЕрдВрдХ рдФрд░ рдЦреЗрд▓ рдкреНрд░рджрд░реНрд╢рди рд░реИрдВрдХред
  • рд╕реВрддреНрд░:

rs=1тИТ6тИСd2n(n2тИТ1)r_s = 1 – \frac{6 \sum d^2}{n(n^2 – 1)}

3. рдХреЗрдВрдбрд▓ рдХрд╛ рдЯрд╛рдЙ (KendallтАЩs Tau Correlation)

  • рдЫреЛрдЯреЗ рдбреЗрдЯрд╛ рд╕реЗрдЯреНрд╕ рдХреЗ рд▓рд┐рдП рдЕрдзрд┐рдХ рд╕рдЯреАрдХ рд╡рд┐рдзрд┐ред
  • рдЬрдм рдбреЗрдЯрд╛ рдХреНрд░рдордмрджреНрдз (Ordinal) рд╣реЛред

4. рдкреЙрдЗрдВрдЯ-рдмрд┐рд╕реЗрд░рд┐рдпрд▓ рд╕рд╣рд╕рдВрдмрдВрдз (Point-Biserial Correlation)

  • рдЬрдм рдПрдХ рдЪрд░ рд╕рддрдд рдФрд░ рджреВрд╕рд░рд╛ рджреНрд╡рд┐рдЪрд░ (Binary: Yes/No, 0/1) рд╣реЛред
  • рдЙрджрд╛рд╣рд░рдг: рд▓рд┐рдВрдЧ (рдкреБрд░реБрд╖/рдорд╣рд┐рд▓рд╛) рдФрд░ рдкрд░реАрдХреНрд╖рд╛ рдЕрдВрдХреЛрдВ рдХрд╛ рд╕рдВрдмрдВрдзред

5. рдлрд╛рдИ рдЧреБрдгрд╛рдВрдХ (Phi Coefficient, ╧Ж)

  • рдЬрдм рджреЛрдиреЛрдВ рдЪрд░ рджреНрд╡рд┐рдЪрд░ (Binary) рд╣реЛрдВред
  • рдЙрджрд╛рд╣рд░рдг: рдзреВрдореНрд░рдкрд╛рди (рд╣рд╛рдБ/рдирд╣реАрдВ) рдФрд░ рдлреЗрдлрдбрд╝реЛрдВ рдХреЗ рдХреИрдВрд╕рд░ (рд╣рд╛рдБ/рдирд╣реАрдВ) рдХрд╛ рд╕рдВрдмрдВрдзред

3. рд╡рд╛рд╕реНрддрд╡рд┐рдХ рдЬреАрд╡рди рдореЗрдВ рд╕рд╣рд╕рдВрдмрдВрдз рдХреЗ рдЙрджрд╛рд╣рд░рдг

1. рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди рдореЗрдВ

  • рдЖрдИрдХреНрдпреВ рдФрд░ рд╢реИрдХреНрд╖рдгрд┐рдХ рдкреНрд░рджрд░реНрд╢рди тЖТ рд╕рдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдзред
  • рддрдирд╛рд╡ рдФрд░ рдорд╛рдирд╕рд┐рдХ рд╕реНрд╡рд╛рд╕реНрдереНрдп тЖТ рдирдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдзред

2. рд╡реНрдпрд╡рд╕рд╛рдп рдФрд░ рдЕрд░реНрдерд╢рд╛рд╕реНрддреНрд░ рдореЗрдВ

  • рд╡рд┐рдЬреНрдЮрд╛рдкрди рдФрд░ рдмрд┐рдХреНрд░реА тЖТ рд╕рдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдзред
  • рдореБрджреНрд░рд╛рд╕реНрдлреАрддрд┐ рдФрд░ рдХреНрд░рдп рд╢рдХреНрддрд┐ тЖТ рдирдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдзред

3. рдЪрд┐рдХрд┐рддреНрд╕рд╛ рдФрд░ рд╕реНрд╡рд╛рд╕реНрдереНрдп рдореЗрдВ

  • рдзреВрдореНрд░рдкрд╛рди рдФрд░ рдлреЗрдлрдбрд╝реЛрдВ рдХреЗ рдХреИрдВрд╕рд░ рдХрд╛ рдЦрддрд░рд╛ тЖТ рд╕рдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдзред
  • рд╡реНрдпрд╛рдпрд╛рдо рдФрд░ рдХреЛрд▓реЗрд╕реНрдЯреНрд░реЙрд▓ рд╕реНрддрд░ тЖТ рдирдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдзред

4. рд╢рд┐рдХреНрд╖рд╛ рдореЗрдВ

  • рдЕрдзреНрдпрдпрди рдХрд╛ рд╕рдордп рдФрд░ рдкрд░реАрдХреНрд╖рд╛ рдЕрдВрдХ тЖТ рд╕рдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдзред
  • рдЕрдиреБрдкрд╕реНрдерд┐рддрд┐ рдФрд░ рдЕрдХрд╛рджрдорд┐рдХ рдкреНрд░рджрд░реНрд╢рди тЖТ рдирдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдзред

4. рд╕рд╣рд╕рдВрдмрдВрдз рдХреА рд╕реАрдорд╛рдПрдБ

  1. рд╕рд╣рд╕рдВрдмрдВрдз рдХрд╛рд░рдгрддрд╛ (Causation) рдХреЛ рд╕рд┐рджреНрдз рдирд╣реАрдВ рдХрд░рддрд╛ред
  2. рдЧреИрд░-рд░реИрдЦрд┐рдХ рд╕рдВрдмрдВрдзреЛрдВ рдХреЛ рдкрд╣рдЪрд╛рди рдирд╣реАрдВ рд╕рдХрддрд╛ред
  3. рдЕрддреНрдпрдзрд┐рдХ рдореВрд▓реНрдпреЛрдВ (Outliers) рд╕реЗ рдкреНрд░рднрд╛рд╡рд┐рдд рд╣реЛрддрд╛ рд╣реИред
  4. рдЧреБрдкреНрдд рдЪрд░реЛрдВ рдХрд╛ рдкреНрд░рднрд╛рд╡ рдЕрдирджреЗрдЦрд╛ рдХрд░рддрд╛ рд╣реИред

рдирд┐рд╖реНрдХрд░реНрд╖

рд╕рд╣рд╕рдВрдмрдВрдз рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдореЗрдВ рдПрдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдЯреВрд▓ рд╣реИ, рдЬреЛ рдбреЗрдЯрд╛ рдореЗрдВ рдкреИрдЯрд░реНрди рдФрд░ рд░реБрдЭрд╛рди рдХреА рдкрд╣рдЪрд╛рди рдХрд░рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддрд╛ рд╣реИред рд╡рд┐рднрд┐рдиреНрди рдкреНрд░рдХрд╛рд░ рдХреЗ рд╕рд╣рд╕рдВрдмрдВрдз рдЕрд▓рдЧ-рдЕрд▓рдЧ рдкрд░рд┐рд╕реНрдерд┐рддрд┐рдпреЛрдВ рдореЗрдВ рдЙрдкрдпреЛрдЧ рдХрд┐рдП рдЬрд╛рддреЗ рд╣реИрдВред рд╣рд╛рд▓рд╛рдБрдХрд┐, рдпрд╣ рд╕рдордЭрдирд╛ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╣реИ рдХрд┐ рд╕рд╣рд╕рдВрдмрдВрдз рдХреЗрд╡рд▓ рджреЛ рдЪрд░реЛрдВ рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдз рдХреЛ рджрд░реНрд╢рд╛рддрд╛ рд╣реИ, рдпрд╣ рдпрд╣ рд╕рд╛рдмрд┐рдд рдирд╣реАрдВ рдХрд░рддрд╛ рдХрд┐ рдПрдХ рдЪрд░ рджреВрд╕рд░реЗ рдХрд╛ рдХрд╛рд░рдг рд╣реИред

UNIT-3(3.1) Correlation: Concept, Types of correlation.

Introduction

Correlation is a fundamental concept in statistics that measures the relationship between two or more variables. It helps in understanding whether an increase or decrease in one variable is associated with an increase or decrease in another variable. Correlation is widely used in various fields such as psychology, economics, business, and medical research to identify patterns and relationships between data points.

For example, in psychology, correlation can help determine whether there is a relationship between study hours and exam scores or between stress levels and sleep duration. In business, it can show whether an increase in advertising expenditure leads to higher sales.

This essay will cover:

  1. The concept of correlation
  2. The types of correlation
  3. Examples of correlation in real-life scenarios

1. Concept of Correlation

Definition

Correlation refers to the statistical relationship between two variables, indicating how one variable changes in response to another. It does not establish causation (cause-and-effect relationship), but it helps identify patterns and trends in data.

Properties of Correlation

  • Direction: Correlation can be positive, negative, or zero (no correlation).
  • Strength: The correlation coefficient determines the strength of the relationship between variables.
  • Symmetry: Correlation between variable X and variable Y is the same as between Y and X.

Mathematical Representation

Correlation is usually measured using the Pearson Correlation Coefficient (r), which is calculated as:

r=nтИСXYтИТ(тИСX)(тИСY)[nтИСX2тИТ(тИСX)2][nтИСY2тИТ(тИСY)2]r = \frac{n \sum XY – (\sum X)(\sum Y)}{\sqrt{[n \sum X^2 – (\sum X)^2][n \sum Y^2 – (\sum Y)^2]}}

where:

  • rr = correlation coefficient
  • X,YX, Y = variables
  • nn = number of data points

The value of rr always lies between -1 and +1.


2. Types of Correlation

Correlation can be classified based on direction, number of variables, and method of measurement.

A. Based on Direction of Relationship

1. Positive Correlation

  • If one variable increases, the other also increases, and vice versa.
  • Example: Height and weight тАУ Taller people tend to weigh more.
  • Graphically, this is represented by an upward-sloping trend.

2. Negative Correlation

  • If one variable increases, the other decreases, and vice versa.
  • Example: Stress and sleep duration тАУ More stress often leads to less sleep.
  • Represented by a downward-sloping trend.

3. Zero (No) Correlation

  • There is no relationship between the two variables.
  • Example: Shoe size and intelligence тАУ No connection exists between them.
  • Graphically, the points appear scattered without a clear pattern.

B. Based on Number of Variables

1. Simple Correlation

  • Involves only two variables.
  • Example: The relationship between temperature and ice cream sales.

2. Multiple Correlation

  • Involves three or more variables.
  • Example: The correlation between salary, work experience, and education level.

3. Partial Correlation

  • Examines the relationship between two variables while controlling the effect of a third variable.
  • Example: The correlation between exercise and weight loss, while controlling for diet.

C. Based on Method of Measurement

1. PearsonтАЩs Correlation Coefficient (r)

  • Measures linear relationship between two continuous variables.
  • Values range from -1 to +1:
    • r = +1 тЖТ Perfect positive correlation
    • r = -1 тЖТ Perfect negative correlation
    • r = 0 тЖТ No correlation

2. SpearmanтАЩs Rank Correlation

  • Used when data is ordinal (ranked data) instead of continuous.
  • Example: Ranking students based on marks and ranking their performance in sports.
  • Formula:

rs=1тИТ6тИСd2n(n2тИТ1)r_s = 1 – \frac{6 \sum d^2}{n(n^2 – 1)}

where dd is the difference between ranks, and nn is the number of observations.

3. KendallтАЩs Tau Correlation

  • Similar to SpearmanтАЩs Rank Correlation, but more accurate for small datasets.
  • Used in cases where data is ordinal or non-parametric.

4. Point-Biserial Correlation

  • Measures the relationship between one continuous variable and one binary variable (0/1, Yes/No).
  • Example: Relationship between gender (Male/Female) and test scores.

5. Phi Coefficient (╧Ж)

  • Used when both variables are binary (dichotomous).
  • Example: Relationship between smoking (Yes/No) and lung disease (Yes/No).

3. Real-Life Applications of Correlation

1. Psychology

  • IQ and academic performance тЖТ Positive correlation.
  • Stress and mental health тЖТ Negative correlation.

2. Business and Economics

  • Advertising expenditure and sales тЖТ Positive correlation.
  • Inflation and purchasing power тЖТ Negative correlation.

3. Healthcare and Medicine

  • Smoking and lung cancer risk тЖТ Positive correlation.
  • Exercise and cholesterol levels тЖТ Negative correlation.

4. Education

  • Study time and grades тЖТ Positive correlation.
  • Absenteeism and academic performance тЖТ Negative correlation.

4. Limitations of Correlation

  1. Correlation does not imply causation
  1. A high correlation does not mean that one variable causes the other to change.
  2. Example: Ice cream sales and drowning deaths are correlated, but the real cause is hot weather.
  3. Non-linear relationships are not detected
  4. PearsonтАЩs correlation works only for linear relationships.
  5. Outliers affect correlation
  6. Extreme values can distort the correlation coefficient.
  7. Correlation does not account for hidden variables
  8. There may be a third factor influencing both variables.

Conclusion

Correlation is a crucial statistical tool used to measure relationships between variables. It helps in data analysis across multiple domains, including psychology, business, healthcare, and education. Understanding the types of correlation тАУ positive, negative, and zero тАУ along with various methods like PearsonтАЩs and SpearmanтАЩs correlation allows researchers to draw meaningful insights from data.

However, it is important to remember that correlation does not imply causation. A strong correlation between two variables does not mean that one variable directly influences the other. Therefore, correlation should be used carefully, considering other statistical methods to determine causal relationships.

By applying correlation analysis effectively, we can improve decision-making in various fields, from predicting market trends to understanding human behavior.

UNIT-3(3.2) Calculation of Correlation: Product moment and Rank difference method.

рд╕рд╣рд╕рдВрдмрдВрдз рдХреА рдЧрдгрдирд╛: рдЙрддреНрдкрд╛рдж-рдореЛрдореЗрдВрдЯ рд╡рд┐рдзрд┐ рдФрд░ рд░реИрдВрдХ-рдЕрдВрддрд░ рд╡рд┐рдзрд┐

рдкрд░рд┐рдЪрдп

рд╕рд╣рд╕рдВрдмрдВрдз (Correlation) рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдХреА рдПрдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╡рд┐рдзрд┐ рд╣реИ, рдЬреЛ рдпрд╣ рдорд╛рдкрддреА рд╣реИ рдХрд┐ рджреЛ рдЪрд░ (Variables) рдХреЗ рдмреАрдЪ рдХрд┐рддрдирд╛ рдФрд░ рдХрд┐рд╕ рдкреНрд░рдХрд╛рд░ рдХрд╛ рд╕рдВрдмрдВрдз рд╣реИред рдпрд╣ рд╣рдореЗрдВ рдпрд╣ рд╕рдордЭрдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддрд╛ рд╣реИ рдХрд┐ рдпрджрд┐ рдПрдХ рдЪрд░ рдмрджрд▓рддрд╛ рд╣реИ, рддреЛ рджреВрд╕рд░рд╛ рдЪрд░ рдЙрд╕ рдкрд░ рдХреНрдпрд╛ рдкреНрд░рднрд╛рд╡ рдбрд╛рд▓рддрд╛ рд╣реИред

рд╕рд╣рд╕рдВрдмрдВрдз рдХреА рдЧрдгрдирд╛ рдХреЗ рдХрдИ рддрд░реАрдХреЗ рд╣реИрдВ, рд▓реЗрдХрд┐рди рд╕рдмрд╕реЗ рдкреНрд░рдореБрдЦ рджреЛ рддрд░реАрдХреЗ рд╣реИрдВ:

  1. рдЙрддреНрдкрд╛рдж-рдореЛрдореЗрдВрдЯ рд╡рд┐рдзрд┐ (Product Moment Method) рдЬрд┐рд╕реЗ рдкрд┐рдпрд░реНрд╕рди рд╕рд╣рд╕рдВрдмрдВрдз рдЧреБрдгрд╛рдВрдХ (PearsonтАЩs Correlation Coefficient) рднреА рдХрд╣рд╛ рдЬрд╛рддрд╛ рд╣реИред
  2. рд░реИрдВрдХ-рдЕрдВрддрд░ рд╡рд┐рдзрд┐ (Rank Difference Method) рдЬрд┐рд╕реЗ рд╕реНрдкреАрдпрд░рдореИрди рд░реИрдВрдХ рд╕рд╣рд╕рдВрдмрдВрдз (SpearmanтАЩs Rank Correlation Coefficient) рднреА рдХрд╣рд╛ рдЬрд╛рддрд╛ рд╣реИред

рдЗрд╕ рд▓реЗрдЦ рдореЗрдВ рд╣рдо рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рд╡рд┐рд╖рдпреЛрдВ рдкрд░ рд╡рд┐рд╕реНрддрд╛рд░ рд╕реЗ рдЪрд░реНрдЪрд╛ рдХрд░реЗрдВрдЧреЗ:

  1. рд╕рд╣рд╕рдВрдмрдВрдз рдХреА рдЕрд╡рдзрд╛рд░рдгрд╛ рдФрд░ рдорд╣рддреНрд╡
  2. рдЙрддреНрдкрд╛рдж-рдореЛрдореЗрдВрдЯ рд╡рд┐рдзрд┐ (PearsonтАЩs Correlation Coefficient)
  3. рд░реИрдВрдХ-рдЕрдВрддрд░ рд╡рд┐рдзрд┐ (SpearmanтАЩs Rank Correlation Coefficient)
  4. рд╡рд╛рд╕реНрддрд╡рд┐рдХ рдЬреАрд╡рди рдореЗрдВ рд╕рд╣рд╕рдВрдмрдВрдз рдХреЗ рдЕрдиреБрдкреНрд░рдпреЛрдЧ
  5. рд╕рд╣рд╕рдВрдмрдВрдз рдХреА рд╕реАрдорд╛рдПрдБ

1. рд╕рд╣рд╕рдВрдмрдВрдз рдХреА рдЕрд╡рдзрд╛рд░рдгрд╛ рдФрд░ рдорд╣рддреНрд╡

рд╕рд╣рд╕рдВрдмрдВрдз рдХреА рдкрд░рд┐рднрд╛рд╖рд╛

рд╕рд╣рд╕рдВрдмрдВрдз рджреЛ рдЪрд░реЛрдВ рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдз рдХреЛ рдорд╛рдкрдиреЗ рдХрд╛ рдПрдХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рдЙрдкрд╛рдп рд╣реИред рдЗрд╕рдХрд╛ рдорд╛рди -1 рд╕реЗ +1 рдХреЗ рдмреАрдЪ рд╣реЛрддрд╛ рд╣реИ:

  • +1 тЖТ рдкреВрд░реНрдгрдд: рд╕рдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдз (рдпрджрд┐ рдПрдХ рдЪрд░ рдмрдврд╝рддрд╛ рд╣реИ, рддреЛ рджреВрд╕рд░рд╛ рднреА рдмрдврд╝рддрд╛ рд╣реИ)ред
  • -1 тЖТ рдкреВрд░реНрдгрдд: рдирдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдз (рдпрджрд┐ рдПрдХ рдЪрд░ рдмрдврд╝рддрд╛ рд╣реИ, рддреЛ рджреВрд╕рд░рд╛ рдШрдЯрддрд╛ рд╣реИ)ред
  • 0 тЖТ рдХреЛрдИ рд╕рд╣рд╕рдВрдмрдВрдз рдирд╣реАрдВ (рджреЛрдиреЛрдВ рдЪрд░реЛрдВ рдХреЗ рдмреАрдЪ рдХреЛрдИ рд╕рдВрдмрдВрдз рдирд╣реАрдВ)ред

рд╕рд╣рд╕рдВрдмрдВрдз рдХрд╛ рдорд╣рддреНрд╡

  • рдпрд╣ рдПрдХ рдЪрд░ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рджреВрд╕рд░реЗ рдЪрд░ рдХреА рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдХрд░рдиреЗ рдореЗрдВ рд╕рд╣рд╛рдпрдХ рд╣реЛрддрд╛ рд╣реИред
  • рдпрд╣ рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди, рд╡реНрдпрд╡рд╕рд╛рдп, рдЕрд░реНрдерд╢рд╛рд╕реНрддреНрд░ рдФрд░ рдЪрд┐рдХрд┐рддреНрд╕рд╛ рдЕрдиреБрд╕рдВрдзрд╛рди рдореЗрдВ рд╡реНрдпрд╛рдкрдХ рд░реВрдк рд╕реЗ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
  • рдпрд╣ рдбреЗрдЯрд╛ рдХреЗ рдкреИрдЯрд░реНрди рдХреЛ рд╕рдордЭрдиреЗ рдФрд░ рдмреЗрд╣рддрд░ рдирд┐рд░реНрдгрдп рд▓реЗрдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддрд╛ рд╣реИред

2. рдЙрддреНрдкрд╛рдж-рдореЛрдореЗрдВрдЯ рд╡рд┐рдзрд┐ (PearsonтАЩs Correlation Coefficient, r)

рдЕрд╡рдзрд╛рд░рдгрд╛

рдпрд╣ рд╡рд┐рдзрд┐ рджреЛ рд╕рддрдд (Continuous) рдЪрд░реЛрдВ рдХреЗ рдмреАрдЪ рд░реИрдЦрд┐рдХ рд╕рдВрдмрдВрдз (Linear Relationship) рдХреЛ рдорд╛рдкрдиреЗ рдХреЗ рд▓рд┐рдП рдкреНрд░рдпреЛрдЧ рдХреА рдЬрд╛рддреА рд╣реИред рдпрд╣ рд╡рд┐рдзрд┐ рдЙрди рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рд╕рдмрд╕реЗ рдЙрдкрдпреБрдХреНрдд рд╣реЛрддреА рд╣реИ рдЬреЛ рд╕рд╛рдорд╛рдиреНрдп рд╡рд┐рддрд░рдг (Normally Distributed) рдореЗрдВ рд╣реЛрддреЗ рд╣реИрдВред

рд╕рдореАрдХрд░рдг

рдкрд┐рдпрд░реНрд╕рди рд╕рд╣рд╕рдВрдмрдВрдз рдЧреБрдгрд╛рдВрдХ (rr) рдХреА рдЧрдгрдирд╛ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рд╕реВрддреНрд░ рд╕реЗ рдХреА рдЬрд╛рддреА рд╣реИ:

r=nтИСXYтИТ(тИСX)(тИСY)[nтИСX2тИТ(тИСX)2][nтИСY2тИТ(тИСY)2]r = \frac{n \sum XY – (\sum X)(\sum Y)}{\sqrt{[n \sum X^2 – (\sum X)^2][n \sum Y^2 – (\sum Y)^2]}}

рдЬрд╣рд╛рдБ:

  • XX рдФрд░ YY рджреЛ рдЪрд░ рд╣реИрдВред
  • nn рдбреЗрдЯрд╛ рдмрд┐рдВрджреБрдУрдВ рдХреА рдХреБрд▓ рд╕рдВрдЦреНрдпрд╛ рд╣реИред
  • тИСXY\sum XY рджреЛрдиреЛрдВ рдЪрд░реЛрдВ рдХреЗ рдЙрддреНрдкрд╛рдж рдХрд╛ рдпреЛрдЧ рд╣реИред
  • тИСX\sum X рдФрд░ тИСY\sum Y рдЪрд░реЛрдВ рдХреЗ рд╡реНрдпрдХреНрддрд┐рдЧрдд рдорд╛рдиреЛрдВ рдХрд╛ рдпреЛрдЧ рд╣реИред
  • тИСX2\sum X^2 рдФрд░ тИСY2\sum Y^2 рдЪрд░реЛрдВ рдХреЗ рд╡рд░реНрдЧреЛрдВ рдХрд╛ рдпреЛрдЧ рд╣реИред

рдЪрд░рдг-рджрд░-рдЪрд░рдг рдЧрдгрдирд╛ (рдЙрджрд╛рд╣рд░рдг)

рдорд╛рди рд▓реАрдЬрд┐рдП рдХрд┐ рд╣рдореЗрдВ рдЕрдзреНрдпрдпрди рдХреЗ рдШрдВрдЯреЗ (X) рдФрд░ рдкрд░реАрдХреНрд╖рд╛ рдХреЗ рдЕрдВрдХ (Y) рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдз рдЦреЛрдЬрдирд╛ рд╣реИред

рдЫрд╛рддреНрд░рдЕрдзреНрдпрдпрди рдШрдВрдЯреЗ (X)рдкрд░реАрдХреНрд╖рд╛ рдЕрдВрдХ (Y)X2X^2Y2Y^2XYXY
12404160080
235092500150
3565254225325
4670364900420
5890648100720

рдЕрдм рдЧрдгрдирд╛ рдХрд░реЗрдВ:

  • тИСX=24\sum X = 24, тИСY=315\sum Y = 315
  • тИСX2=138\sum X^2 = 138, тИСY2=21325\sum Y^2 = 21325
  • тИСXY=1695\sum XY = 1695

r=(5)(1695)тИТ(24)(315)[5(138)тИТ(24)2][5(21325)тИТ(315)2]r = \frac{(5)(1695) – (24)(315)}{\sqrt{[5(138) – (24)^2][5(21325) – (315)^2]}} r=0.997r = 0.997

рдЪреВрдБрдХрд┐ rтЙИ1r \approx 1, рдпрд╣ рдмрд╣реБрдд рдордЬрдмреВрдд рд╕рдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдз рдХреЛ рджрд░реНрд╢рд╛рддрд╛ рд╣реИред


3. рд░реИрдВрдХ-рдЕрдВрддрд░ рд╡рд┐рдзрд┐ (SpearmanтАЩs Rank Correlation Coefficient, rтВЫ)

рдЕрд╡рдзрд╛рд░рдгрд╛

рдЬрдм рдбреЗрдЯрд╛ рдХреНрд░рдордмрджреНрдз (Ranked) рд╣реЛрддрд╛ рд╣реИ, рддреЛ рд╣рдо рд╕реНрдкреАрдпрд░рдореИрди рд░реИрдВрдХ рд╕рд╣рд╕рдВрдмрдВрдз рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╣реИрдВред рдпрд╣ рдЧреИрд░-рд░реИрдЦрд┐рдХ (Non-Linear) рд╕рдВрдмрдВрдзреЛрдВ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреБрдХреНрдд рд╣реЛрддрд╛ рд╣реИред

рд╕рдореАрдХрд░рдг

rs=1тИТ6тИСd2n(n2тИТ1)r_s = 1 – \frac{6 \sum d^2}{n(n^2 – 1)}

рдЬрд╣рд╛рдБ:

  • dd = рджреЛ рдЪрд░реЛрдВ рдХреА рд░реИрдВрдХ рдХреЗ рдмреАрдЪ рдХрд╛ рдЕрдВрддрд░
  • nn = рдХреБрд▓ рдбреЗрдЯрд╛ рдмрд┐рдВрджреБ рдХреА рд╕рдВрдЦреНрдпрд╛

рдЪрд░рдг-рджрд░-рдЪрд░рдг рдЧрдгрдирд╛ (рдЙрджрд╛рд╣рд░рдг)

рдЫрд╛рддреНрд░рдЕрдзреНрдпрдпрди рдШрдВрдЯреЗ (X)рд░реИрдВрдХ (X)рдкрд░реАрдХреНрд╖рд╛ рдЕрдВрдХ (Y)рд░реИрдВрдХ (Y)d=XтИТYd = X – Yd2d^2
12140100
23250200
35365300
46470400
58590500

rs=1тИТ6(0)5(52тИТ1)r_s = 1 – \frac{6(0)}{5(5^2 – 1)} rs=1r_s = 1

рдЪреВрдБрдХрд┐ rs=1r_s = 1, рдпрд╣ рдкреВрд░реНрдг рд╕рдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдз рдХреЛ рджрд░реНрд╢рд╛рддрд╛ рд╣реИред


4. рд╡рд╛рд╕реНрддрд╡рд┐рдХ рдЬреАрд╡рди рдореЗрдВ рд╕рд╣рд╕рдВрдмрдВрдз рдХреЗ рдЕрдиреБрдкреНрд░рдпреЛрдЧ

  1. рд╢рд┐рдХреНрд╖рд╛ тАУ рдЕрдзреНрдпрдпрди рдХреЗ рдШрдВрдЯреЗ рдФрд░ рдкрд░реАрдХреНрд╖рд╛ рдХреЗ рдЕрдВрдХреЛрдВ рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдзред
  2. рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди тАУ рддрдирд╛рд╡ рд╕реНрддрд░ рдФрд░ рдорд╛рдирд╕рд┐рдХ рд╕реНрд╡рд╛рд╕реНрдереНрдп рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдзред
  3. рд╡реНрдпрд╡рд╕рд╛рдп тАУ рд╡рд┐рдЬреНрдЮрд╛рдкрди рд╡реНрдпрдп рдФрд░ рдмрд┐рдХреНрд░реА рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдзред
  4. рдЪрд┐рдХрд┐рддреНрд╕рд╛ тАУ рд╡реНрдпрд╛рдпрд╛рдо рдФрд░ рдХреЛрд▓реЗрд╕реНрдЯреНрд░реЙрд▓ рд╕реНрддрд░ рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдзред

5. рд╕рд╣рд╕рдВрдмрдВрдз рдХреА рд╕реАрдорд╛рдПрдБ

  • рд╕рдВрдмрдВрдз рдХрд╛ рдХрд╛рд░рдг рдирд╣реАрдВ рдмрддрд╛рддрд╛ (Correlation does not imply causation)ред
  • рд╡рд┐рд╖рдо рдорд╛рди (Outliers) рд╕реЗ рдкреНрд░рднрд╛рд╡рд┐рдд рд╣реЛ рд╕рдХрддрд╛ рд╣реИред
  • рдХреЗрд╡рд▓ рд░реИрдЦрд┐рдХ рд╕рдВрдмрдВрдзреЛрдВ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреБрдХреНрддред

рдирд┐рд╖реНрдХрд░реНрд╖

рдкрд┐рдпрд░реНрд╕рди рд╡рд┐рдзрд┐ рд╕рддрдд рдФрд░ рд░реИрдЦрд┐рдХ рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреБрдХреНрдд рд╣реИ, рдЬрдмрдХрд┐ рд╕реНрдкреАрдпрд░рдореИрди рд╡рд┐рдзрд┐ рдХреНрд░рдордмрджреНрдз рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рдЕрдзрд┐рдХ рдЙрдкрдпреБрдХреНрдд рд╣реЛрддреА рд╣реИред рджреЛрдиреЛрдВ рд╡рд┐рдзрд┐рдпрд╛рдБ рд╢реЛрдзрдХрд░реНрддрд╛рдУрдВ рдФрд░ рд╡рд┐рд╢реНрд▓реЗрд╖рдХреЛрдВ рдХреЛ рдбреЗрдЯрд╛ рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдзреЛрдВ рдХреА рд╕рдордЭ рдмрдирд╛рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддреА рд╣реИрдВред

UNIT-3(3.2) Calculation of Correlation: Product moment and Rank difference method.

Introduction

Correlation is a statistical technique used to measure the strength and direction of a relationship between two variables. It helps researchers and analysts understand how one variable changes in response to another. There are multiple ways to calculate correlation, but the Product Moment Method (PearsonтАЩs Correlation Coefficient) and the Rank Difference Method (SpearmanтАЩs Rank Correlation Coefficient) are the most commonly used.

This essay will cover:

  1. Concept of correlation and its significance
  2. Product Moment Method (PearsonтАЩs Correlation Coefficient)
  3. Rank Difference Method (SpearmanтАЩs Rank Correlation Coefficient)
  4. Real-life applications of correlation
  5. Limitations of correlation

1. Concept of Correlation and Its Significance

Definition

Correlation is a statistical measure that expresses the extent to which two variables are related to each other. It ranges from -1 to +1, where:

  • +1 indicates a perfect positive correlation (when one variable increases, the other also increases).
  • -1 indicates a perfect negative correlation (when one variable increases, the other decreases).
  • 0 indicates no correlation (no relationship between the variables).

Importance of Correlation in Research

  • Helps in predicting one variable based on another.
  • Used in psychology, business, economics, and medical research.
  • Helps in identifying patterns and making informed decisions.

2. Product Moment Method (PearsonтАЩs Correlation Coefficient, r)

Concept

The Product Moment Method, also known as PearsonтАЩs Correlation Coefficient, measures the linear relationship between two continuous variables. It is suitable for normally distributed data with a linear relationship.

Formula

The Pearson correlation coefficient (rr) is calculated using the formula:

r=nтИСXYтИТ(тИСX)(тИСY)[nтИСX2тИТ(тИСX)2][nтИСY2тИТ(тИСY)2]r = \frac{n \sum XY – (\sum X)(\sum Y)}{\sqrt{[n \sum X^2 – (\sum X)^2][n \sum Y^2 – (\sum Y)^2]}}

where:

  • XX and YY are the two variables.
  • nn is the number of data points.
  • тИСXY\sum XY is the sum of the product of paired scores.
  • тИСX\sum X and тИСY\sum Y are the sum of individual values of X and Y.
  • тИСX2\sum X^2 and тИСY2\sum Y^2 are the sum of squared values of X and Y.

Step-by-Step Calculation

Example:

Suppose we have the following data on studentsтАЩ study hours (X) and exam scores (Y).

StudentStudy Hours (X)Exam Score (Y)X2X^2Y2Y^2XYXY
12404160080
235092500150
3565254225325
4670364900420
5890648100720

Now, calculate:

  • тИСX=2+3+5+6+8=24\sum X = 2 + 3 + 5 + 6 + 8 = 24
  • тИСY=40+50+65+70+90=315\sum Y = 40 + 50 + 65 + 70 + 90 = 315
  • тИСX2=4+9+25+36+64=138\sum X^2 = 4 + 9 + 25 + 36 + 64 = 138
  • тИСY2=1600+2500+4225+4900+8100=21325\sum Y^2 = 1600 + 2500 + 4225 + 4900 + 8100 = 21325
  • тИСXY=80+150+325+420+720=1695\sum XY = 80 + 150 + 325 + 420 + 720 = 1695

Using the formula:

r=(5)(1695)тИТ(24)(315)[5(138)тИТ(24)2][5(21325)тИТ(315)2]r = \frac{(5)(1695) – (24)(315)}{\sqrt{[5(138) – (24)^2][5(21325) – (315)^2]}} r=8475тИТ7560[690тИТ576][106625тИТ99225]r = \frac{8475 – 7560}{\sqrt{[690 – 576][106625 – 99225]}} r=915114├Ч7400r = \frac{915}{\sqrt{114 \times 7400}} r=915841800r = \frac{915}{\sqrt{841800}} r=915917.6=0.997r = \frac{915}{917.6} = 0.997

Since rтЙИ1r \approx 1, this indicates a very strong positive correlation between study hours and exam scores.


3. Rank Difference Method (SpearmanтАЩs Rank Correlation Coefficient, rтВЫ)

Concept

The Rank Difference Method, also known as SpearmanтАЩs Rank Correlation Coefficient, is used when data is ordinal (ranked data) rather than continuous. It measures monotonic relationships (where variables move in the same or opposite direction but not necessarily at a constant rate).

Formula

The Spearman rank correlation coefficient (rsr_s) is calculated using:

rs=1тИТ6тИСd2n(n2тИТ1)r_s = 1 – \frac{6 \sum d^2}{n(n^2 – 1)}

where:

  • dd is the difference between the ranks of X and Y.
  • nn is the number of observations.

Step-by-Step Calculation

Example:

Rank the study hours and exam scores from the previous example.

StudentStudy Hours (X)Rank (X)Exam Score (Y)Rank (Y)d=XтИТYd = X – Yd2d^2
12140100
23250200
35365300
46470400
58590500

Now,

  • тИСd2=0\sum d^2 = 0
  • n=5n = 5

Using the formula:

rs=1тИТ6(0)5(52тИТ1)r_s = 1 – \frac{6(0)}{5(5^2 – 1)} rs=1тИТ0=1r_s = 1 – 0 = 1

Since rs=1r_s = 1, it indicates a perfect positive correlation between study hours and exam scores.


4. Real-Life Applications of Correlation

  1. Education тАУ Correlation between attendance and academic performance.
  2. Psychology тАУ Relationship between stress levels and mental health.
  3. Business тАУ Impact of advertising expenditure on sales.
  4. Health тАУ Relationship between exercise and cholesterol levels.

5. Limitations of Correlation

  • Does not imply causation тАУ A strong correlation does not mean one variable causes the other.
  • Sensitive to outliers тАУ Extreme values can distort correlation values.
  • Limited to linear relationships тАУ PearsonтАЩs correlation does not work well for non-linear relationships.

Conclusion

The Product Moment Method (PearsonтАЩs Correlation Coefficient) is ideal for continuous and linear data, while the Rank Difference Method (SpearmanтАЩs Rank Correlation Coefficient) is better suited for ranked or ordinal data. Both methods provide valuable insights into relationships between variables, helping researchers and analysts make data-driven decisions.

UNIT-3(3.3) Calculation of t-test: Independent group and Correlated group.

t-рдкрд░рд┐рдХреНрд╖рдг (t-test) рдХреА рдЧрдгрдирд╛: рд╕реНрд╡рддрдВрддреНрд░ рд╕рдореВрд╣ рдФрд░ рд╕рд╣рд╕рдВрдмрджреНрдз рд╕рдореВрд╣

рдкрд░рд┐рдЪрдп

t-рдкрд░рд┐рдХреНрд╖рдг (t-test) рдПрдХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рдкрд░реАрдХреНрд╖рдг рд╣реИ рдЬрд┐рд╕рдХрд╛ рдЙрдкрдпреЛрдЧ рджреЛ рд╕рдореВрд╣реЛрдВ рдХреЗ рдФрд╕рдд (Mean) рдХреА рддреБрд▓рдирд╛ рдХрд░рдиреЗ рдФрд░ рдпрд╣ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдХрд┐ рдЙрдирдХреЗ рдмреАрдЪ рдХрд╛ рдЕрдВрддрд░ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╣реИ рдпрд╛ рдХреЗрд╡рд▓ рд╕рдВрдпреЛрдЧ рдорд╛рддреНрд░ред рдпрд╣ рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди, рд╢рд┐рдХреНрд╖рд╛, рдЪрд┐рдХрд┐рддреНрд╕рд╛ рдФрд░ рд╡реНрдпрд╡рд╕рд╛рдп рдЬреИрд╕реЗ рдХреНрд╖реЗрддреНрд░реЛрдВ рдореЗрдВ рд╡реНрдпрд╛рдкрдХ рд░реВрдк рд╕реЗ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред

t-рдкрд░рд┐рдХреНрд╖рдг рдХреЗ рджреЛ рдореБрдЦреНрдп рдкреНрд░рдХрд╛рд░ рд╣реЛрддреЗ рд╣реИрдВ:

  1. рд╕реНрд╡рддрдВрддреНрд░ рдирдореВрдирд╛ t-рдкрд░рд┐рдХреНрд╖рдг (Independent Samples t-test) – рдЬрдм рджреЛ рдЕрд▓рдЧ-рдЕрд▓рдЧ рд╕рдореВрд╣реЛрдВ рдХреА рддреБрд▓рдирд╛ рдХреА рдЬрд╛рддреА рд╣реИред
  2. рдпреБрдЧреНрдорд┐рдд (рд╕рд╣рд╕рдВрдмрджреНрдз) рдирдореВрдирд╛ t-рдкрд░рд┐рдХреНрд╖рдг (Paired Samples t-test) – рдЬрдм рдПрдХ рд╣реА рд╕рдореВрд╣ рдХрд╛ рджреЛ рд╕реНрдерд┐рддрд┐рдпреЛрдВ рдореЗрдВ рдпрд╛ рджреЛ рд╕рдордп рдмрд┐рдВрджреБрдУрдВ рдкрд░ рдкрд░реАрдХреНрд╖рдг рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред

рдЗрд╕ рд▓реЗрдЦ рдореЗрдВ, рд╣рдо рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдмрд┐рдВрджреБрдУрдВ рдкрд░ рдЪрд░реНрдЪрд╛ рдХрд░реЗрдВрдЧреЗ:

  • t-рдкрд░рд┐рдХреНрд╖рдг рдХреА рдЕрд╡рдзрд╛рд░рдгрд╛ рдФрд░ рдЗрд╕рдХрд╛ рдорд╣рддреНрд╡
  • рд╕реНрд╡рддрдВрддреНрд░ рдирдореВрдирд╛ t-рдкрд░рд┐рдХреНрд╖рдг тАУ рд╕реВрддреНрд░, рдЧрдгрдирд╛ рдФрд░ рдЙрджрд╛рд╣рд░рдг
  • рдпреБрдЧреНрдорд┐рдд (рд╕рд╣рд╕рдВрдмрджреНрдз) рдирдореВрдирд╛ t-рдкрд░рд┐рдХреНрд╖рдг тАУ рд╕реВрддреНрд░, рдЧрдгрдирд╛ рдФрд░ рдЙрджрд╛рд╣рд░рдг
  • t-рдкрд░рд┐рдХреНрд╖рдг рдХреЗ рдкрд░рд┐рдгрд╛рдореЛрдВ рдХреА рд╡реНрдпрд╛рдЦреНрдпрд╛
  • t-рдкрд░рд┐рдХреНрд╖рдг рдХреА рд╕реАрдорд╛рдПрдБ рдФрд░ рдзрд╛рд░рдгрд╛рдПрдБ

1. t-рдкрд░рд┐рдХреНрд╖рдг рдХреА рдЕрд╡рдзрд╛рд░рдгрд╛ рдФрд░ рдорд╣рддреНрд╡

t-рдкрд░рд┐рдХреНрд╖рдг рдХреНрдпрд╛ рд╣реИ?

t-рдкрд░рд┐рдХреНрд╖рдг рджреЛ рд╕рдореВрд╣реЛрдВ рдХреЗ рдмреАрдЪ рдЕрдВрддрд░ рдХреЛ рдорд╛рдкрдиреЗ рдХрд╛ рдПрдХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рддрд░реАрдХрд╛ рд╣реИред рдпрд╣ t-рд╡рд┐рддрд░рдг (t-distribution) рдкрд░ рдЖрдзрд╛рд░рд┐рдд рд╣реЛрддрд╛ рд╣реИ рдФрд░ рд╡рд┐рд╢реЗрд╖ рд░реВрдк рд╕реЗ рдЫреЛрдЯреЗ рдирдореВрдиреЛрдВ (n < 30) рдХреЗ рд▓рд┐рдП рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред

t-рдкрд░рд┐рдХреНрд╖рдг рдХрд╛ рдорд╣рддреНрд╡

  • рдпрд╣ рдпрд╣ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХрд░рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддрд╛ рд╣реИ рдХрд┐ рджреЛ рд╕рдореВрд╣реЛрдВ рдХреЗ рдмреАрдЪ рдХрд╛ рдЕрдВрддрд░ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рд╣реИ рдпрд╛ рдХреЗрд╡рд▓ рд╕рдВрдпреЛрдЧрд╡рд╢ рд╣реИред
  • рдЕрдиреБрд╕рдВрдзрд╛рди (Research) рдореЗрдВ рдирд┐рдпрдВрддреНрд░рдг (Control) рдФрд░ рдкреНрд░рдпреЛрдЧрд╛рддреНрдордХ (Experimental) рд╕рдореВрд╣ рдХреА рддреБрд▓рдирд╛ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
  • рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди, рд╡реНрдпрд╡рд╕рд╛рдп, рд╢рд┐рдХреНрд╖рд╛ рдФрд░ рдЪрд┐рдХрд┐рддреНрд╕рд╛ рдореЗрдВ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдирд┐рд░реНрдгрдп рд▓реЗрдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддрд╛ рд╣реИред

2. рд╕реНрд╡рддрдВрддреНрд░ рдирдореВрдирд╛ t-рдкрд░рд┐рдХреНрд╖рдг (Independent Samples t-test)

рдЕрд╡рдзрд╛рд░рдгрд╛

рдпрд╣ рдкрд░реАрдХреНрд╖рдг рддрдм рдкреНрд░рдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдЬрдм рд╣рдо рджреЛ рд╕реНрд╡рддрдВрддреНрд░ рд╕рдореВрд╣реЛрдВ рдХреА рддреБрд▓рдирд╛ рдХрд░рдирд╛ рдЪрд╛рд╣рддреЗ рд╣реИрдВред рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП,

  • рдкреБрд░реБрд╖ рдФрд░ рдорд╣рд┐рд▓рд╛ рдЫрд╛рддреНрд░реЛрдВ рдХреЗ рдкрд░реАрдХреНрд╖рд╛ рдЕрдВрдХреЛрдВ рдХреА рддреБрд▓рдирд╛ред
  • рдПрдХ рдирдИ рджрд╡рд╛ рдФрд░ рдПрдХ рдкреНрд▓реЗрд╕рд┐рдмреЛ (Placebo) рдХреЗ рдкреНрд░рднрд╛рд╡ рдХреА рддреБрд▓рдирд╛ред

рд╕реВрддреНрд░

рд╕реНрд╡рддрдВрддреНрд░ рдирдореВрдирд╛ t-рдкрд░рд┐рдХреНрд╖рдг рдХрд╛ рд╕реВрддреНрд░ рдЗрд╕ рдкреНрд░рдХрд╛рд░ рд╣реИ:

t=X1╦ЙтИТX2╦Йs12n1+s22n2t = \frac{\bar{X_1} – \bar{X_2}}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}

рдЬрд╣рд╛рдБ:

  • X1╦Й\bar{X_1} рдФрд░ X2╦Й\bar{X_2} = рд╕рдореВрд╣ 1 рдФрд░ рд╕рдореВрд╣ 2 рдХрд╛ рдФрд╕рдд
  • s12s_1^2 рдФрд░ s22s_2^2 = рд╕рдореВрд╣ 1 рдФрд░ рд╕рдореВрд╣ 2 рдХрд╛ рдкреНрд░рд╕рд░рдг (Variance)
  • n1n_1 рдФрд░ n2n_2 = рд╕рдореВрд╣ 1 рдФрд░ рд╕рдореВрд╣ 2 рдХрд╛ рдирдореВрдирд╛ рдЖрдХрд╛рд░

рд╕реНрд╡рддрдВрддреНрд░рддрд╛ рдХреА рдбрд┐рдЧреНрд░реА (Degrees of Freedom, df) рдХреА рдЧрдгрдирд╛:

df=n1+n2тИТ2df = n_1 + n_2 – 2

рдЧрдгрдирд╛ рдХрд╛ рдЙрджрд╛рд╣рд░рдг

рдЙрджрд╛рд╣рд░рдг:

рдПрдХ рд╢реЛрдзрдХрд░реНрддрд╛ рдпрд╣ рдЬрд╛рдВрдЪрдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рдкрд╛рд░рдВрдкрд░рд┐рдХ рдФрд░ рдЖрдзреБрдирд┐рдХ рд╢рд┐рдХреНрд╖рдг рд╡рд┐рдзрд┐рдпреЛрдВ рд╕реЗ рдЫрд╛рддреНрд░реЛрдВ рдХреЗ рдЕрдВрдХреЛрдВ рдореЗрдВ рдХреЛрдИ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдЕрдВрддрд░ рд╣реИред

рд╕рдореВрд╣рдкрд░реАрдХреНрд╖рд╛ рдЕрдВрдХрдФрд╕рдд (X╦Й\bar{X})рдкреНрд░рд╕рд░рдг (s2s^2)рдирдореВрдирд╛ рдЖрдХрд╛рд░ (n)
рдкрд╛рд░рдВрдкрд░рд┐рдХ50, 55, 52, 48, 5351.66.35
рдЖрдзреБрдирд┐рдХ60, 62, 58, 65, 6361.67.35

рдЕрдм рд╕реВрддреНрд░ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░реЗрдВ:

t=51.6тИТ61.66.35+7.35t = \frac{51.6 – 61.6}{\sqrt{\frac{6.3}{5} + \frac{7.3}{5}}} t=тИТ101.26+1.46t = \frac{-10}{\sqrt{1.26 + 1.46}} t=тИТ102.72t = \frac{-10}{\sqrt{2.72}} t=тИТ101.65=тИТ6.06t = \frac{-10}{1.65} = -6.06

рдкрд░рд┐рдгрд╛рдо рдХреА рд╡реНрдпрд╛рдЦреНрдпрд╛

рдпрджрд┐ t-рд╕реВрдЪреА (t-table) рдореЗрдВ df = 8 рдФрд░ ╬▒ = 0.05 рдХреЗ рд▓рд┐рдП рдирд╛рдЬреБрдХ рдорд╛рди (critical value) = 2.306 рд╣реИ, рдФрд░ рдЪреВрдВрдХрд┐ |t| = 6.06 > 2.306, рд╣рдо рд╢реВрдиреНрдп рдкрд░рд┐рдХрд▓реНрдкрдирд╛ (null hypothesis) рдХреЛ рдЕрд╕реНрд╡реАрдХрд╛рд░ рдХрд░рддреЗ рд╣реИрдВред рдЗрд╕рдХрд╛ рдЕрд░реНрде рд╣реИ рдХрд┐ рдЖрдзреБрдирд┐рдХ рд╢рд┐рдХреНрд╖рдг рд╡рд┐рдзрд┐ рдкрд╛рд░рдВрдкрд░рд┐рдХ рд╡рд┐рдзрд┐ рд╕реЗ рдЕрдзрд┐рдХ рдкреНрд░рднрд╛рд╡реА рд╣реИред


3. рдпреБрдЧреНрдорд┐рдд (рд╕рд╣рд╕рдВрдмрджреНрдз) рдирдореВрдирд╛ t-рдкрд░рд┐рдХреНрд╖рдг (Paired Samples t-test)

рдЕрд╡рдзрд╛рд░рдгрд╛

рдЬрдм рд╣рдо рдПрдХ рд╣реА рд╕рдореВрд╣ рдХрд╛ рджреЛ рдЕрд▓рдЧ-рдЕрд▓рдЧ рд╕рдордп рдмрд┐рдВрджреБрдУрдВ рдкрд░ рдкрд░реАрдХреНрд╖рдг рдХрд░рддреЗ рд╣реИрдВ, рддреЛ рд╣рдо рдпреБрдЧреНрдорд┐рдд t-рдкрд░рд┐рдХреНрд╖рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╣реИрдВред рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП:

  • рдЫрд╛рддреНрд░реЛрдВ рдХреЗ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рд╕реЗ рдкрд╣рд▓реЗ рдФрд░ рдмрд╛рдж рдХреЗ рдЕрдВрдХреЛрдВ рдХреА рддреБрд▓рдирд╛ред
  • рдХрд░реНрдордЪрд╛рд░рд┐рдпреЛрдВ рдХреЗ рддрдирд╛рд╡ рд╕реНрддрд░ рдХреЗ рдкрд╣рд▓реЗ рдФрд░ рдмрд╛рдж рдХреЗ рдорд╛рдкрди рдХреА рддреБрд▓рдирд╛ред

рд╕реВрддреНрд░

t=D╦ЙsD/nt = \frac{\bar{D}}{s_D / \sqrt{n}}

рдЬрд╣рд╛рдБ:

  • D╦Й\bar{D} = рдпреБрдЧреНрдорд┐рдд рдЕрдВрддрд░ рдХрд╛ рдФрд╕рдд
  • sDs_D = рдЕрдВрддрд░ рдХрд╛ рдорд╛рдирдХ рд╡рд┐рдЪрд▓рди
  • nn = рдпреБрдЧреНрдореЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛

рд╕реНрд╡рддрдВрддреНрд░рддрд╛ рдХреА рдбрд┐рдЧреНрд░реА:

df=nтИТ1df = n – 1

рдЧрдгрдирд╛ рдХрд╛ рдЙрджрд╛рд╣рд░рдг

рдЙрджрд╛рд╣рд░рдг:

рдПрдХ рдордиреЛрд╡реИрдЬреНрдЮрд╛рдирд┐рдХ 5 рдХрд░реНрдордЪрд╛рд░рд┐рдпреЛрдВ рдХреЗ рддрдирд╛рд╡ рд╕реНрддрд░ рдХреЛ рддрдирд╛рд╡ рдкреНрд░рдмрдВрдзрди рдХрд╛рд░реНрдпрдХреНрд░рдо рд╕реЗ рдкрд╣рд▓реЗ рдФрд░ рдмрд╛рдж рдореЗрдВ рдорд╛рдкрддрд╛ рд╣реИред

рдХрд░реНрдордЪрд╛рд░реАрдкрд╣рд▓реЗ (X)рдмрд╛рдж рдореЗрдВ (Y)рдЕрдВрддрд░ (D = X – Y)D2D^2
18072864
28578749
37874416
49083749
57670636

рдЧрдгрдирд╛ рдХрд░рдиреЗ рдкрд░, t = 9.41 рдЖрддрд╛ рд╣реИред рдпрджрд┐ t-рд╕реВрдЪреА рдХреЗ рдЕрдиреБрд╕рд╛рд░ рдирд╛рдЬреБрдХ рдорд╛рди 2.776 рд╣реИ, рддреЛ |t| > 2.776, рдЬрд┐рд╕рдХрд╛ рдЕрд░реНрде рд╣реИ рдХрд┐ рддрдирд╛рд╡ рдкреНрд░рдмрдВрдзрди рдХрд╛рд░реНрдпрдХреНрд░рдо рдкреНрд░рднрд╛рд╡реА рдерд╛ред


4. t-рдкрд░рд┐рдХреНрд╖рдг рдХреА рд╕реАрдорд╛рдПрдБ рдФрд░ рдзрд╛рд░рдгрд╛рдПрдБ

рдзрд╛рд░рдгрд╛рдПрдБ (Assumptions)

  • рдбреЗрдЯрд╛ рдХреЛ рд╕рд╛рдорд╛рдиреНрдп рд╡рд┐рддрд░рдг (Normal Distribution) рдореЗрдВ рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдПред
  • рд╕рдореВрд╣реЛрдВ рдХрд╛ рдкреНрд░рд╕рд░рдг рд╕рдорд╛рди рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдП (рд╕реНрд╡рддрдВрддреНрд░ t-рдкрд░рд┐рдХреНрд╖рдг рдХреЗ рд▓рд┐рдП)ред
  • рдбреЗрдЯрд╛ рд╕реНрд╡рддрдВрддреНрд░ рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдП (рд╕реНрд╡рддрдВрддреНрд░ t-рдкрд░рд┐рдХреНрд╖рдг рдХреЗ рд▓рд┐рдП)ред

рд╕реАрдорд╛рдПрдБ (Limitations)

  • рдЫреЛрдЯреЗ рдирдореВрдирд╛ рдЖрдХрд╛рд░ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреБрдХреНрддред
  • рд╡рд┐рд╖рдо рдореВрд▓реНрдпреЛрдВ (Outliers) рд╕реЗ рдкреНрд░рднрд╛рд╡рд┐рдд рд╣реЛ рд╕рдХрддрд╛ рд╣реИред
  • рдХреЗрд╡рд▓ рджреЛ рд╕рдореВрд╣реЛрдВ рдХреА рддреБрд▓рдирд╛ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреЛрдЧреАред

рдирд┐рд╖реНрдХрд░реНрд╖

  • рд╕реНрд╡рддрдВрддреНрд░ t-рдкрд░рд┐рдХреНрд╖рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рджреЛ рдЕрд▓рдЧ-рдЕрд▓рдЧ рд╕рдореВрд╣реЛрдВ рдХреЗ рдФрд╕рдд рдХреА рддреБрд▓рдирд╛ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
  • рдпреБрдЧреНрдорд┐рдд t-рдкрд░рд┐рдХреНрд╖рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдПрдХ рд╣реА рд╕рдореВрд╣ рдХреЗ рдЕрд▓рдЧ-рдЕрд▓рдЧ рд╕реНрдерд┐рддрд┐рдпреЛрдВ рдХреА рддреБрд▓рдирд╛ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
  • рдпрд╣ рд╢реЛрдзрдХрд░реНрддрд╛рдУрдВ рдФрд░ рд╡рд┐рд╢реНрд▓реЗрд╖рдХреЛрдВ рдХреЛ рд╕рдореВрд╣реЛрдВ рдХреЗ рдмреАрдЪ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдЕрдВрддрд░ рдХреЛ рд╕рдордЭрдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддрд╛ рд╣реИред

UNIT-3(3.3) Calculation of t-test: Independent group and Correlated group.

Introduction

The t-test is a statistical test used to compare the means of two groups and determine whether the differences between them are statistically significant. It is widely used in research fields such as psychology, education, medicine, and business.

There are two main types of t-tests:

  1. Independent Samples t-test (for comparing two separate groups)
  2. Paired (Correlated) Samples t-test (for comparing the same group at different times or conditions)

In this article, we will cover:

  • The concept of the t-test and its importance
  • Independent Samples t-test тАУ Formula, Calculation, and Example
  • Paired (Correlated) Samples t-test тАУ Formula, Calculation, and Example
  • Interpretation of t-test results
  • Assumptions and Limitations of t-tests

1. Concept of t-test and Its Importance

What is a t-test?

A t-test is a statistical test used to compare the means of two groups to determine if there is a significant difference between them. It is based on the concept of the t-distribution and is used when the sample size is small (n < 30).

Why is the t-test important?

  • It helps determine if differences between two groups are real or due to random chance.
  • Used in experimental research to compare control and experimental groups.
  • Helps in decision-making in psychology, business, education, and healthcare.

2. Independent Samples t-test

Concept

The Independent Samples t-test is used when we compare the means of two different (independent) groups. For example, comparing the exam scores of male and female students or the reaction times of two different groups of participants in an experiment.

Formula

The formula for an independent samples t-test is:

t=X1╦ЙтИТX2╦Йs12n1+s22n2t = \frac{\bar{X_1} – \bar{X_2}}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}

Where:

  • X1╦Й\bar{X_1} and X2╦Й\bar{X_2} = Mean of group 1 and group 2
  • s12s_1^2 and s22s_2^2 = Variance of group 1 and group 2
  • n1n_1 and n2n_2 = Sample size of group 1 and group 2

The degrees of freedom (df) are calculated as:

df=n1+n2тИТ2df = n_1 + n_2 – 2

Step-by-Step Calculation

Example:

A researcher wants to test whether there is a significant difference in the test scores of students taught using traditional methods versus modern teaching methods.

GroupTest ScoresMean (X╦Й\bar{X})Variance (s2s^2)Sample Size (n)
Traditional50, 55, 52, 48, 5351.66.35
Modern60, 62, 58, 65, 6361.67.35

Now, apply the formula:

t=51.6тИТ61.66.35+7.35t = \frac{51.6 – 61.6}{\sqrt{\frac{6.3}{5} + \frac{7.3}{5}}} t=тИТ101.26+1.46t = \frac{-10}{\sqrt{1.26 + 1.46}} t=тИТ102.72t = \frac{-10}{\sqrt{2.72}} t=тИТ101.65=тИТ6.06t = \frac{-10}{1.65} = -6.06

Interpretation

If the critical value from the t-table (for df=8df = 8 and ╬▒ = 0.05) is 2.306, since |t| = 6.06 is greater than 2.306, we reject the null hypothesis. This means that the modern teaching method leads to significantly higher scores.


3. Paired (Correlated) Samples t-test

Concept

The Paired (Correlated) Samples t-test is used when comparing two related samples or the same group at different times. For example:

  • Measuring students’ test scores before and after a training program.
  • Comparing participants’ heart rate before and after an exercise session.

Formula

The formula for a paired t-test is:

t=D╦ЙsD/nt = \frac{\bar{D}}{s_D / \sqrt{n}}

Where:

  • D╦Й\bar{D} = Mean of the differences between paired values
  • sDs_D = Standard deviation of the differences
  • nn = Number of pairs

The degrees of freedom (df) are calculated as:

df=nтИТ1df = n – 1

Step-by-Step Calculation

Example:

A psychologist measures the stress levels of 5 employees before and after a stress management program.

EmployeeBefore (X)After (Y)Difference (D = X – Y)D2D^2
18072864
28578749
37874416
49083749
57670636

Now, calculate:

  • тИСD=8+7+4+7+6=32\sum D = 8 + 7 + 4 + 7 + 6 = 32
  • тИСD2=64+49+16+49+36=214\sum D^2 = 64 + 49 + 16 + 49 + 36 = 214
  • D╦Й=тИСDn=325=6.4\bar{D} = \frac{\sum D}{n} = \frac{32}{5} = 6.4
  • Variance of D:

sD2=тИСD2тИТ(тИСD)2nnтИТ1s_D^2 = \frac{\sum D^2 – \frac{(\sum D)^2}{n}}{n-1} sD2=214тИТ(32)255тИТ1s_D^2 = \frac{214 – \frac{(32)^2}{5}}{5-1} sD2=214тИТ204.84=9.24=2.3s_D^2 = \frac{214 – 204.8}{4} = \frac{9.2}{4} = 2.3 sD=2.3=1.52s_D = \sqrt{2.3} = 1.52

Now, calculate t:

t=6.41.52/5t = \frac{6.4}{1.52 / \sqrt{5}} t=6.40.68=9.41t = \frac{6.4}{0.68} = 9.41

Interpretation

If the critical value from the t-table (for df=4df = 4 and ╬▒ = 0.05) is 2.776, since |t| = 9.41 is greater than 2.776, we reject the null hypothesis. This means the stress management program significantly reduced stress levels.


4. Interpretation of t-test Results

  1. If тИгtтИг|t| is greater than the critical value тЖТ Reject the null hypothesis тЖТ There is a significant difference.
  2. If тИгtтИг|t| is less than the critical value тЖТ Fail to reject the null hypothesis тЖТ No significant difference.

5. Assumptions and Limitations of t-test

Assumptions

  • Data should be normally distributed.
  • Groups should have equal variances (for independent t-test).
  • Observations should be independent (for independent t-test).

Limitations

  • Not suitable for non-normal data.
  • Sensitive to outliers.
  • Works best for small sample sizes.

Conclusion

The Independent Samples t-test is used to compare two separate groups, while the Paired Samples t-test is used for repeated measurements on the same individuals. Understanding these tests helps researchers make informed conclusions about differences in means between groups.

UnNoticed Digital College

An activist by nature and educator by profession, have been working in the fields of health and education since 2016. I firmly believe that education is the only way through which one can reach, each and every destination one wants to reach. As Samuel Beckett says, "Ever tried, Ever failed. No matter. Try again, Fail again. Try better, Fail better." The one who tries, fails; and the one who fails, wins.

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button