UGMJC-3PSYCHOLOGYSEM-3

UG-PSYCHOLOGY, SEMESTER-3, MJC-3, UNIT-4

рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг (Chi-Square Test): рдЕрд╡рдзрд╛рд░рдгрд╛, рдкреНрд░рдХрд╛рд░ рдФрд░ рдЕрдиреБрдкреНрд░рдпреЛрдЧ

рдкрд░рд┐рдЪрдп

рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг (Chi-Square Test) рдПрдХ рдЧреИрд░-рдкреИрд░рд╛рдореАрдЯреНрд░рд┐рдХ (Non-Parametric) рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рдкрд░реАрдХреНрд╖рдг рд╣реИ, рдЬрд┐рд╕рдХрд╛ рдЙрдкрдпреЛрдЧ рдпрд╣ рдЬрд╛рдВрдЪрдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рджреЛ рд╢реНрд░реЗрдгреАрдмрджреНрдз (Categorical) рдЪрд░ рдХреЗ рдмреАрдЪ рдХреЛрдИ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╕рдВрдмрдВрдз рд╣реИ рдпрд╛ рдирд╣реАрдВред рдпрд╣ рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди, рдЬреИрд╡ рд╡рд┐рдЬреНрдЮрд╛рди, рд╕рд╛рдорд╛рдЬрд┐рдХ рд╡рд┐рдЬреНрдЮрд╛рди, рдФрд░ рд╡реНрдпрд╡рд╕рд╛рдп рдЬреИрд╕реЗ рдХреНрд╖реЗрддреНрд░реЛрдВ рдореЗрдВ рдЖрд╡реГрддреНрддрд┐ рдбреЗрдЯрд╛ (Frequency Data) рдХреЗ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдФрд░ рдкрд░рд┐рдХрд▓реНрдкрдирд╛ рдкрд░реАрдХреНрд╖рдг (Hypothesis Testing) рдХреЗ рд▓рд┐рдП рд╡реНрдпрд╛рдкрдХ рд░реВрдк рд╕реЗ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред

рдпрд╣ рдкрд░реАрдХреНрд╖рдг рдореБрдЦреНрдп рд░реВрдк рд╕реЗ рдирд╛рдордорд╛рддреНрд░ (Nominal) рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ, рдЬрд╣рд╛рдБ рдЪрд░ рдХреЛ рд╡рд┐рднрд┐рдиреНрди рд╢реНрд░реЗрдгрд┐рдпреЛрдВ рдореЗрдВ рд╡рд░реНрдЧреАрдХреГрдд рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рд▓реЗрдХрд┐рди рдЙрдирдХрд╛ рдХреЛрдИ рдирд┐рд╢реНрдЪрд┐рдд рдХреНрд░рдо рдирд╣реАрдВ рд╣реЛрддрд╛ред

рдЗрд╕ рд▓реЗрдЦ рдореЗрдВ рд╣рдо рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдмрд┐рдВрджреБрдУрдВ рдХреЛ рдХрд╡рд░ рдХрд░реЗрдВрдЧреЗ:

  1. рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреА рдЕрд╡рдзрд╛рд░рдгрд╛
  2. рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреЗ рдкреНрд░рдХрд╛рд░
    • рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рд╕рдорд░реВрдкрддрд╛ рдкрд░реАрдХреНрд╖рдг (Goodness of Fit)
    • рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рд╕реНрд╡рддрдВрддреНрд░рддрд╛ рдкрд░реАрдХреНрд╖рдг (Test for Independence)
  3. рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреА рдкреВрд░реНрд╡-рдзрд╛рд░рдгрд╛рдПрдБ
  4. рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреА рдЧрдгрдирд╛ (рдЪрд░рдг-рджрд░-рдЪрд░рдг рдкреНрд░рдХреНрд░рд┐рдпрд╛)
  5. рдкрд░рд┐рдгрд╛рдореЛрдВ рдХреА рд╡реНрдпрд╛рдЦреНрдпрд╛
  6. рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреЗ рдЕрдиреБрдкреНрд░рдпреЛрдЧ
  7. рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреА рд╕реАрдорд╛рдПрдБ

1. рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреА рдЕрд╡рдзрд╛рд░рдгрд╛

рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреНрдпрд╛ рд╣реИ?

рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг (╧З┬▓ рдЯреЗрд╕реНрдЯ) рдХрд╛ рдЙрдкрдпреЛрдЧ рдпрд╣ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рджреЛ рд╢реНрд░реЗрдгреАрдмрджреНрдз рдЪрд░ рдХреЗ рдмреАрдЪ рдХреЛрдИ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рдЕрдВрддрд░ рд╣реИред

рдпрд╣ рдкреНрд░реЗрдХреНрд╖рд┐рдд (Observed) рдФрд░ рдЕрдкреЗрдХреНрд╖рд┐рдд (Expected) рдЖрд╡реГрддреНрддрд┐рдпреЛрдВ рдХреЗ рдмреАрдЪ рдХреЗ рдЕрдВрддрд░ рдХреЛ рдорд╛рдкрддрд╛ рд╣реИ рдФрд░ рдпрд╣ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХрд░рддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рдЕрдВрддрд░ рдорд╛рддреНрд░ рд╕рдВрдпреЛрдЧрд╡рд╢ рд╣реИ рдпрд╛ рджреЛ рдЪрд░ рдХреЗ рдмреАрдЪ рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рдХреЛрдИ рд╕рдВрдмрдВрдз рд╣реИред

рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХрд╛ рд╕реВрддреНрд░

╧З2=тИС(OтИТE)2E\chi^2 = \sum \frac{(O – E)^2}{E}

рдЬрд╣рд╛рдБ:

  • ╧З2\chi^2 = рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рдорд╛рди
  • OO = рдкреНрд░реЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐ (Observed Frequency)
  • EE = рдЕрдкреЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐ (Expected Frequency)

рдпрджрд┐ ╧З┬▓ рдХрд╛ рдорд╛рди рдмрдбрд╝рд╛ рд╣реЛрддрд╛ рд╣реИ, рддреЛ рдпрд╣ рджрд░реНрд╢рд╛рддрд╛ рд╣реИ рдХрд┐ рдкреНрд░реЗрдХреНрд╖рд┐рдд рдФрд░ рдЕрдкреЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐рдпреЛрдВ рдХреЗ рдмреАрдЪ рдмрдбрд╝рд╛ рдЕрдВрддрд░ рд╣реИ, рдЬрд┐рд╕рд╕реЗ рдпрд╣ рд╕рдВрднрд╛рд╡рдирд╛ рдмрдврд╝ рдЬрд╛рддреА рд╣реИ рдХрд┐ рджреЛ рдЪрд░ рдПрдХ-рджреВрд╕рд░реЗ рд╕реЗ рд╕рдВрдмрдВрдзрд┐рдд рд╣реИрдВред


2. рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреЗ рдкреНрд░рдХрд╛рд░

A. рд╕рдорд░реВрдкрддрд╛ рдХреЗ рд▓рд┐рдП рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг (Goodness of Fit Test)

рдпрд╣ рдкрд░реАрдХреНрд╖рдг рдпрд╣ рдЬрд╛рдВрдЪрдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рдХреЛрдИ рд╡рд┐рд╢реЗрд╖ рдбреЗрдЯрд╛ рд╕реЗрдЯ рдХрд┐рд╕реА рджрд┐рдП рдЧрдП рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рд╡рд┐рддрд░рдг (Theoretical Distribution) рдХреЗ рдЕрдиреБрд░реВрдк рд╣реИ рдпрд╛ рдирд╣реАрдВред

рдЙрджрд╛рд╣рд░рдг:
рдПрдХ рд╢реЛрдзрдХрд░реНрддрд╛ рдпрд╣ рдкрд░реАрдХреНрд╖рдг рдХрд░рдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рддреАрди рдЕрд▓рдЧ-рдЕрд▓рдЧ рдмреНрд░рд╛рдВрдбреЛрдВ (A, B, рдФрд░ C) рдХреЗ рдЧреНрд░рд╛рд╣рдХ рд╕рдорд╛рди рд░реВрдк рд╕реЗ рд╡рд┐рддрд░рд┐рдд рд╣реИрдВред

рдмреНрд░рд╛рдВрдбрдкреНрд░реЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐ (O)рдЕрдкреЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐ (E)
A4050
B6050
C5050

рдпрд╣ рдкрд░реАрдХреНрд╖рдг рдпрд╣ рдЬрд╛рдВрдЪреЗрдЧрд╛ рдХрд┐ рдХреНрдпрд╛ рдмреНрд░рд╛рдВрдбреЛрдВ рдХреЗ рдмреАрдЪ рдкрд╕рдВрдж рдореЗрдВ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдЕрдВрддрд░ рд╣реИ рдпрд╛ рдирд╣реАрдВред

B. рд╕реНрд╡рддрдВрддреНрд░рддрд╛ рдХреЗ рд▓рд┐рдП рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг (Test for Independence)

рдЗрд╕ рдкрд░реАрдХреНрд╖рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдпрд╣ рдкрддрд╛ рд▓рдЧрд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдХрд┐ рджреЛ рд╢реНрд░реЗрдгреАрдмрджреНрдз рдЪрд░ рд╕реНрд╡рддрдВрддреНрд░ рд╣реИрдВ рдпрд╛ рд╕рдВрдмрдВрдзрд┐рдд рд╣реИрдВред

рдЙрджрд╛рд╣рд░рдг:
рдПрдХ рд╢реЛрдзрдХрд░реНрддрд╛ рдпрд╣ рдкрд░реАрдХреНрд╖рдг рдХрд░рдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реИ рдХрд┐ рд▓рд┐рдВрдЧ (рдкреБрд░реБрд╖/рдорд╣рд┐рд▓рд╛) рдФрд░ рдорддрджрд╛рди рд╡рд░реАрдпрддрд╛ (рдкрд╛рд░реНрдЯреА X / рдкрд╛рд░реНрдЯреА Y) рдХреЗ рдмреАрдЪ рдХреЛрдИ рд╕рдВрдмрдВрдз рд╣реИ рдпрд╛ рдирд╣реАрдВред

рд▓рд┐рдВрдЧрдкрд╛рд░реНрдЯреА Xрдкрд╛рд░реНрдЯреА Y
рдкреБрд░реБрд╖3020
рдорд╣рд┐рд▓рд╛2525

рдпрджрд┐ рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рджрд░реНрд╢рд╛рддрд╛ рд╣реИ рдХрд┐ рдЕрдВрддрд░ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╣реИ, рддреЛ рдпрд╣ рдирд┐рд╖реНрдХрд░реНрд╖ рдирд┐рдХрд╛рд▓рд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИ рдХрд┐ рд▓рд┐рдВрдЧ рдФрд░ рдорддрджрд╛рди рд╡рд░реАрдпрддрд╛ рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдз рд╣реИред


3. рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреА рдкреВрд░реНрд╡-рдзрд╛рд░рдгрд╛рдПрдБ

  1. рдбреЗрдЯрд╛ рд╢реНрд░реЗрдгреАрдмрджреНрдз рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдП (рдЬреИрд╕реЗ рд▓рд┐рдВрдЧ, рд╡реНрдпрд╡рд╕рд╛рдп, рдкрд╕рдВрдж)ред
  2. рд╕рднреА рдЕрд╡рд▓реЛрдХрди рд╕реНрд╡рддрдВрддреНрд░ рд╣реЛрдиреЗ рдЪрд╛рд╣рд┐рдП (рд╣рд░ рдбреЗрдЯрд╛ рдмрд┐рдВрджреБ рдПрдХ рдЕрд▓рдЧ рд╡рд┐рд╖рдп рдХрд╛ рдкреНрд░рддрд┐рдирд┐рдзрд┐рддреНрд╡ рдХрд░рддрд╛ рд╣реИ)ред
  3. рд╣рд░ рд╢реНрд░реЗрдгреА рдХреА рдЕрдкреЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐ рдХрдо рд╕реЗ рдХрдо 5 рд╣реЛрдиреА рдЪрд╛рд╣рд┐рдПред
  4. рдирдореВрдирд╛ рдЖрдХрд╛рд░ рдкрд░реНрдпрд╛рдкреНрдд рд░реВрдк рд╕реЗ рдмрдбрд╝рд╛ рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдПред

4. рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреА рдЧрдгрдирд╛ (рдЪрд░рдг-рджрд░-рдЪрд░рдг рдкреНрд░рдХреНрд░рд┐рдпрд╛)

рдЙрджрд╛рд╣рд░рдг рд╕рдорд╕реНрдпрд╛

рдПрдХ рд╕рд░реНрд╡реЗрдХреНрд╖рдг рдореЗрдВ рдпрд╣ рдЬрд╛рдВрдЪрд╛ рдЬрд╛рддрд╛ рд╣реИ рдХрд┐ рд╡реНрдпрд╛рдпрд╛рдо рдХрд░рдиреЗ рдХреА рдЖрджрддреЗрдВ (рдирд┐рдпрдорд┐рдд/рдЕрдирд┐рдпрдорд┐рдд) рдФрд░ рд╣реГрджрдп рд░реЛрдЧ (рд╣рд╛рдВ/рдирд╣реАрдВ) рдХреЗ рдмреАрдЪ рдХреЛрдИ рд╕рдВрдмрдВрдз рд╣реИ рдпрд╛ рдирд╣реАрдВред

рд╡реНрдпрд╛рдпрд╛рдо рдЖрджрддрд╣реГрджрдп рд░реЛрдЧ (рд╣рд╛рдВ)рд╣реГрджрдп рд░реЛрдЧ (рдирд╣реАрдВ)рдХреБрд▓
рдирд┐рдпрдорд┐рдд3070100
рдЕрдирд┐рдпрдорд┐рдд5050100
рдХреБрд▓80120200

рдЪрд░рдг 1: рдЕрдкреЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐рдпрд╛рдБ рдирд┐рдХрд╛рд▓реЗрдВ

E=рдкрдВрдХреНрддрд┐ рдпреЛрдЧ├Чрд╕реНрддрдВрдн рдпреЛрдЧрдХреБрд▓ рдпреЛрдЧE = \frac{\text{рдкрдВрдХреНрддрд┐ рдпреЛрдЧ} \times \text{рд╕реНрддрдВрдн рдпреЛрдЧ}}{\text{рдХреБрд▓ рдпреЛрдЧ}}

рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рдирд┐рдпрдорд┐рдд & рд╣рд╛рдВ рдХреЗ рд▓рд┐рдП рдЕрдкреЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐:

E=100├Ч80200=40E = \frac{100 \times 80}{200} = 40

рдЗрд╕реА рддрд░рд╣ рдЕрдиреНрдп рд╢реНрд░реЗрдгрд┐рдпреЛрдВ рдХреЗ рд▓рд┐рдП рдЕрдкреЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐рдпрд╛рдБ рдирд┐рдХрд╛рд▓реА рдЬрд╛рддреА рд╣реИрдВред

рдЪрд░рдг 2: рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рд╕реВрддреНрд░ рд▓рд╛рдЧреВ рдХрд░реЗрдВ

╧З2=тИС(OтИТE)2E\chi^2 = \sum \frac{(O – E)^2}{E}

рдЧрдгрдирд╛ рдХрд░рдиреЗ рдХреЗ рдмрд╛рдж, рдорд╛рди ╧З2=8.34\chi^2 = 8.34 рдкреНрд░рд╛рдкреНрдд рд╣реЛрддрд╛ рд╣реИред

рдЪрд░рдг 3: рдорд╣рддреНрд╡рдкреВрд░реНрдг рдорд╛рди (Critical Value) рд╕реЗ рддреБрд▓рдирд╛ рдХрд░реЗрдВ

рдпрджрд┐ df = (рдкрдВрдХреНрддрд┐ – 1) ├Ч (рд╕реНрддрдВрдн – 1) = 1 рдФрд░ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдорд╛рди 3.84 рд╣реИ, рдФрд░ ╧З┬▓ = 8.34 > 3.84, рддреЛ рд╢реВрдиреНрдп рдкрд░рд┐рдХрд▓реНрдкрдирд╛ рдХреЛ рдЕрд╕реНрд╡реАрдХрд╛рд░ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ, рдЬрд┐рд╕рд╕реЗ рдирд┐рд╖реНрдХрд░реНрд╖ рдирд┐рдХрд▓рддрд╛ рд╣реИ рдХрд┐ рд╡реНрдпрд╛рдпрд╛рдо рдХрд░рдиреЗ рдХреА рдЖрджрддреЗрдВ рдФрд░ рд╣реГрджрдп рд░реЛрдЧ рдХреЗ рдмреАрдЪ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╕рдВрдмрдВрдз рд╣реИред


5. рдкрд░рд┐рдгрд╛рдореЛрдВ рдХреА рд╡реНрдпрд╛рдЦреНрдпрд╛

  • рдпрджрд┐ ╧З┬▓ рдХрд╛ рдорд╛рди рдорд╣рддреНрд╡рдкреВрд░реНрдг рдорд╛рди рд╕реЗ рдЕрдзрд┐рдХ рд╣реИ, рддреЛ рд╢реВрдиреНрдп рдкрд░рд┐рдХрд▓реНрдкрдирд╛ рдХреЛ рдЕрд╕реНрд╡реАрдХрд╛рд░ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ тЖТ рджреЛрдиреЛрдВ рдЪрд░ рд╕рдВрдмрдВрдзрд┐рдд рд╣реИрдВред
  • рдпрджрд┐ ╧З┬▓ рдХрд╛ рдорд╛рди рдорд╣рддреНрд╡рдкреВрд░реНрдг рдорд╛рди рд╕реЗ рдХрдо рд╣реИ, рддреЛ рд╢реВрдиреНрдп рдкрд░рд┐рдХрд▓реНрдкрдирд╛ рдЕрд╕реНрд╡реАрдХрд╛рд░ рдирд╣реАрдВ рдХреА рдЬрд╛рддреА тЖТ рджреЛрдиреЛрдВ рдЪрд░ рд╕реНрд╡рддрдВрддреНрд░ рд╣реИрдВред

6. рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреЗ рдЕрдиреБрдкреНрд░рдпреЛрдЧ

  • рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди: рддрдирд╛рд╡ рдФрд░ рдореБрдХрд╛рдмрд▓рд╛ рдХрд░рдиреЗ рдХреА рд░рдгрдиреАрддрд┐рдпреЛрдВ рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдз рдХреА рдЬрд╛рдВрдЪред
  • рд╢рд┐рдХреНрд╖рд╛: рд╡рд┐рднрд┐рдиреНрди рд╢рд┐рдХреНрд╖рдг рд╡рд┐рдзрд┐рдпреЛрдВ рдХреА рддреБрд▓рдирд╛ред
  • рд╡рд┐рдкрдгрди: рдЙрдкрднреЛрдХреНрддрд╛ рдкрд╕рдВрдж рдФрд░ рдмреНрд░рд╛рдВрдб рдЪрдпрди рдХрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдгред
  • рдЪрд┐рдХрд┐рддреНрд╕рд╛ рдЕрдиреБрд╕рдВрдзрд╛рди: рдЬреАрд╡рдирд╢реИрд▓реА рдХрд╛рд░рдХреЛрдВ рдФрд░ рдмреАрдорд╛рд░рд┐рдпреЛрдВ рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдз рдХреА рдЬрд╛рдБрдЪред

7. рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреА рд╕реАрдорд╛рдПрдБ

  • рдЫреЛрдЯреЗ рдирдореВрдирд╛ рдЖрдХрд╛рд░ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреБрдХреНрдд рдирд╣реАрдВред
  • рдХрд╛рд░рдг-рдкреНрд░рднрд╛рд╡ (Cause-Effect) рд╕рдВрдмрдВрдз рдирд╣реАрдВ рджрд░реНрд╢рд╛ рд╕рдХрддрд╛ред
  • рдХреЗрд╡рд▓ рд╢реНрд░реЗрдгреАрдмрджреНрдз рдбреЗрдЯрд╛ рдкрд░ рд▓рд╛рдЧреВ рд╣реЛрддрд╛ рд╣реИред

рдирд┐рд╖реНрдХрд░реНрд╖

рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдПрдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рддрдХрдиреАрдХ рд╣реИ рдЬреЛ рдпрд╣ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХрд░рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддрд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рджреЛ рд╢реНрд░реЗрдгреАрдмрджреНрдз рдЪрд░ рд╕реНрд╡рддрдВрддреНрд░ рд╣реИрдВ рдпрд╛ рд╕рдВрдмрдВрдзрд┐рддред рдЗрд╕рдХрд╛ рд╕рд╣реА рдЙрдкрдпреЛрдЧ рдЕрдиреБрд╕рдВрдзрд╛рди рдирд┐рд╖реНрдХрд░реНрд╖реЛрдВ рдХреЛ рдЕрдзрд┐рдХ рд╡рд┐рд╢реНрд╡рд╕рдиреАрдп рдмрдирд╛рддрд╛ рд╣реИред

UNIT-4(4.1) Chi square: Concept.

Chi-Square Test: Concept, Types, and Applications

Introduction

The Chi-Square test is a non-parametric statistical test used to determine if there is a significant association between categorical variables. It is widely used in fields such as psychology, biology, social sciences, and business to analyze frequency data and test hypotheses.

The Chi-Square test is particularly useful when dealing with nominal (categorical) data, where variables are classified into different groups without any inherent order.

This article will cover:

  1. Concept of the Chi-Square test
  2. Types of Chi-Square tests
    • Chi-Square Test for Goodness of Fit
    • Chi-Square Test for Independence
  3. Assumptions of the Chi-Square test
  4. Chi-Square Test Calculation (Step-by-Step)
  5. Interpretation of Results
  6. Applications of the Chi-Square Test
  7. Limitations of the Chi-Square Test

1. Concept of the Chi-Square Test

What is the Chi-Square Test?

The Chi-Square test (╧З┬▓ test) is used to determine whether there is a statistically significant difference between the expected and observed frequencies in one or more categories.

It helps answer questions such as:

  • “Is there a relationship between gender and voting preference?”
  • “Do customer preferences for different brands differ significantly?”

The Chi-Square test is based on comparing observed data with expected data under the assumption that there is no relationship between the variables (null hypothesis).

Formula for the Chi-Square Test

The formula for the Chi-Square statistic is:

╧З2=тИС(OтИТE)2E\chi^2 = \sum \frac{(O – E)^2}{E}

Where:

  • ╧З2\chi^2 = Chi-Square statistic
  • OO = Observed frequency (actual data)
  • EE = Expected frequency (theoretical data based on null hypothesis)

The larger the Chi-Square value, the greater the difference between observed and expected values, indicating a possible relationship between the variables.


2. Types of Chi-Square Tests

A. Chi-Square Test for Goodness of Fit

This test is used to determine if a sample data set fits a specific distribution. It compares observed frequencies with expected frequencies based on a given theoretical model.

Example:
A researcher wants to test whether the distribution of customers across three different brands (A, B, and C) is equal.

BrandObserved Frequency (O)Expected Frequency (E)
A4050
B6050
C5050

The researcher uses the Chi-Square test for goodness of fit to see if the differences in observed frequencies are statistically significant.

B. Chi-Square Test for Independence

This test determines whether two categorical variables are independent or related.

Example:
A researcher wants to test whether gender (Male/Female) is related to voting preference (Party X / Party Y).

GenderParty XParty Y
Male3020
Female2525

The Chi-Square test for independence helps determine if gender influences voting preference.


3. Assumptions of the Chi-Square Test

Before using the Chi-Square test, certain assumptions must be met:

  1. Data should be categorical (e.g., gender, occupation, preferences).
  2. Observations should be independent (each data point represents a separate subject).
  3. Expected frequency should be at least 5 for each category.
  4. Sample size should be sufficiently large to ensure accurate results.

4. Chi-Square Test Calculation (Step-by-Step)

Let’s go through an example of the Chi-Square Test for Independence.

Example Problem

A survey is conducted to see if there is a relationship between exercise habits (Regular/Irregular) and Heart Disease (Yes/No) among 200 people.

Exercise HabitHeart Disease (Yes)Heart Disease (No)Total
Regular3070100
Irregular5050100
Total80120200

Step 1: Calculate Expected Frequencies
The expected frequency for each cell is calculated as:

E=Row Total├ЧColumn TotalGrand TotalE = \frac{\text{Row Total} \times \text{Column Total}}{\text{Grand Total}}

For Regular & Yes:

E=100├Ч80200=40E = \frac{100 \times 80}{200} = 40

For Regular & No:

E=100├Ч120200=60E = \frac{100 \times 120}{200} = 60

For Irregular & Yes:

E=100├Ч80200=40E = \frac{100 \times 80}{200} = 40

For Irregular & No:

E=100├Ч120200=60E = \frac{100 \times 120}{200} = 60

Step 2: Apply the Chi-Square Formula

╧З2=тИС(OтИТE)2E\chi^2 = \sum \frac{(O – E)^2}{E} ╧З2=(30тИТ40)240+(70тИТ60)260+(50тИТ40)240+(50тИТ60)260\chi^2 = \frac{(30-40)^2}{40} + \frac{(70-60)^2}{60} + \frac{(50-40)^2}{40} + \frac{(50-60)^2}{60} =(тИТ10)240+(10)260+(10)240+(тИТ10)260= \frac{(-10)^2}{40} + \frac{(10)^2}{60} + \frac{(10)^2}{40} + \frac{(-10)^2}{60} =10040+10060+10040+10060= \frac{100}{40} + \frac{100}{60} + \frac{100}{40} + \frac{100}{60} =2.5+1.67+2.5+1.67=8.34= 2.5 + 1.67 + 2.5 + 1.67 = 8.34

Step 3: Compare with the Critical Value
For df = (rows – 1) ├Ч (columns – 1) = (2-1) ├Ч (2-1) = 1, the critical value from the Chi-Square table at ╬▒ = 0.05 is 3.84.

Since ╧З┬▓ = 8.34 > 3.84, we reject the null hypothesis, meaning there is a significant relationship between exercise habits and heart disease.


5. Interpretation of Results

  • If ╧З┬▓ is greater than the critical value, reject the null hypothesis тЖТ There is a significant relationship.
  • If ╧З┬▓ is less than the critical value, fail to reject the null hypothesis тЖТ No significant relationship.

6. Applications of the Chi-Square Test

  • Psychology: Examining the relationship between stress levels and coping mechanisms.
  • Education: Analyzing student preferences for different teaching methods.
  • Marketing: Studying consumer preferences for brands based on demographic groups.
  • Medical Research: Investigating the link between lifestyle factors and diseases.

7. Limitations of the Chi-Square Test

  • Cannot be used for small sample sizes (expected frequency < 5).
  • Does not indicate cause-and-effect relationships.
  • Only works for categorical data, not numerical data.

Conclusion

The Chi-Square test is a powerful statistical tool used to analyze relationships between categorical variables. By comparing observed and expected frequencies, it helps researchers determine whether variables are independent or related. However, its proper use requires meeting its assumptions and interpreting results correctly.

UNIT-4(4.2) Computation of Chi-Square: Equal Distribution Hypothesis and Independent Hypothesis.

рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ (Chi-Square) рдХреА рдЧрдгрдирд╛: рд╕рдорд╛рди рд╡рд┐рддрд░рдг рдкрд░рд┐рдХрд▓реНрдкрдирд╛ рдФрд░ рд╕реНрд╡рддрдВрддреНрд░ рдкрд░рд┐рдХрд▓реНрдкрдирд╛

рдкрд░рд┐рдЪрдп

рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ (╧З┬▓) рдкрд░реАрдХреНрд╖рдг рдПрдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдЧреИрд░-рдкреИрд░рд╛рдореАрдЯреНрд░рд┐рдХ (Non-Parametric) рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рдкрд░реАрдХреНрд╖рдг рд╣реИ, рдЬрд┐рд╕рдХрд╛ рдЙрдкрдпреЛрдЧ рдпрд╣ рдЬрд╛рдВрдЪрдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рджреЛ рд╢реНрд░реЗрдгреАрдмрджреНрдз (Categorical) рдЪрд░ рдХреЗ рдмреАрдЪ рдХреЛрдИ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╕рдВрдмрдВрдз рд╣реИред рдпрд╣ рдореБрдЦреНрдп рд░реВрдк рд╕реЗ рдЖрд╡реГрддреНрддрд┐ рдбреЗрдЯрд╛ (Frequency Data) рдХрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХрд░рдиреЗ рдФрд░ рдкрд░рд┐рдХрд▓реНрдкрдирд╛рдУрдВ рдХреА рдЬрд╛рдВрдЪ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред

рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреЗ рджреЛ рдореБрдЦреНрдп рдкреНрд░рдХрд╛рд░ рд╣реИрдВ:

  1. рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рд╕рдорд░реВрдкрддрд╛ рдкрд░реАрдХреНрд╖рдг (Equal Distribution Hypothesis рдпрд╛ Goodness-of-Fit Test) тАУ рдпрд╣ рдЬрд╛рдВрдЪрддрд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рдкреНрд░реЗрдХреНрд╖рд┐рдд рд╡рд┐рддрд░рдг (Observed Distribution) рдЕрдкреЗрдХреНрд╖рд┐рдд рд╡рд┐рддрд░рдг (Expected Distribution) рд╕реЗ рдореЗрд▓ рдЦрд╛рддрд╛ рд╣реИред
  2. рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рд╕реНрд╡рддрдВрддреНрд░рддрд╛ рдкрд░реАрдХреНрд╖рдг (Independent Hypothesis рдпрд╛ Test of Independence) тАУ рдпрд╣ рдЬрд╛рдВрдЪрддрд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рджреЛ рд╢реНрд░реЗрдгреАрдмрджреНрдз рдЪрд░ рдПрдХ-рджреВрд╕рд░реЗ рд╕реЗ рд╕реНрд╡рддрдВрддреНрд░ рд╣реИрдВ рдпрд╛ рдЙрдирдХреЗ рдмреАрдЪ рдХреЛрдИ рд╕рдВрдмрдВрдз рд╣реИред

рдЗрд╕ рд▓реЗрдЦ рдореЗрдВ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рд╡рд┐рд╖рдпреЛрдВ рдХреЛ рд╡рд┐рд╕реНрддрд╛рд░ рд╕реЗ рд╕рдордЭрд╛рдпрд╛ рдЬрд╛рдПрдЧрд╛:

  • рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХрд╛ рд╕реВрддреНрд░ рдФрд░ рдЕрд╡рдзрд╛рд░рдгрд╛
  • рд╕рдорд╛рди рд╡рд┐рддрд░рдг рдкрд░рд┐рдХрд▓реНрдкрдирд╛ (Equal Distribution Hypothesis) рдХреЗ рд▓рд┐рдП рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдХреА рдЧрдгрдирд╛
  • рд╕реНрд╡рддрдВрддреНрд░ рдкрд░рд┐рдХрд▓реНрдкрдирд╛ (Independent Hypothesis) рдХреЗ рд▓рд┐рдП рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдХреА рдЧрдгрдирд╛
  • рдкрд░рд┐рдгрд╛рдореЛрдВ рдХреА рд╡реНрдпрд╛рдЦреНрдпрд╛
  • рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреЗ рдЕрдиреБрдкреНрд░рдпреЛрдЧ
  • рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреА рд╕реАрдорд╛рдПрдБ

1. рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХрд╛ рд╕реВрддреНрд░ рдФрд░ рдЕрд╡рдзрд╛рд░рдгрд╛

рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдХрд╛ рдЧрдгрд┐рддреАрдп рд╕реВрддреНрд░

рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рдорд╛рди рдХреА рдЧрдгрдирд╛ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рд╕реВрддреНрд░ рд╕реЗ рдХреА рдЬрд╛рддреА рд╣реИ:

╧З2=тИС(OтИТE)2E\chi^2 = \sum \frac{(O – E)^2}{E}

рдЬрд╣рд╛рдБ:

  • ╧З2\chi^2 = рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рдорд╛рди
  • OO = рдкреНрд░реЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐ (Observed Frequency)
  • EE = рдЕрдкреЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐ (Expected Frequency)

рдпрджрд┐ ╧З┬▓ рдХрд╛ рдорд╛рди рдЕрдзрд┐рдХ рд╣реЛрддрд╛ рд╣реИ, рддреЛ рдЗрд╕рдХрд╛ рдЕрд░реНрде рдпрд╣ рд╣реЛрддрд╛ рд╣реИ рдХрд┐ рдкреНрд░реЗрдХреНрд╖рд┐рдд рдФрд░ рдЕрдкреЗрдХреНрд╖рд┐рдд рдбреЗрдЯрд╛ рдХреЗ рдмреАрдЪ рдмрдбрд╝рд╛ рдЕрдВрддрд░ рд╣реИ, рдЬреЛ рдпрд╣ рджрд░реНрд╢рд╛рддрд╛ рд╣реИ рдХрд┐ рджреЛ рдЪрд░ рдПрдХ-рджреВрд╕рд░реЗ рд╕реЗ рдЬреБрдбрд╝реЗ рд╣реЛ рд╕рдХрддреЗ рд╣реИрдВред


2. рд╕рдорд╛рди рд╡рд┐рддрд░рдг рдкрд░рд┐рдХрд▓реНрдкрдирд╛ (Equal Distribution Hypothesis) рдХреЗ рд▓рд┐рдП рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдХреА рдЧрдгрдирд╛

рдЕрд╡рдзрд╛рд░рдгрд╛

рдЗрд╕ рдкрд░реАрдХреНрд╖рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдпрд╣ рдЬрд╛рдВрдЪрдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рдХрд┐рд╕реА рдбреЗрдЯрд╛ рдХрд╛ рд╡рд┐рддрд░рдг рдХрд┐рд╕реА рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ (Theoretical) рдпрд╛ рдЕрдиреБрдорд╛рдирд┐рдд рд╡рд┐рддрд░рдг рд╕реЗ рдореЗрд▓ рдЦрд╛рддрд╛ рд╣реИред

рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рдпрджрд┐ рдпрд╣ рдорд╛рдирд╛ рдЬрд╛рдП рдХрд┐ рддреАрди рдЕрд▓рдЧ-рдЕрд▓рдЧ рдмреНрд░рд╛рдВрдбреЛрдВ (A, B, рдФрд░ C) рдХреА рд╕рдорд╛рди рдорд╛рдВрдЧ рд╣реИ, рддреЛ рдЗрдирдХрд╛ рдмрд┐рдХреНрд░реА рд╡рд┐рддрд░рдг рднреА рд╕рдорд╛рди рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдПред

рдЙрджрд╛рд╣рд░рдг рд╕рдорд╕реНрдпрд╛

рдПрдХ рд╢реЛрдзрдХрд░реНрддрд╛ рдпрд╣ рдкрд░реАрдХреНрд╖рдг рдХрд░рдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рдЧреНрд░рд╛рд╣рдХ рддреАрди рдмреНрд░рд╛рдВрдбреЛрдВ (A, B, рдФрд░ C) рдХреЛ рд╕рдорд╛рди рд░реВрдк рд╕реЗ рдкрд╕рдВрдж рдХрд░рддреЗ рд╣реИрдВред 150 рдЧреНрд░рд╛рд╣рдХреЛрдВ рдХреЗ рд╕рд░реНрд╡реЗрдХреНрд╖рдг рдХреЗ рдмрд╛рдж рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдбреЗрдЯрд╛ рдкреНрд░рд╛рдкреНрдд рд╣реБрдЖ:

рдмреНрд░рд╛рдВрдбрдкреНрд░реЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐ (O)рдЕрдкреЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐ (E)
A5550
B4550
C5050

рдЪрд░рдг 1: рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рд╕реВрддреНрд░ рд▓рд╛рдЧреВ рдХрд░реЗрдВ

╧З2=тИС(OтИТE)2E\chi^2 = \sum \frac{(O – E)^2}{E} =(55тИТ50)250+(45тИТ50)250+(50тИТ50)250= \frac{(55-50)^2}{50} + \frac{(45-50)^2}{50} + \frac{(50-50)^2}{50} =2550+2550+050= \frac{25}{50} + \frac{25}{50} + \frac{0}{50} =0.5+0.5+0= 0.5 + 0.5 + 0 =1.0= 1.0

рдЪрд░рдг 2: рдбрд┐рдЧреНрд░реА рдСрдл рдлреНрд░реАрдбрдо (df) рдирд┐рдХрд╛рд▓реЗрдВ

df=(kтИТ1)=(3тИТ1)=2df = (k – 1) = (3 – 1) = 2

рдЬрд╣рд╛рдБ k = рд╢реНрд░реЗрдгрд┐рдпреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ред

рдЪрд░рдг 3: рдорд╣рддреНрд╡рдкреВрд░реНрдг рдорд╛рди (Critical Value) рд╕реЗ рддреБрд▓рдирд╛ рдХрд░реЗрдВ

df = 2 рдФрд░ ╬▒ = 0.05 рдкрд░, рдорд╣рддреНрд╡рдкреВрд░реНрдг рдорд╛рди = 5.99ред

рдХреНрдпреЛрдВрдХрд┐ 1.0 < 5.99, рд╣рдо рд╢реВрдиреНрдп рдкрд░рд┐рдХрд▓реНрдкрдирд╛ рдХреЛ рдЕрд╕реНрд╡реАрдХрд╛рд░ рдирд╣реАрдВ рдХрд░рддреЗ, рдЬрд┐рд╕рдХрд╛ рдЕрд░реНрде рд╣реИ рдХрд┐ рдмреНрд░рд╛рдВрдб рдХреА рдкрд╕рдВрдж рдореЗрдВ рдХреЛрдИ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдЕрдВрддрд░ рдирд╣реАрдВ рд╣реИред


3. рд╕реНрд╡рддрдВрддреНрд░ рдкрд░рд┐рдХрд▓реНрдкрдирд╛ (Independent Hypothesis) рдХреЗ рд▓рд┐рдП рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдХреА рдЧрдгрдирд╛

рдЕрд╡рдзрд╛рд░рдгрд╛

рдЗрд╕ рдкрд░реАрдХреНрд╖рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдпрд╣ рдЬрд╛рдВрдЪрдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рджреЛ рд╢реНрд░реЗрдгреАрдмрджреНрдз рдЪрд░ рд╕реНрд╡рддрдВрддреНрд░ рд╣реИрдВ рдпрд╛ рд╕рдВрдмрдВрдзрд┐рдд рд╣реИрдВред

рдЙрджрд╛рд╣рд░рдг: рдХреНрдпрд╛ рд▓рд┐рдВрдЧ (рдкреБрд░реБрд╖/рдорд╣рд┐рд▓рд╛) рдФрд░ рдорддрджрд╛рди рд╡рд░реАрдпрддрд╛ (рдкрд╛рд░реНрдЯреА X/рдкрд╛рд░реНрдЯреА Y) рдХреЗ рдмреАрдЪ рдХреЛрдИ рд╕рдВрдмрдВрдз рд╣реИ?

рдЙрджрд╛рд╣рд░рдг рд╕рдорд╕реНрдпрд╛

200 рдорддрджрд╛рддрд╛рдУрдВ рдкрд░ рдПрдХ рд╕рд░реНрд╡реЗрдХреНрд╖рдг рдХрд┐рдпрд╛ рдЧрдпрд╛ рдФрд░ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдбреЗрдЯрд╛ рдкреНрд░рд╛рдкреНрдд рд╣реБрдЖ:

рд▓рд┐рдВрдЧрдкрд╛рд░реНрдЯреА Xрдкрд╛рд░реНрдЯреА YрдХреБрд▓
рдкреБрд░реБрд╖4060100
рдорд╣рд┐рд▓рд╛5050100
рдХреБрд▓90110200

рдЪрд░рдг 1: рдЕрдкреЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐рдпрд╛рдБ (Expected Frequency) рдирд┐рдХрд╛рд▓реЗрдВ

E=Row Total├ЧColumn TotalGrand TotalE = \frac{\text{Row Total} \times \text{Column Total}}{\text{Grand Total}}

рдЙрджрд╛рд╣рд░рдг: рдкреБрд░реБрд╖ рдФрд░ рдкрд╛рд░реНрдЯреА X рдХреЗ рд▓рд┐рдП рдЕрдкреЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐

E=100├Ч90200=45E = \frac{100 \times 90}{200} = 45

рдЗрд╕реА рддрд░рд╣, рдЕрдиреНрдп рдЕрдкреЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐рдпрд╛рдБ рдирд┐рдХрд╛рд▓реА рдЬрд╛рддреА рд╣реИрдВред

рд▓рд┐рдВрдЧрдкрд╛рд░реНрдЯреА X (O)рдкрд╛рд░реНрдЯреА X (E)рдкрд╛рд░реНрдЯреА Y (O)рдкрд╛рд░реНрдЯреА Y (E)
рдкреБрд░реБрд╖40456055
рдорд╣рд┐рд▓рд╛50455055

рдЪрд░рдг 2: рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рд╕реВрддреНрд░ рд▓рд╛рдЧреВ рдХрд░реЗрдВ

╧З2=тИС(OтИТE)2E\chi^2 = \sum \frac{(O – E)^2}{E}

рдЧрдгрдирд╛ рдХрд░рдиреЗ рдХреЗ рдмрд╛рдж,

╧З2=2.02\chi^2 = 2.02

рдЪрд░рдг 3: рдбрд┐рдЧреНрд░реА рдСрдл рдлреНрд░реАрдбрдо (df) рдирд┐рдХрд╛рд▓реЗрдВ

df=(rowsтИТ1)├Ч(columnsтИТ1)=1df = (rows – 1) \times (columns – 1) = 1

рдорд╣рддреНрд╡рдкреВрд░реНрдг рдорд╛рди (Critical Value) = 3.84 (╬▒ = 0.05, df = 1)ред
рдЪреВрдВрдХрд┐ 2.02 < 3.84, рд╣рдо рд╢реВрдиреНрдп рдкрд░рд┐рдХрд▓реНрдкрдирд╛ рдХреЛ рдЕрд╕реНрд╡реАрдХрд╛рд░ рдирд╣реАрдВ рдХрд░ рд╕рдХрддреЗ, рдпрд╛рдиреА рд▓рд┐рдВрдЧ рдФрд░ рдорддрджрд╛рди рд╡рд░реАрдпрддрд╛ рд╕реНрд╡рддрдВрддреНрд░ рд╣реИрдВред


4. рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреЗ рдЕрдиреБрдкреНрд░рдпреЛрдЧ

  • рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди: рд╡реНрдпрдХреНрддрд┐рддреНрд╡ рдкреНрд░рдХрд╛рд░ рдФрд░ рддрдирд╛рд╡ рдкреНрд░рддрд┐рдХреНрд░рд┐рдпрд╛ рдХрд╛ рд╕рдВрдмрдВрдзред
  • рд╢рд┐рдХреНрд╖рд╛: рдЕрд▓рдЧ-рдЕрд▓рдЧ рд╢рд┐рдХреНрд╖рдг рд╡рд┐рдзрд┐рдпрд╛рдБ рдФрд░ рдЫрд╛рддреНрд░реЛрдВ рдХрд╛ рдкреНрд░рджрд░реНрд╢рдиред
  • рд╕реНрд╡рд╛рд╕реНрдереНрдп: рдЬреАрд╡рдирд╢реИрд▓реА рдФрд░ рдмреАрдорд╛рд░рд┐рдпреЛрдВ рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдзред

5. рдирд┐рд╖реНрдХрд░реНрд╖

рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рд╕рдорд╛рди рд╡рд┐рддрд░рдг рдФрд░ рд╕реНрд╡рддрдВрддреНрд░рддрд╛ рдХреА рдкрд░рд┐рдХрд▓реНрдкрдирд╛ рдХреА рдЬрд╛рдБрдЪ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рдЙрдкрдХрд░рдг рд╣реИред рд╕рд╣реА рдЧрдгрдирд╛ рдФрд░ рд╡реНрдпрд╛рдЦреНрдпрд╛ рдЕрдиреБрд╕рдВрдзрд╛рди рдирд┐рд╖реНрдХрд░реНрд╖реЛрдВ рдХреЛ рдЕрдзрд┐рдХ рд╡рд┐рд╢реНрд╡рд╕рдиреАрдп рдмрдирд╛рддреА рд╣реИред

UNIT-4(4.2) Computation of Chi-Square: Equal Distribution Hypothesis and Independent Hypothesis.

Computation of Chi-Square: Equal Distribution Hypothesis and Independent Hypothesis

Introduction

The Chi-Square (╧З┬▓) test is a widely used non-parametric statistical test that helps determine whether there is a significant association between two categorical variables. It is particularly useful for analyzing frequency data and testing hypotheses in various research fields, such as psychology, social sciences, medicine, and business.

There are two main types of Chi-Square tests:

  1. Chi-Square Goodness-of-Fit Test (Equal Distribution Hypothesis) тАУ Determines if an observed distribution matches an expected distribution.
  2. Chi-Square Test for Independence (Independent Hypothesis) тАУ Determines if two categorical variables are related or independent.

This article will cover:

  • Concept and formula of the Chi-Square test
  • Computation of the Chi-Square test for the Equal Distribution Hypothesis
  • Computation of the Chi-Square test for the Independent Hypothesis
  • Interpretation of results
  • Applications of the Chi-Square test
  • Limitations of the Chi-Square test

1. Concept and Formula of the Chi-Square Test

Chi-Square Formula

The Chi-Square statistic is calculated using the formula:

╧З2=тИС(OтИТE)2E\chi^2 = \sum \frac{(O – E)^2}{E}

Where:

  • ╧З2\chi^2 = Chi-Square statistic
  • OO = Observed frequency (actual count)
  • EE = Expected frequency (theoretical count based on the hypothesis)

A large Chi-Square value suggests that the observed data does not fit the expected data, indicating a significant relationship or deviation from the expected distribution.


2. Computation of Chi-Square for Equal Distribution Hypothesis (Goodness-of-Fit Test)

Concept

The Goodness-of-Fit test is used when we want to check whether an observed categorical data distribution follows a theoretically expected distribution.

For example, if we assume that customers choose three brands (A, B, and C) equally, the expected frequency should be the same for each brand.

Example Problem

A researcher wants to test if customers prefer three brands (A, B, and C) equally. A sample of 150 customers was surveyed, and their responses were recorded.

BrandObserved Frequency (O)Expected Frequency (E)
A5550
B4550
C5050

Step 1: Calculate the Chi-Square Statistic

Using the Chi-Square formula:

╧З2=тИС(OтИТE)2E\chi^2 = \sum \frac{(O – E)^2}{E} =(55тИТ50)250+(45тИТ50)250+(50тИТ50)250= \frac{(55-50)^2}{50} + \frac{(45-50)^2}{50} + \frac{(50-50)^2}{50} =(5)250+(тИТ5)250+(0)250= \frac{(5)^2}{50} + \frac{(-5)^2}{50} + \frac{(0)^2}{50} =2550+2550+0= \frac{25}{50} + \frac{25}{50} + 0 =0.5+0.5+0= 0.5 + 0.5 + 0 =1.0= 1.0

Step 2: Determine the Degrees of Freedom (df)

df=(kтИТ1)=(3тИТ1)=2df = (k – 1) = (3 – 1) = 2

where k is the number of categories.

Step 3: Compare with the Chi-Square Critical Value
From the Chi-Square table, at df = 2 and ╬▒ = 0.05, the critical value is 5.99.

Since 1.0 < 5.99, we fail to reject the null hypothesis. This means that there is no significant difference in brand preference, and the assumption of equal distribution is valid.


3. Computation of Chi-Square for Independent Hypothesis (Test of Independence)

Concept

The Chi-Square Test for Independence is used when we want to check whether two categorical variables are related or independent.

For example, we might want to check whether gender (Male/Female) is associated with voting preference (Party X/Party Y).

Example Problem

A political analyst surveys 200 voters to see if gender affects voting preference.

GenderParty XParty YTotal
Male4060100
Female5050100
Total90110200

Step 1: Calculate Expected Frequencies (E)
The expected frequency for each cell is calculated as:

E=Row Total├ЧColumn TotalGrand TotalE = \frac{\text{Row Total} \times \text{Column Total}}{\text{Grand Total}}

For Male & Party X:

E=100├Ч90200=45E = \frac{100 \times 90}{200} = 45

For Male & Party Y:

E=100├Ч110200=55E = \frac{100 \times 110}{200} = 55

For Female & Party X:

E=100├Ч90200=45E = \frac{100 \times 90}{200} = 45

For Female & Party Y:

E=100├Ч110200=55E = \frac{100 \times 110}{200} = 55

GenderParty X (O)Party X (E)Party Y (O)Party Y (E)
Male40456055
Female50455055

Step 2: Compute the Chi-Square Statistic

╧З2=тИС(OтИТE)2E\chi^2 = \sum \frac{(O – E)^2}{E} =(40тИТ45)245+(60тИТ55)255+(50тИТ45)245+(50тИТ55)255= \frac{(40-45)^2}{45} + \frac{(60-55)^2}{55} + \frac{(50-45)^2}{45} + \frac{(50-55)^2}{55} =(тИТ5)245+(5)255+(5)245+(тИТ5)255= \frac{(-5)^2}{45} + \frac{(5)^2}{55} + \frac{(5)^2}{45} + \frac{(-5)^2}{55} =2545+2555+2545+2555= \frac{25}{45} + \frac{25}{55} + \frac{25}{45} + \frac{25}{55} =0.56+0.45+0.56+0.45= 0.56 + 0.45 + 0.56 + 0.45 =2.02= 2.02

Step 3: Determine the Degrees of Freedom (df)

df=(rowsтИТ1)├Ч(columnsтИТ1)=(2тИТ1)├Ч(2тИТ1)=1df = (rows – 1) \times (columns – 1) = (2 – 1) \times (2 – 1) = 1

Step 4: Compare with the Chi-Square Critical Value
From the Chi-Square table, at df = 1 and ╬▒ = 0.05, the critical value is 3.84.

Since 2.02 < 3.84, we fail to reject the null hypothesis, meaning gender and voting preference are independent.


4. Interpretation of Results

  • If ╧З┬▓ > critical value, reject the null hypothesis тЖТ There is a relationship between variables.
  • If ╧З┬▓ < critical value, fail to reject the null hypothesis тЖТ Variables are independent.

5. Applications of the Chi-Square Test

  • Psychology: Relationship between stress and coping mechanisms.
  • Marketing: Brand preference across age groups.
  • Education: Student performance based on teaching methods.
  • Healthcare: Disease prevalence based on lifestyle factors.

Conclusion

The Chi-Square test is a crucial statistical tool for analyzing categorical data. The Goodness-of-Fit test checks if an observed distribution matches an expected one, while the Test for Independence determines whether two categorical variables are related.

UnNoticed Digital College

An activist by nature and educator by profession, have been working in the fields of health and education since 2016. I firmly believe that education is the only way through which one can reach, each and every destination one wants to reach. As Samuel Beckett says, "Ever tried, Ever failed. No matter. Try again, Fail again. Try better, Fail better." The one who tries, fails; and the one who fails, wins.

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button