UG-PSYCHOLOGY, SEMESTER-3, MJC-3, ALL
UNIT-1 (1.1) Meaning and Uses of Statistics in Psychology
рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди рдореЗрдВ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдХрд╛ рдЕрд░реНрде рдФрд░ рдЙрдкрдпреЛрдЧ
рдкрд░рд┐рдЪрдп
рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди рдореЗрдВ рдПрдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдЙрдкрдХрд░рдг рд╣реИ, рдЬреЛ рд╢реЛрдзрдХрд░реНрддрд╛рдУрдВ рдХреЛ рдбреЗрдЯрд╛ рдХрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХрд░рдиреЗ, рдкрд░рд┐рдХрд▓реНрдкрдирд╛рдУрдВ рдХрд╛ рдкрд░реАрдХреНрд╖рдг рдХрд░рдиреЗ рдФрд░ рдорд╛рдирд╡ рд╡рд┐рдЪрд╛рд░реЛрдВ, рднрд╛рд╡рдирд╛рдУрдВ рдФрд░ рд╡реНрдпрд╡рд╣рд╛рд░реЛрдВ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рд╕рд╛рд░реНрдердХ рдирд┐рд╖реНрдХрд░реНрд╖ рдирд┐рдХрд╛рд▓рдиреЗ рдореЗрдВ рд╕рд╣рд╛рдпрддрд╛ рдХрд░рддрд╛ рд╣реИред рдпрд╣ рд╕рдВрдЦреНрдпрд╛рддреНрдордХ рдбреЗрдЯрд╛ рдХреЛ рд╡реНрдпрд╡рд╕реНрдерд┐рдд, рд╕рдВрдХреНрд╖рд┐рдкреНрдд рдФрд░ рд╡реНрдпрд╛рдЦреНрдпрд╛ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ рд╡реНрдпрд╡рд╕реНрдерд┐рдд рджреГрд╖реНрдЯрд┐рдХреЛрдг рдкреНрд░рджрд╛рди рдХрд░рддрд╛ рд╣реИред рдордиреЛрд╡реИрдЬреНрдЮрд╛рдирд┐рдХ рдЕрдиреБрд╕рдВрдзрд╛рди рдЕрдХреНрд╕рд░ рдЬрдЯрд┐рд▓ рдбреЗрдЯрд╛ рд╕реЗрдЯ рд╕реЗ рдЬреБрдбрд╝рд╛ рд╣реЛрддрд╛ рд╣реИ, рдФрд░ рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рд╡рд┐рдзрд┐рдпрд╛рдБ рдпрд╣ рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддреА рд╣реИрдВ рдХрд┐ рдирд┐рд╖реНрдХрд░реНрд╖ рд╡рд┐рд╢реНрд╡рд╕рдиреАрдп, рдорд╛рдиреНрдп рдФрд░ рд╡реНрдпрд╛рдкрдХ рд░реВрдк рд╕реЗ рд▓рд╛рдЧреВ рдХрд┐рдП рдЬрд╛ рд╕рдХреЗрдВред
рдпрд╣ рдирд┐рдмрдВрдз рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди рдореЗрдВ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдХреЗ рдЕрд░реНрде рдФрд░ рд╡рд┐рднрд┐рдиреНрди рдЙрдкрдпреЛрдЧреЛрдВ рдХрд╛ рдЕрдиреНрд╡реЗрд╖рдг рдХрд░реЗрдЧрд╛, рдЬрд┐рд╕рдореЗрдВ рдбреЗрдЯрд╛ рд╕рдВрдЧреНрд░рд╣, рдкрд░рд┐рдХрд▓реНрдкрдирд╛ рдкрд░реАрдХреНрд╖рдг, рд╕рд╣рд╕рдВрдмрдВрдз рд╡рд┐рд╢реНрд▓реЗрд╖рдг, рдЕрдиреБрдорд╛рдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА, рдФрд░ рдиреИрджрд╛рдирд┐рдХ, рд╕рдВрдЬреНрдЮрд╛рдирд╛рддреНрдордХ, рд╕рд╛рдорд╛рдЬрд┐рдХ рдФрд░ рд╡рд┐рдХрд╛рд╕рд╛рддреНрдордХ рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди рдореЗрдВ рдЗрд╕рдХреЗ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рдЬреАрд╡рди рдЕрдиреБрдкреНрд░рдпреЛрдЧ рд╢рд╛рдорд┐рд▓ рд╣реИрдВред
рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди рдореЗрдВ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдХрд╛ рдЕрд░реНрде
рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдХреА рдкрд░рд┐рднрд╛рд╖рд╛
рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдЧрдгрд┐рдд рдХреА рдПрдХ рд╢рд╛рдЦрд╛ рд╣реИ рдЬреЛ рд╕рдВрдЦреНрдпрд╛рддреНрдордХ рдбреЗрдЯрд╛ рдХреЗ рд╕рдВрдЧреНрд░рд╣, рд╕рдВрдЧрдарди, рд╡рд┐рд╢реНрд▓реЗрд╖рдг, рд╡реНрдпрд╛рдЦреНрдпрд╛ рдФрд░ рдкреНрд░рд╕реНрддреБрддрд┐ рд╕реЗ рд╕рдВрдмрдВрдзрд┐рдд рд╣реИред рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди рдореЗрдВ, рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдХрд╛ рдЙрдкрдпреЛрдЧ рдорд╛рдирд╡ рд╡реНрдпрд╡рд╣рд╛рд░ рдФрд░ рдорд╛рдирд╕рд┐рдХ рдкреНрд░рдХреНрд░рд┐рдпрд╛рдУрдВ рдореЗрдВ рдкреИрдЯрд░реНрди рдХреЛ рд╕рдордЭрдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди рдореЗрдВ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдХреЗ рдкреНрд░рдХрд╛рд░
рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди рдореЗрдВ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдХреЛ рдореБрдЦреНрдп рд░реВрдк рд╕реЗ рджреЛ рднрд╛рдЧреЛрдВ рдореЗрдВ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ:
- рд╡рд░реНрдгрдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА (Descriptive Statistics) тАУ рдЗрд╕рдХрд╛ рдЙрдкрдпреЛрдЧ рдбреЗрдЯрд╛ рдХреЛ рд╕рдВрдХреНрд╖реЗрдк рдореЗрдВ рдкреНрд░рд╕реНрддреБрдд рдХрд░рдиреЗ рдФрд░ рд╡реНрдпрд╡рд╕реНрдерд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред рдЗрд╕рдореЗрдВ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдЙрдкрд╛рдп рд╢рд╛рдорд┐рд▓ рд╣реИрдВ:
- рдорд╛рдзреНрдп (Mean): рдбреЗрдЯрд╛ рд╕реЗрдЯ рдХреЗ рдХреЗрдВрджреНрд░реАрдп рдорд╛рди рдХрд╛ рдкреНрд░рддрд┐рдирд┐рдзрд┐рддреНрд╡ рдХрд░рддрд╛ рд╣реИред
- рдорд╛рдзреНрдпрд┐рдХрд╛ (Median): рдЬрдм рдбреЗрдЯрд╛ рдХреЛ рдЖрд░реЛрд╣реА рдХреНрд░рдо рдореЗрдВ рд░рдЦрд╛ рдЬрд╛рддрд╛ рд╣реИ рддреЛ рдпрд╣ рдордзреНрдп рдорд╛рди рд╣реЛрддрд╛ рд╣реИред
- рдмрд╣реБрд▓рдХ (Mode): рд╕рдмрд╕реЗ рдЕрдзрд┐рдХ рдмрд╛рд░ рдЖрдиреЗ рд╡рд╛рд▓рд╛ рдорд╛рдиред
- рдкреНрд░рдорд╛рдгрд┐рдд рд╡рд┐рдЪрд▓рди (Standard Deviation): рдпрд╣ рдорд╛рдкрддрд╛ рд╣реИ рдХрд┐ рдбреЗрдЯрд╛ рдФрд╕рдд рд╕реЗ рдХрд┐рддрдирд╛ рд╡рд┐рдЪрд▓рд┐рдд рд╣реИред
- рдкрд░рд╛рд╕ (Range) рдФрд░ рдкреНрд░рдХреАрд░реНрдгрди (Variance): рдбреЗрдЯрд╛ рдмрд┐рдВрджреБрдУрдВ рдХреЗ рдкреНрд░рд╕рд╛рд░ рдХреЛ рдЗрдВрдЧрд┐рдд рдХрд░рддреЗ рд╣реИрдВред
- рдЕрдиреБрдорд╛рдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА (Inferential Statistics) тАУ рдЗрд╕рдХрд╛ рдЙрдкрдпреЛрдЧ рдирдореВрдирд╛ рдбреЗрдЯрд╛ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рдкреВрд░реА рдЬрдирд╕рдВрдЦреНрдпрд╛ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдирд┐рд╖реНрдХрд░реНрд╖ рдирд┐рдХрд╛рд▓рдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред рдЗрд╕рдореЗрдВ рд╢рд╛рдорд┐рд▓ рд╣реИрдВ:
- рдкрд░рд┐рдХрд▓реНрдкрдирд╛ рдкрд░реАрдХреНрд╖рдг (Hypothesis Testing): рдпрд╣ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐ рдХреНрдпрд╛ рдкреНрд░рд╛рдкреНрдд рдкрд░рд┐рдгрд╛рдо рдХреЗрд╡рд▓ рд╕рдВрдпреЛрдЧ рд╕реЗ рд╣реИрдВ рдпрд╛ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рдкреНрд░рднрд╛рд╡ рдХрд╛ рд╕рдВрдХреЗрдд рджреЗрддреЗ рд╣реИрдВред
- рд╕рд╣рд╕рдВрдмрдВрдз рд╡рд┐рд╢реНрд▓реЗрд╖рдг (Correlation Analysis): рдЪрд░ (Variables) рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдзреЛрдВ рдХрд╛ рдЖрдХрд▓рди рдХрд░рддрд╛ рд╣реИред
- рдкреНрд░рддрд┐рдЧрдорди рд╡рд┐рд╢реНрд▓реЗрд╖рдг (Regression Analysis): рдПрдХ рдпрд╛ рдЕрдзрд┐рдХ рдЪрд░ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рдкрд░рд┐рдгрд╛рдореЛрдВ рдХреА рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдХрд░рдирд╛ред
- рдЯреА-рдЯреЗрд╕реНрдЯ рдФрд░ рдПрдиреЛрд╡рд╛ (T-tests рдФрд░ ANOVA): рд╕рдореВрд╣реЛрдВ рдХреЗ рдмреАрдЪ рдЕрдВрддрд░ рдХреА рддреБрд▓рдирд╛ рдХрд░рдирд╛ред
рд╡рд░реНрдгрдирд╛рддреНрдордХ рдФрд░ рдЕрдиреБрдореЗрдп рд╕рд╛рдВрдЦреНрдпрд┐рдХреА, рджреЛрдиреЛрдВ, рдордиреЛрд╡реИрдЬреНрдЮрд╛рдирд┐рдХреЛрдВ рдХреЛ рдкреНрд░рдпреЛрдЧрд╛рддреНрдордХ рдбреЗрдЯрд╛ рдХрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХрд░рдиреЗ рдФрд░ рдЕрдиреБрднрд╡рдЬрдиреНрдп рд╕рд╛рдХреНрд╖реНрдпреЛрдВ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рд╕реВрдЪрд┐рдд рдирд┐рд░реНрдгрдп рд▓реЗрдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддреЗ рд╣реИрдВред
рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди рдореЗрдВ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдХреЗ рдЙрдкрдпреЛрдЧ
рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди рдореЗрдВ рдХрдИ рддрд░реАрдХреЛрдВ рд╕реЗ рдорд╣рддреНрд╡рдкреВрд░реНрдг рднреВрдорд┐рдХрд╛ рдирд┐рднрд╛рддреА рд╣реИред рдиреАрдЪреЗ рдордиреЛрд╡реИрдЬреНрдЮрд╛рдирд┐рдХ рдЕрдиреБрд╕рдВрдзрд╛рди рдФрд░ рд╡реНрдпрд╡рд╣рд╛рд░ рдореЗрдВ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдХреЗ рдореБрдЦреНрдп рдЙрдкрдпреЛрдЧреЛрдВ рдХреЛ рд╕рдордЭрд╛рдпрд╛ рдЧрдпрд╛ рд╣реИ:
1. рдбреЗрдЯрд╛ рдХреЛ рд╡реНрдпрд╡рд╕реНрдерд┐рдд рдФрд░ рд╕рдВрдХреНрд╖реЗрдк рдореЗрдВ рдкреНрд░рд╕реНрддреБрдд рдХрд░рдирд╛
рдордиреЛрд╡реИрдЬреНрдЮрд╛рдирд┐рдХ рдЕрдиреБрд╕рдВрдзрд╛рди рдореЗрдВ рдЕрдХреНрд╕рд░ рдкреНрд░рдпреЛрдЧреЛрдВ, рд╕рд░реНрд╡реЗрдХреНрд╖рдгреЛрдВ рдпрд╛ рдЕрд╡рд▓реЛрдХрдиреЛрдВ рд╕реЗ рдмрдбрд╝реЗ рдкреИрдорд╛рдиреЗ рдкрд░ рдбреЗрдЯрд╛ рдПрдХрддреНрд░ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред рд╡рд░реНрдгрдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдЗрд╕ рдбреЗрдЯрд╛ рдХреЛ рдПрдХ рд╕рд╛рд░реНрдердХ рдкреНрд░рд╛рд░реВрдк рдореЗрдВ рд╡реНрдпрд╡рд╕реНрдерд┐рдд рдХрд░рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддреА рд╣реИред
рдЙрджрд╛рд╣рд░рдг:
- рдПрдХ рдордиреЛрд╡реИрдЬреНрдЮрд╛рдирд┐рдХ рдЬреЛ рдХреЙрд▓реЗрдЬ рдХреЗ рдЫрд╛рддреНрд░реЛрдВ рдореЗрдВ рдЪрд┐рдВрддрд╛ рдХреЗ рд╕реНрддрд░ рдХрд╛ рдЕрдзреНрдпрдпрди рдХрд░ рд░рд╣рд╛ рд╣реИ, рд╡рд╣ рдЪрд┐рдВрддрд╛ рд╕реНрдХреЛрд░ рдХреЗ рд╡рд┐рддрд░рдг рдХреЛ рджрд░реНрд╢рд╛рдиреЗ рдХреЗ рд▓рд┐рдП рд╣рд┐рд╕реНрдЯреЛрдЧреНрд░рд╛рдо (Histogram) рдФрд░ рдкрд╛рдИ рдЪрд╛рд░реНрдЯ (Pie Chart) рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд╕рдХрддрд╛ рд╣реИред
2. рдкрд░рд┐рдХрд▓реНрдкрдирд╛ рдХрд╛ рдкрд░реАрдХреНрд╖рдг рдФрд░ рдирд┐рд╖реНрдХрд░реНрд╖ рдирд┐рдХрд╛рд▓рдирд╛
рдЕрдиреБрдорд╛рдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдордиреЛрд╡реИрдЬреНрдЮрд╛рдирд┐рдХреЛрдВ рдХреЛ рдкрд░рд┐рдХрд▓реНрдкрдирд╛рдУрдВ рдХрд╛ рдкрд░реАрдХреНрд╖рдг рдХрд░рдиреЗ рдФрд░ рдпрд╣ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХрд░рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддреА рд╣реИ рдХрд┐ рдЙрдирдХреЗ рдирд┐рд╖реНрдХрд░реНрд╖ рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рд░реВрдк рд╕реЗ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╣реИрдВ рдпрд╛ рдирд╣реАрдВред
рдЙрджрд╛рд╣рд░рдг:
- рдпрджрд┐ рдПрдХ рд╢реЛрдзрдХрд░реНрддрд╛ рдзреНрдпрд╛рди (Meditation) рдХреЗ рддрдирд╛рд╡ рдкрд░ рдкреНрд░рднрд╛рд╡ рдХрд╛ рдЕрдзреНрдпрдпрди рдХрд░ рд░рд╣рд╛ рд╣реИ, рддреЛ рд╡рд╣ рдПрдХ рдкреНрд░рдпреЛрдЧ рдХрд░ рд╕рдХрддрд╛ рд╣реИ рдФрд░ рдЯреА-рдЯреЗрд╕реНрдЯ (T-Test) рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдзреНрдпрд╛рди рд╕рдореВрд╣ рдФрд░ рдирд┐рдпрдВрддреНрд░рдг рд╕рдореВрд╣ рдХреЗ рддрдирд╛рд╡ рд╕реНрддрд░реЛрдВ рдХреА рддреБрд▓рдирд╛ рдХрд░ рд╕рдХрддрд╛ рд╣реИред рдпрджрд┐ p-рдореВрд▓реНрдп (P-value) 0.05 рд╕реЗ рдХрдо рд╣реИ, рддреЛ рдЗрд╕рдХрд╛ рдорддрд▓рдм рд╣реИ рдХрд┐ рдзреНрдпрд╛рди рддрдирд╛рд╡ рдХреЛ рдХрдо рдХрд░рдиреЗ рдореЗрдВ рдорд╣рддреНрд╡рдкреВрд░реНрдг рднреВрдорд┐рдХрд╛ рдирд┐рднрд╛рддрд╛ рд╣реИред
3. рдЪрд░ рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдз рдХреЛ рдорд╛рдкрдирд╛ (рд╕рд╣рд╕рдВрдмрдВрдз рд╡рд┐рд╢реНрд▓реЗрд╖рдг)
рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдордиреЛрд╡реИрдЬреНрдЮрд╛рдирд┐рдХреЛрдВ рдХреЛ рд╡рд┐рднрд┐рдиреНрди рдордиреЛрд╡реИрдЬреНрдЮрд╛рдирд┐рдХ рдЪрд░ рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдзреЛрдВ рдХреЛ рд╕рдордЭрдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддреА рд╣реИред
рдЙрджрд╛рд╣рд░рдг:
- рдПрдХ рдордиреЛрд╡реИрдЬреНрдЮрд╛рдирд┐рдХ рдЬреЛ рдиреАрдВрдж рдХреА рдХрдореА рдФрд░ рд╕реНрдорд░рдгрд╢рдХреНрддрд┐ (Memory) рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдз рдХреА рдЬрд╛рдВрдЪ рдХрд░ рд░рд╣рд╛ рд╣реИ, рд╡рд╣ рдПрдХ рдирдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдз (Negative Correlation) рдкрд╛ рд╕рдХрддрд╛ рд╣реИ, рдЬреЛ рджрд░реНрд╢рд╛рддрд╛ рд╣реИ рдХрд┐ рдХрдо рдиреАрдВрдж рд╕реЗ рд╕реНрдорд░рдгрд╢рдХреНрддрд┐ рдкреНрд░рднрд╛рд╡рд┐рдд рд╣реЛрддреА рд╣реИред
рд╣рд╛рд▓рд╛рдВрдХрд┐, рд╕рд╣рд╕рдВрдмрдВрдз рд╣рдореЗрд╢рд╛ рдХрд╛рд░рдг рдФрд░ рдкреНрд░рднрд╛рд╡ (Causation) рдХреЛ рдЗрдВрдЧрд┐рдд рдирд╣реАрдВ рдХрд░рддрд╛ рд╣реИред
4. рдкреНрд░рддрд┐рдЧрдорди рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рд▓рдЧрд╛рдирд╛
рдкреНрд░рддрд┐рдЧрдорди рд╡рд┐рд╢реНрд▓реЗрд╖рдг (Regression Analysis) рдПрдХ рдпрд╛ рдЕрдзрд┐рдХ рдЪрд░ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдХрд░рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддрд╛ рд╣реИред
рдЙрджрд╛рд╣рд░рдг:
- рдПрдХ рдордиреЛрд╡реИрдЬреНрдЮрд╛рдирд┐рдХ рдпрд╣ рдЕрдиреБрдорд╛рди рд▓рдЧрд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдкреНрд░рддрд┐рдЧрдорди рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд╕рдХрддрд╛ рд╣реИ рдХрд┐ рдХрд┐рд╕реА рдЫрд╛рддреНрд░ рдХрд╛ рд╢реИрдХреНрд╖рдгрд┐рдХ рдкреНрд░рджрд░реНрд╢рди (Academic Performance) рдЙрд╕рдХреА рдЖрдИрдХреНрдпреВ, рдкреНрд░реЗрд░рдгрд╛ рдФрд░ рдЕрдзреНрдпрдпрди рдХреА рдЖрджрддреЛрдВ рдкрд░ рдЖрдзрд╛рд░рд┐рдд рд╣реИред
5. рд╕рдореВрд╣реЛрдВ рдХреА рддреБрд▓рдирд╛ рдХрд░рдирд╛ (T-Tests рдФрд░ ANOVA)
рдЯреА-рдЯреЗрд╕реНрдЯ рдФрд░ рдПрдиреЛрд╡рд╛ рдХрд╛ рдЙрдкрдпреЛрдЧ рдпрд╣ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рд╕рдореВрд╣реЛрдВ рдХреЗ рдмреАрдЪ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдЕрдВрддрд░ рд╣реИрдВред
рдЙрджрд╛рд╣рд░рдг:
- рдпрджрд┐ рдХреЛрдИ рд╕рд╛рдорд╛рдЬрд┐рдХ рдордиреЛрд╡реИрдЬреНрдЮрд╛рдирд┐рдХ рд╕рдореВрд╣ рдЪрд┐рдХрд┐рддреНрд╕рд╛ (Group Therapy) рдФрд░ рд╡реНрдпрдХреНрддрд┐рдЧрдд рдкрд░рд╛рдорд░реНрд╢ (Individual Counseling) рдХреА рдкреНрд░рднрд╛рд╡рд╢реАрд▓рддрд╛ рдХреА рддреБрд▓рдирд╛ рдХрд░ рд░рд╣рд╛ рд╣реИ, рддреЛ рд╡рд╣ рдЯреА-рдЯреЗрд╕реНрдЯ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдпрд╣ рдкрддрд╛ рд▓рдЧрд╛ рд╕рдХрддрд╛ рд╣реИ рдХрд┐ рдХрд┐рд╕ рд╡рд┐рдзрд┐ рд╕реЗ рдЕрд╡рд╕рд╛рдж рдореЗрдВ рдЕрдзрд┐рдХ рд╕реБрдзрд╛рд░ рд╣реБрдЖред
6. рдордиреЛрд╡реИрдЬреНрдЮрд╛рдирд┐рдХ рдкрд░реАрдХреНрд╖рдгреЛрдВ рдХрд╛ рдореВрд▓реНрдпрд╛рдВрдХрди (Psychometrics)
рдордиреЛрд╡реИрдЬреНрдЮрд╛рдирд┐рдХ рдкрд░реАрдХреНрд╖рдгреЛрдВ рдХреА рд╡рд┐рд╢реНрд╡рд╕рдиреАрдпрддрд╛ (Reliability) рдФрд░ рд╡реИрдзрддрд╛ (Validity) рдХрд╛ рдореВрд▓реНрдпрд╛рдВрдХрди рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
рдЙрджрд╛рд╣рд░рдг:
- рдмрд┐рдЧ рдлрд╛рдЗрд╡ рдкрд░реНрд╕рдиреИрд▓рд┐рдЯреА рдЯреЗрд╕реНрдЯ (Big Five Personality Test) рдХреЛ рдпрд╣ рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рддрдХрдиреАрдХреЛрдВ рд╕реЗ рдкрд░рдЦрд╛ рдЬрд╛рддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рд╡реНрдпрдХреНрддрд┐рддреНрд╡ рд▓рдХреНрд╖рдгреЛрдВ рдХреЛ рд╕рд╣реА рдврдВрдЧ рд╕реЗ рдорд╛рдк рд░рд╣рд╛ рд╣реИред
7. рдиреИрджрд╛рдирд┐рдХ рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди рдореЗрдВ рдЙрдкрдпреЛрдЧ
рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдХрд╛ рдЙрдкрдпреЛрдЧ рдиреИрджрд╛рдирд┐рдХ рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди (Clinical Psychology) рдореЗрдВ рдирд┐рджрд╛рди, рдЙрдкрдЪрд╛рд░ рдореВрд▓реНрдпрд╛рдВрдХрди рдФрд░ рд░реЛрдЧ рдХреЗ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
рдЙрджрд╛рд╣рд░рдг:
- рдПрдХ рдордиреЛрд╡реИрдЬреНрдЮрд╛рдирд┐рдХ рдпрд╣ рдорд╛рдкрдиреЗ рдХреЗ рд▓рд┐рдП рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд╕рдХрддрд╛ рд╣реИ рдХрд┐ рдЕрд╡рд╕рд╛рдж рдЙрдкрдЪрд╛рд░ рдХреЗ рдмрд╛рдж рдорд░реАрдЬреЛрдВ рдХреА рд╕реНрдерд┐рддрд┐ рдореЗрдВ рдХрд┐рддрдирд╛ рд╕реБрдзрд╛рд░ рд╣реБрдЖ рд╣реИред
8. рд╕рдВрдЬреНрдЮрд╛рдирд╛рддреНрдордХ рдФрд░ рддрдВрддреНрд░рд┐рдХрд╛ рд╡рд┐рдЬреНрдЮрд╛рди рдЕрдиреБрд╕рдВрдзрд╛рди рдореЗрдВ рдЙрдкрдпреЛрдЧ
рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдХрд╛ рдЙрдкрдпреЛрдЧ рдорд╕реНрддрд┐рд╖реНрдХ рдЗрдореЗрдЬрд┐рдВрдЧ рдбреЗрдЯрд╛, рдкреНрд░рддрд┐рдХреНрд░рд┐рдпрд╛ рд╕рдордп рдФрд░ рд╕рдВрдЬреНрдЮрд╛рдирд╛рддреНрдордХ рдкреНрд░рджрд░реНрд╢рди рдХрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
рдЙрджрд╛рд╣рд░рдг:
- рдПрдХ рд╕рдВрдЬреНрдЮрд╛рдирд╛рддреНрдордХ рдордиреЛрд╡реИрдЬреНрдЮрд╛рдирд┐рдХ рд╕реНрдореГрддрд┐ рдЕрдзреНрдпрдпрди (Memory Study) рдХреЗ рд▓рд┐рдП рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рдореЙрдбрд▓ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд╕рдХрддрд╛ рд╣реИред
рдирд┐рд╖реНрдХрд░реНрд╖
рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди рдореЗрдВ рдПрдХ рдЖрд╡рд╢реНрдпрдХ рдЙрдкрдХрд░рдг рд╣реИ рдЬреЛ рд╢реЛрдзрдХрд░реНрддрд╛рдУрдВ рдХреЛ рдбреЗрдЯрд╛ рдХрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХрд░рдиреЗ, рдкрд░рд┐рдХрд▓реНрдкрдирд╛рдУрдВ рдХрд╛ рдкрд░реАрдХреНрд╖рдг рдХрд░рдиреЗ рдФрд░ рд╡реНрдпрд╡рд╣рд╛рд░ рдХреЛ рд╕рдордЭрдиреЗ рдореЗрдВ рд╕рд╣рд╛рдпрддрд╛ рдХрд░рддрд╛ рд╣реИред рдпрд╣ рд╡реИрдЬреНрдЮрд╛рдирд┐рдХ рдЕрдиреБрд╕рдВрдзрд╛рди рдХреА рд╡рд┐рд╢реНрд╡рд╕рдиреАрдпрддрд╛ рдФрд░ рд╡реИрдзрддрд╛ рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░рддрд╛ рд╣реИред рд╣рд╛рд▓рд╛рдВрдХрд┐, рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдХрд╛ рд╕рд╛рд╡рдзрд╛рдиреАрдкреВрд░реНрд╡рдХ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рдирд╛ рдЪрд╛рд╣рд┐рдП рддрд╛рдХрд┐ рдбреЗрдЯрд╛ рдХреА рдЧрд▓рдд рд╡реНрдпрд╛рдЦреНрдпрд╛ рди рд╣реЛред
рдЗрд╕ рдкреНрд░рдХрд╛рд░, рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдХреЗ рдЙрдЪрд┐рдд рдЙрдкрдпреЛрдЧ рд╕реЗ рдордиреЛрд╡реИрдЬреНрдЮрд╛рдирд┐рдХ рд╕рд┐рджреНрдзрд╛рдВрддреЛрдВ, рдЙрдкрдЪрд╛рд░реЛрдВ рдФрд░ рд╣рд╕реНрддрдХреНрд╖реЗрдкреЛрдВ рдореЗрдВ рд╕реБрдзрд╛рд░ рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИред
UNIT-1 (1.1) Meaning and Uses of Statistics in Psychology
Introduction
Statistics is an essential tool in psychology, enabling researchers to analyze data, test hypotheses, and draw meaningful conclusions about human thoughts, emotions, and behaviors. It provides a systematic approach to understanding psychological phenomena by organizing, summarizing, and interpreting numerical data. Psychological research often involves complex data sets, and statistical methods help ensure that findings are reliable, valid, and generalizable to larger populations.
This essay explores the meaning of statistics in psychology and its various uses, including data collection, hypothesis testing, correlation analysis, inferential statistics, and real-world applications in clinical, cognitive, social, and developmental psychology.
Meaning of Statistics in Psychology
Definition of Statistics
Statistics refers to a branch of mathematics that deals with the collection, organization, analysis, interpretation, and presentation of numerical data. In psychology, statistics are used to understand patterns in human behavior and mental processes through empirical research.
Types of Statistics in Psychology
Statistics in psychology can be broadly categorized into two types:
- Descriptive Statistics тАУ Used to summarize and organize data. It includes measures such as:
- Mean (average): Represents the central value of a data set.
- Median: The middle value when data is arranged in ascending order.
- Mode: The most frequently occurring value.
- Standard Deviation: Measures how much data deviates from the mean.
- Range and Variance: Indicate the spread of data points.
- Inferential Statistics тАУ Used to make predictions or generalizations about a population based on sample data. It includes:
- Hypothesis Testing: Determining whether observed results are due to chance or an actual effect.
- Correlation Analysis: Assessing relationships between variables.
- Regression Analysis: Predicting outcomes based on one or more variables.
- T-tests and ANOVA: Comparing group differences.
Both descriptive and inferential statistics help psychologists analyze experimental data and make informed decisions based on empirical evidence.
Uses of Statistics in Psychology
Statistics plays a crucial role in psychology in several ways. Below are the primary uses of statistics in psychological research and practice:
1. Organizing and Summarizing Data
Psychological research often involves large amounts of data collected from experiments, surveys, or observations. Descriptive statistics help in organizing this data into a meaningful format. For example, psychologists use frequency distributions, graphs, and tables to present findings in a clear and concise manner.
Example:
- A psychologist studying anxiety levels in college students may use histograms and pie charts to visually represent the distribution of anxiety scores.
2. Testing Hypotheses and Drawing Conclusions
Inferential statistics allow psychologists to test hypotheses and determine whether their findings are statistically significant. This process involves setting up null and alternative hypotheses and using statistical tests to validate or reject them.
Example:
- A researcher studying the effect of meditation on stress reduction may conduct an experiment and use a t-test to compare stress levels between a meditation group and a control group. If the p-value is below 0.05, the researcher can conclude that meditation significantly reduces stress.
3. Measuring Relationships Between Variables (Correlation Analysis)
Statistics help psychologists understand the relationships between different psychological variables. Correlation analysis measures how strongly two variables are related.
Example:
- A psychologist investigating the relationship between sleep deprivation and memory performance may find a negative correlation, indicating that less sleep is associated with poorer memory retention.
However, correlation does not imply causation. Other factors may influence the observed relationship, and further research is often needed.
4. Making Predictions Using Regression Analysis
Regression analysis helps psychologists predict outcomes based on one or more variables. This is especially useful in clinical psychology, where predicting patient behavior can aid in treatment planning.
Example:
- A psychologist may use regression analysis to predict a studentтАЩs academic performance based on factors like IQ, motivation, and study habits.
5. Comparing Groups Using T-tests and ANOVA
Statistical tests like the t-test and ANOVA (Analysis of Variance) are used to determine whether there are significant differences between groups.
Example:
- A social psychologist studying the effects of group therapy on depression may compare depression scores between participants in group therapy and those receiving individual counseling. A t-test can reveal whether the differences in depression scores are statistically significant.
ANOVA is useful when comparing more than two groups, such as studying the effects of different teaching methods on student performance.
6. Evaluating Psychological Tests and Scales (Psychometrics)
Statistics play a vital role in developing and validating psychological tests, such as intelligence tests, personality assessments, and mental health screenings. Psychometricians use statistical techniques to assess:
- Reliability: The consistency of a test over time.
- Validity: Whether the test measures what it claims to measure.
Example:
- The Big Five Personality Test is evaluated using factor analysis to ensure that it accurately measures personality traits like openness, conscientiousness, extraversion, agreeableness, and neuroticism.
7. Statistical Methods in Psychological Research Designs
Statistics help psychologists design experiments that minimize biases and errors. Common research designs include:
- Experimental Design: Involves random assignment of participants to experimental and control groups to determine cause-and-effect relationships.
- Quasi-Experimental Design: Used when random assignment is not possible, often in real-world settings.
- Longitudinal Studies: Analyze changes in behavior over time using repeated observations.
- Cross-Sectional Studies: Compare different groups at a single point in time.
Example:
- A developmental psychologist studying cognitive decline in aging adults may conduct a longitudinal study, tracking participantsтАЩ memory performance over decades.
8. Clinical Applications of Statistics
Statistics is widely used in clinical psychology for diagnosis, treatment evaluation, and prognosis. Clinicians rely on statistical data to determine the effectiveness of therapies and interventions.
Example:
- A clinical psychologist treating depression may use statistical analysis to compare the effectiveness of cognitive-behavioral therapy (CBT) versus medication by analyzing patientsтАЩ depression scores before and after treatment.
Statistical models also help in predicting patient relapse rates and identifying risk factors for mental illnesses.
9. Statistical Applications in Social Psychology
Social psychologists use statistical methods to analyze group behavior, attitudes, and social interactions. Common applications include:
- Studying prejudice and discrimination using survey data.
- Analyzing voting patterns and political opinions.
- Examining the effects of social media on self-esteem and mental health.
Example:
- A social psychologist studying conformity may use statistical tests to analyze how group pressure influences individual decision-making.
10. Neuroscience and Cognitive Psychology Applications
In cognitive and neuroscience research, statistics are used to analyze brain imaging data, reaction times, and cognitive performance. Techniques like fMRI and EEG generate massive datasets that require sophisticated statistical analysis.
Example:
- A cognitive psychologist studying memory may use statistical models to analyze reaction time data from memory recall tasks.
Challenges and Limitations of Using Statistics in Psychology
While statistics provide valuable insights, there are limitations to their use in psychology:
- Misinterpretation of Data: Correlation does not imply causation, and researchers must be cautious in drawing conclusions.
- Sampling Bias: Results may not be generalizable if the sample is not representative of the larger population.
- Overreliance on P-values: Statistical significance does not always indicate practical significance.
- Ethical Concerns: In psychological research, data collection and analysis must adhere to ethical guidelines to ensure participant privacy and informed consent.
Conclusion
Statistics is a fundamental tool in psychology, aiding researchers and practitioners in organizing data, testing hypotheses, measuring relationships, and making predictions. From clinical applications to social and cognitive research, statistical methods provide valuable insights into human behavior and mental processes. However, psychologists must be cautious in interpreting statistical results and acknowledge the limitations of statistical analysis.
By applying statistics responsibly, psychologists can enhance the validity and reliability of their findings, ultimately improving psychological theories, therapies, and interventions.
UNIT-1 (1.2) Variables: Meaning and Types (Categorical and Continuous)
рдЪрд░ (Variables): рдЕрд░реНрде рдФрд░ рдкреНрд░рдХрд╛рд░ (рд╢реНрд░реЗрдгреАрдп рдФрд░ рдирд┐рд░рдВрддрд░)
рдкрд░рд┐рдЪрдп
рдЪрд░ (Variables) рдХрд┐рд╕реА рднреА рдЕрдиреБрд╕рдВрдзрд╛рди рдФрд░ рдбреЗрдЯрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХрд╛ рдПрдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╣рд┐рд╕реНрд╕рд╛ рд╣реЛрддреЗ рд╣реИрдВред рд╡реЗ рд╡реИрдЬреНрдЮрд╛рдирд┐рдХ рдЬрд╛рдВрдЪреЛрдВ рдХреА рдиреАрдВрд╡ рд╣реЛрддреЗ рд╣реИрдВ рдФрд░ рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди, рд╕рд╛рдорд╛рдЬрд┐рдХ рд╡рд┐рдЬреНрдЮрд╛рди, рдФрд░ рдкреНрд░рд╛рдХреГрддрд┐рдХ рд╡рд┐рдЬреНрдЮрд╛рди рдЬреИрд╕реЗ рд╡рд┐рднрд┐рдиреНрди рдХреНрд╖реЗрддреНрд░реЛрдВ рдореЗрдВ рдЙрдкрдпреЛрдЧ рдХрд┐рдП рдЬрд╛рддреЗ рд╣реИрдВред рдЪрд░ рдХреЛ рд╕рдордЭрдирд╛ рдЕрдиреБрд╕рдВрдзрд╛рди рдбрд┐рдЬрд╛рдЗрди, рдбреЗрдЯрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг, рдФрд░ рдкрд░рд┐рдгрд╛рдореЛрдВ рдХреА рд╡реНрдпрд╛рдЦреНрдпрд╛ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЖрд╡рд╢реНрдпрдХ рд╣реИред
рдпрд╣ рдирд┐рдмрдВрдз рдЪрд░ рдХреЗ рдЕрд░реНрде, рдЕрдиреБрд╕рдВрдзрд╛рди рдореЗрдВ рдЙрдирдХреЗ рдорд╣рддреНрд╡ рдФрд░ рдЙрдирдХреЗ рдореБрдЦреНрдп рдкреНрд░рдХрд╛рд░реЛрдВ (рд╢реНрд░реЗрдгреАрдп рдФрд░ рдирд┐рд░рдВрддрд░) рдХреА рд╡рд┐рд╕реНрддреГрдд рд╡реНрдпрд╛рдЦреНрдпрд╛ рдХрд░реЗрдЧрд╛ред рд╕рд╛рде рд╣реА, рдЗрдирдХрд╛ рдЕрдиреБрдкреНрд░рдпреЛрдЧ, рдЙрджрд╛рд╣рд░рдг рдФрд░ рдкреНрд░рдореБрдЦ рдЕрдВрддрд░ рднреА рдмрддрд╛рдП рдЬрд╛рдПрдВрдЧреЗред
рдЪрд░ рдХрд╛ рдЕрд░реНрде
рдЪрд░ рдХреА рдкрд░рд┐рднрд╛рд╖рд╛
рдЪрд░ (Variable) рд╡рд╣ рд╡рд┐рд╢реЗрд╖рддрд╛, рд╕рдВрдЦреНрдпрд╛, рдпрд╛ рдорд╛рддреНрд░рд╛ рд╣реЛрддреА рд╣реИ рдЬреЛ рд╡рд┐рднрд┐рдиреНрди рдорд╛рди рд▓реЗ рд╕рдХрддреА рд╣реИред рдпрд╣ рд╡рд╣ рддрддреНрд╡ рд╣реИ рдЬрд┐рд╕реЗ рд╢реЛрдзрдХрд░реНрддрд╛ рдХрд┐рд╕реА рдЕрдзреНрдпрдпрди рдореЗрдВ рдорд╛рдкрддреЗ, рдирд┐рдпрдВрддреНрд░рд┐рдд рдХрд░рддреЗ рдпрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХрд░рддреЗ рд╣реИрдВред рдЪрд░ рдкреНрд░рдпреЛрдЧреЛрдВ рдореЗрдВ рд╡рд┐рднрд┐рдиреНрди рдкрд╣рд▓реБрдУрдВ рдЬреИрд╕реЗ рдЧреБрдг, рд╡реНрдпрд╡рд╣рд╛рд░, рд╕реНрдерд┐рддрд┐ рдпрд╛ рдкрд░рд┐рдгрд╛рдо рдХрд╛ рдкреНрд░рддрд┐рдирд┐рдзрд┐рддреНрд╡ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред
рдЙрджрд╛рд╣рд░рдг:
- рддрдирд╛рд╡ (Stress) рдкрд░ рдХрд┐рдП рдЧрдП рдПрдХ рдЕрдзреНрдпрдпрди рдореЗрдВ, рддрдирд╛рд╡ рд╕реНрддрд░ рдПрдХ рдЪрд░ рд╣реИ рдЬреЛ рдХрдо рд╕реЗ рдЙрдЪреНрдЪ рддрдХ рднрд┐рдиреНрди рд╣реЛ рд╕рдХрддрд╛ рд╣реИред
- рд░рдХреНрддрдЪрд╛рдк (Blood Pressure) рдкрд░ рдХрд┐рдП рдЧрдП рдПрдХ рдЕрдзреНрдпрдпрди рдореЗрдВ, рд░рдХреНрддрдЪрд╛рдк рд░реАрдбрд┐рдВрдЧ рдПрдХ рдЪрд░ рд╣реИ рдЬреЛ рд╡реНрдпрдХреНрддрд┐-рд╡реНрдпрдХреНрддрд┐ рднрд┐рдиреНрди рд╣реЛ рд╕рдХрддреА рд╣реИред
рдЕрдиреБрд╕рдВрдзрд╛рди рдореЗрдВ рдЪрд░реЛрдВ рдХрд╛ рдорд╣рддреНрд╡
рдЪрд░ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдХрд╛рд░реНрдпреЛрдВ рдореЗрдВ рд╕рд╣рд╛рдпрдХ рд╣реЛрддреЗ рд╣реИрдВ:
- рд╡рд┐рднрд┐рдиреНрди рдХрд╛рд░рдХреЛрдВ рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдз рдкрд╣рдЪрд╛рдирдирд╛ (рдЬреИрд╕реЗ, рдХреНрдпрд╛ рдиреАрдВрдж рдХреА рдЕрд╡рдзрд┐ рд╕реНрдорд░рдгрд╢рдХреНрддрд┐ рдХреЛ рдкреНрд░рднрд╛рд╡рд┐рдд рдХрд░рддреА рд╣реИ?)ред
- рдкрд░рд┐рдХрд▓реНрдкрдирд╛рдУрдВ рдХрд╛ рдкрд░реАрдХреНрд╖рдг рдФрд░ рд╕рд┐рджреНрдзрд╛рдВрддреЛрдВ рдХреА рдкреБрд╖реНрдЯрд┐ рдХрд░рдирд╛ред
- рдкреНрд░рдпреЛрдЧреЛрдВ рдореЗрдВ рд╣реЛрдиреЗ рд╡рд╛рд▓реЗ рдкрд░рд┐рд╡рд░реНрддрдиреЛрдВ рдХреЛ рдорд╛рдкрдирд╛ред
- рдбреЗрдЯрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгрд┐рдпрд╛рдВ рдХрд░рдирд╛ред
рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рдпрджрд┐ рдХреЛрдИ рд╢реЛрдзрдХрд░реНрддрд╛ рдпрд╣ рдЬрд╛рдВрдЪрдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рдХреЛрдИ рдирдИ рджрд╡рд╛ рдЪрд┐рдВрддрд╛ (Anxiety) рдХреЛ рдХрдо рдХрд░рддреА рд╣реИ, рддреЛ рд╡рд╣ рдЦреБрд░рд╛рдХ рдХреА рдорд╛рддреНрд░рд╛ (рд╕реНрд╡рддрдВрддреНрд░ рдЪрд░) рдФрд░ рдЪрд┐рдВрддрд╛ рд╕реНрддрд░ (рдЖрд╢реНрд░рд┐рдд рдЪрд░) рдХрд╛ рдорд╛рдкрди рдХрд░реЗрдЧрд╛ред
рдЪрд░ рдХреЗ рдкреНрд░рдХрд╛рд░
рдЪрд░ рдХреЛ рдЙрдирдХреЗ рдорд╛рдкрди рдФрд░ рдЕрдиреБрд╕рдВрдзрд╛рди рдореЗрдВ рдЙрдкрдпреЛрдЧ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рджреЛ рдкреНрд░рдореБрдЦ рд╡рд░реНрдЧреЛрдВ рдореЗрдВ рдмрд╛рдВрдЯрд╛ рдЧрдпрд╛ рд╣реИ:
- рд╢реНрд░реЗрдгреАрдп рдЪрд░ (Categorical Variables) тАУ рдЧреБрдгрд╛рддреНрдордХ (Qualitative)
- рдирд┐рд░рдВрддрд░ рдЪрд░ (Continuous Variables) тАУ рдорд╛рддреНрд░рд╛рддреНрдордХ (Quantitative)
1. рд╢реНрд░реЗрдгреАрдп рдЪрд░ (Categorical Variables)
рдкрд░рд┐рднрд╛рд╖рд╛
рд╢реНрд░реЗрдгреАрдп рдЪрд░ рд╡реЗ рд╣реЛрддреЗ рд╣реИрдВ рдЬреЛ рдХрд┐рд╕реА рд╡рд┐рд╢реЗрд╖рддрд╛ рдпрд╛ рдЧреБрдгрд╡рддреНрддрд╛ рдХреЛ рджрд░реНрд╢рд╛рддреЗ рд╣реИрдВ рдФрд░ рдЬрд┐рдиреНрд╣реЗрдВ рд╡рд┐рднрд┐рдиреНрди рд╢реНрд░реЗрдгрд┐рдпреЛрдВ рдпрд╛ рд╕рдореВрд╣реЛрдВ рдореЗрдВ рд╡рд░реНрдЧреАрдХреГрдд рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред рдЗрди рдЪрд░реЛрдВ рдореЗрдВ рдХреЛрдИ рд╕рдВрдЦреНрдпрд╛рддреНрдордХ рдорд╛рди рдирд╣реАрдВ рд╣реЛрддрд╛ рдЬрд┐рд╕реЗ рдЧрдгрд┐рддреАрдп рд░реВрдк рд╕реЗ рдорд╛рдкрд╛ рдпрд╛ рд╡реНрдпрд╡рд╕реНрдерд┐рдд рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХреЗред
рдЙрджрд╛рд╣рд░рдг:
- рд▓рд┐рдВрдЧ (Gender): рдкреБрд░реБрд╖, рдорд╣рд┐рд▓рд╛, рдЕрдиреНрдп
- рд╡реИрд╡рд╛рд╣рд┐рдХ рд╕реНрдерд┐рддрд┐ (Marital Status): рдЕрд╡рд┐рд╡рд╛рд╣рд┐рдд, рд╡рд┐рд╡рд╛рд╣рд┐рдд, рддрд▓рд╛рдХрд╢реБрджрд╛, рд╡рд┐рдзрд╡рд╛
- рдЖрдВрдЦреЛрдВ рдХрд╛ рд░рдВрдЧ (Eye Color): рднреВрд░рд╛, рдиреАрд▓рд╛, рд╣рд░рд╛
рд╢реНрд░реЗрдгреАрдп рдЪрд░реЛрдВ рдХреЗ рдкреНрд░рдХрд╛рд░
рд╢реНрд░реЗрдгреАрдп рдЪрд░ рдХреЛ рджреЛ рдкреНрд░рдХрд╛рд░реЛрдВ рдореЗрдВ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ:
A. рдирд╛рдордорд╛рддреНрд░рд┐рдХ рдЪрд░ (Nominal Variables)
- рдкрд░рд┐рднрд╛рд╖рд╛: рдирд╛рдордорд╛рддреНрд░рд┐рдХ рдЪрд░ рд╡реЗ рд╣реЛрддреЗ рд╣реИрдВ рдЬрд┐рдирдореЗрдВ рдХреЛрдИ рд╕реНрд╡рд╛рднрд╛рд╡рд┐рдХ рдХреНрд░рдо рдпрд╛ рд░реИрдВрдХрд┐рдВрдЧ рдирд╣реАрдВ рд╣реЛрддреАред
- рдЙрджрд╛рд╣рд░рдг:
- рд░рдХреНрдд рд╕рдореВрд╣ (A, B, AB, O)
- рдзрд░реНрдо (рд╣рд┐рдВрджреВ, рдореБрд╕реНрд▓рд┐рдо, рдИрд╕рд╛рдИ, рд╕рд┐рдЦ)
- рд░рд╛рдЬрдиреАрддрд┐рдХ рджрд▓ (рдХрд╛рдВрдЧреНрд░реЗрд╕, рднрд╛рдЬрдкрд╛, рдЖрдо рдЖрджрдореА рдкрд╛рд░реНрдЯреА)
- рдореБрдЦреНрдп рд╡рд┐рд╢реЗрд╖рддрд╛: рд╢реНрд░реЗрдгрд┐рдпрд╛рдВ рдПрдХ-рджреВрд╕рд░реЗ рд╕реЗ рдЕрд▓рдЧ рд╣реЛрддреА рд╣реИрдВ, рд▓реЗрдХрд┐рди рдЙрдирдХрд╛ рдХреЛрдИ рд╡рд┐рд╢реЗрд╖ рдХреНрд░рдо рдирд╣реАрдВ рд╣реЛрддрд╛ред
B. рдХреНрд░рдордмрджреНрдз рдЪрд░ (Ordinal Variables)
- рдкрд░рд┐рднрд╛рд╖рд╛: рдХреНрд░рдордмрджреНрдз рдЪрд░ рд╡реЗ рд╣реЛрддреЗ рд╣реИрдВ рдЬрд┐рдирдХреА рд╢реНрд░реЗрдгрд┐рдпрд╛рдВ рдПрдХ рдирд┐рд╢реНрдЪрд┐рдд рдХреНрд░рдо рдореЗрдВ рд╣реЛрддреА рд╣реИрдВ, рд▓реЗрдХрд┐рди рдЙрдирдХреЗ рдмреАрдЪ рдХрд╛ рдЕрдВрддрд░ рд╕рдорд╛рди рдирд╣реАрдВ рд╣реЛрддрд╛ред
- рдЙрджрд╛рд╣рд░рдг:
- рд╢рд┐рдХреНрд╖рд╛ рд╕реНрддрд░ (рдкреНрд░рд╛рдердорд┐рдХ, рдорд╛рдзреНрдпрдорд┐рдХ, рд╕реНрдирд╛рддрдХ, рдкрд░рд╛рд╕реНрдирд╛рддрдХ)
- рд╕рд╛рдорд╛рдЬрд┐рдХ-рдЖрд░реНрдерд┐рдХ рд╕реНрдерд┐рддрд┐ (рдирд┐рдореНрди, рдордзреНрдпрдо, рдЙрдЪреНрдЪ)
- рдЧреНрд░рд╛рд╣рдХ рд╕рдВрддреЛрд╖ (рдмрд╣реБрдд рдЕрд╕рдВрддреБрд╖реНрдЯ, рдЕрд╕рдВрддреБрд╖реНрдЯ, рд╕рдВрддреБрд╖реНрдЯ, рдмрд╣реБрдд рд╕рдВрддреБрд╖реНрдЯ)
- рдореБрдЦреНрдп рд╡рд┐рд╢реЗрд╖рддрд╛: рд╢реНрд░реЗрдгрд┐рдпрд╛рдВ рдХреНрд░рдо рдореЗрдВ рд╡реНрдпрд╡рд╕реНрдерд┐рдд рд╣реЛрддреА рд╣реИрдВ, рд▓реЗрдХрд┐рди рдЙрдирдХреЗ рдмреАрдЪ рдХрд╛ рдЕрдВрддрд░ рдирд┐рд╢реНрдЪрд┐рдд рдирд╣реАрдВ рд╣реЛрддрд╛ред
рд╢реНрд░реЗрдгреАрдп рдЪрд░реЛрдВ рдХрд╛ рдЕрдиреБрдкреНрд░рдпреЛрдЧ
рд╢реНрд░реЗрдгреАрдп рдЪрд░ рдХрд╛ рдЙрдкрдпреЛрдЧ рдореБрдЦреНрдп рд░реВрдк рд╕реЗ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдореЗрдВ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ:
- рд╕рд░реНрд╡реЗрдХреНрд╖рдг рдЕрдиреБрд╕рдВрдзрд╛рди (рдЬреИрд╕реЗ, рдЬрдирд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рдбреЗрдЯрд╛ рдПрдХрддреНрд░ рдХрд░рдирд╛)ред
- рдмрд╛рдЬрд╛рд░ рдЕрдиреБрд╕рдВрдзрд╛рди (рдЬреИрд╕реЗ, рдЧреНрд░рд╛рд╣рдХ рдкреНрд░рд╛рдердорд┐рдХрддрд╛рдПрдВ)ред
- рдореЗрдбрд┐рдХрд▓ рдЕрдзреНрдпрдпрди (рдЬреИрд╕реЗ, рд░реЛрдЧреЛрдВ рдХрд╛ рд╡рд░реНрдЧреАрдХрд░рдг)ред
рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рдПрдХ рдордиреЛрд╡реИрдЬреНрдЮрд╛рдирд┐рдХ рдпрджрд┐ рдорд╛рдирд╕рд┐рдХ рд╕реНрд╡рд╛рд╕реНрдереНрдп рд╡рд┐рдХрд╛рд░реЛрдВ рдХрд╛ рдЕрдзреНрдпрдпрди рдХрд░ рд░рд╣рд╛ рд╣реИ, рддреЛ рд╡рд╣ рдорд░реАрдЬреЛрдВ рдХреЛ “рдЪрд┐рдВрддрд╛,” “рдЕрд╡рд╕рд╛рдж,” рдФрд░ “рджреНрд╡рд┐рдзреНрд░реБрд╡реАрдп рд╡рд┐рдХрд╛рд░” рдЬреИрд╕реА рд╢реНрд░реЗрдгрд┐рдпреЛрдВ рдореЗрдВ рд╡рд░реНрдЧреАрдХреГрдд рдХрд░ рд╕рдХрддрд╛ рд╣реИред
2. рдирд┐рд░рдВрддрд░ рдЪрд░ (Continuous Variables)
рдкрд░рд┐рднрд╛рд╖рд╛
рдирд┐рд░рдВрддрд░ рдЪрд░ рд╡реЗ рд╣реЛрддреЗ рд╣реИрдВ рдЬрд┐рдирдореЗрдВ рд╕рдВрдЦреНрдпрд╛рддреНрдордХ рдорд╛рди рд╣реЛрддреЗ рд╣реИрдВ рдФрд░ рдЗрдиреНрд╣реЗрдВ рдПрдХ рдкреИрдорд╛рдиреЗ рдкрд░ рдорд╛рдкрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИред рдпреЗ рдЪрд░ рдЕрдирдВрдд рд╕рдВрдЦреНрдпрд╛рдУрдВ рдХрд╛ рдорд╛рди рд▓реЗ рд╕рдХрддреЗ рд╣реИрдВ рдФрд░ рдЙрдирдХреЗ рдмреАрдЪ рд╕реВрдХреНрд╖реНрдо рднрд┐рдиреНрдирддрд╛рдПрдБ рд╣реЛ рд╕рдХрддреА рд╣реИрдВред
рдЙрджрд╛рд╣рд░рдг:
- рдКрдВрдЪрд╛рдИ (Height): рд╕реЗрдореА рдпрд╛ рдЗрдВрдЪ рдореЗрдВ рдорд╛рдкреА рдЬрд╛рддреА рд╣реИред
- рд╡рдЬрди (Weight): рдХрд┐рд▓реЛрдЧреНрд░рд╛рдо рдпрд╛ рдкрд╛рдЙрдВрдб рдореЗрдВ рдорд╛рдкрд╛ рдЬрд╛рддрд╛ рд╣реИред
- рдЖрдпреБ (Age): рд╡рд░реНрд╖реЛрдВ, рдорд╣реАрдиреЛрдВ рдпрд╛ рджрд┐рдиреЛрдВ рдореЗрдВ рдорд╛рдкреА рдЬрд╛рддреА рд╣реИред
рдирд┐рд░рдВрддрд░ рдЪрд░реЛрдВ рдХреЗ рдкреНрд░рдХрд╛рд░
A. рдЕрдВрддрд░рд┐рдХ (Interval Variables)
- рдкрд░рд┐рднрд╛рд╖рд╛: рдЕрдВрддрд░рд┐рдХ рдЪрд░ рд╡реЗ рд╣реЛрддреЗ рд╣реИрдВ рдЬрд┐рдирдореЗрдВ рдореВрд▓реНрдпреЛрдВ рдХреЗ рдмреАрдЪ рдХрд╛ рдЕрдВрддрд░ рд╕рдорд╛рди рд╣реЛрддрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рдЗрдирдореЗрдВ рдПрдХ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рд╢реВрдиреНрдп рдмрд┐рдВрджреБ рдирд╣реАрдВ рд╣реЛрддрд╛ред
- рдЙрджрд╛рд╣рд░рдг:
- рддрд╛рдкрдорд╛рди (┬░C рдпрд╛ ┬░F) тАУ 0┬░C рдХрд╛ рдЕрд░реНрде “рдХреЛрдИ рддрд╛рдкрдорд╛рди рдирд╣реАрдВ” рдирд╣реАрдВ рд╣реЛрддрд╛ред
- IQ рд╕реНрдХреЛрд░ тАУ 0 IQ рдХрд╛ рдЕрд░реНрде “рдмреБрджреНрдзрд┐рдорддреНрддрд╛ рдХрд╛ рдкреВрд░реНрдг рдЕрднрд╛рд╡” рдирд╣реАрдВ рд╣реЛрддрд╛ред
- рдореБрдЦреНрдп рд╡рд┐рд╢реЗрд╖рддрд╛: рдореВрд▓реНрдпреЛрдВ рдХреЗ рдмреАрдЪ рд╕рдорд╛рди рдЕрдВрддрд░ рд╣реЛрддрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рд╢реВрдиреНрдп рдХрд╛ рдЕрд░реНрде “рдХреБрдЫ рди рд╣реЛрдирд╛” рдирд╣реАрдВ рд╣реЛрддрд╛ред
B. рдЕрдиреБрдкрд╛рдд рдЪрд░ (Ratio Variables)
- рдкрд░рд┐рднрд╛рд╖рд╛: рдЕрдиреБрдкрд╛рдд рдЪрд░ рд╡реЗ рд╣реЛрддреЗ рд╣реИрдВ рдЬрд┐рдирдореЗрдВ рд╕рднреА рдЕрдВрддрд░рд┐рдХ рдЪрд░ рдХреА рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдБ рд╣реЛрддреА рд╣реИрдВ, рд▓реЗрдХрд┐рди рдЗрдирдореЗрдВ рдПрдХ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рд╢реВрдиреНрдп рдмрд┐рдВрджреБ рд╣реЛрддрд╛ рд╣реИред
- рдЙрджрд╛рд╣рд░рдг:
- рдКрдВрдЪрд╛рдИ (0 рд╕реЗрдореА рдХрд╛ рдЕрд░реНрде рдХреЛрдИ рдКрдВрдЪрд╛рдИ рдирд╣реАрдВ)ред
- рд╡рдЬрди (0 рдХрд┐рдЧреНрд░рд╛ рдХрд╛ рдЕрд░реНрде рдХреЛрдИ рд╡рдЬрди рдирд╣реАрдВ)ред
- рдЖрдп (0 рд░реБрдкрдпреЗ рдХрд╛ рдЕрд░реНрде рдХреЛрдИ рдЖрдп рдирд╣реАрдВ)ред
- рдореБрдЦреНрдп рд╡рд┐рд╢реЗрд╖рддрд╛: рдЗрди рдореВрд▓реНрдпреЛрдВ рдХреЛ рдЕрдиреБрдкрд╛рддреЛрдВ рдореЗрдВ рддреБрд▓рдирд╛ рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИ (рдЬреИрд╕реЗ, 80 рдХрд┐рдЧреНрд░рд╛ рд╡рдЬрди 40 рдХрд┐рдЧреНрд░рд╛ рд╡рдЬрди рд╕реЗ рджреЛрдЧреБрдирд╛ рд╣реИ)ред
рдирд┐рд░рдВрддрд░ рдЪрд░реЛрдВ рдХрд╛ рдЕрдиреБрдкреНрд░рдпреЛрдЧ
рдирд┐рд░рдВрддрд░ рдЪрд░ рдХрд╛ рдЙрдкрдпреЛрдЧ рдореБрдЦреНрдп рд░реВрдк рд╕реЗ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдореЗрдВ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ:
- рдореЗрдбрд┐рдХрд▓ рдЕрдиреБрд╕рдВрдзрд╛рди (рдЬреИрд╕реЗ, рд░рдХреНрддрдЪрд╛рдк, рдХреЛрд▓реЗрд╕реНрдЯреНрд░реЙрд▓ рд╕реНрддрд░)ред
- рдордиреЛрд╡реИрдЬреНрдЮрд╛рдирд┐рдХ рдЕрдзреНрдпрдпрди (рдЬреИрд╕реЗ, рдкреНрд░рддрд┐рдХреНрд░рд┐рдпрд╛ рд╕рдордп, рдмреБрджреНрдзрд┐рдорддреНрддрд╛ рд╕реНрдХреЛрд░)ред
- рд╡рд┐рдЬреНрдЮрд╛рди рдФрд░ рдЗрдВрдЬреАрдирд┐рдпрд░рд┐рдВрдЧ (рдЬреИрд╕реЗ, рдЧрддрд┐, рддрд╛рдкрдорд╛рди)ред
рд╢реНрд░реЗрдгреАрдп рдФрд░ рдирд┐рд░рдВрддрд░ рдЪрд░реЛрдВ рдХреЗ рдмреАрдЪ рдореБрдЦреНрдп рдЕрдВрддрд░
рд╡рд┐рд╢реЗрд╖рддрд╛ | рд╢реНрд░реЗрдгреАрдп рдЪрд░ | рдирд┐рд░рдВрддрд░ рдЪрд░ |
рдкрд░рд┐рднрд╛рд╖рд╛ | рд╡рд┐рд╢реЗрд╖рддрд╛рдУрдВ рдпрд╛ рд╕рдореВрд╣реЛрдВ рдХрд╛ рдкреНрд░рддрд┐рдирд┐рдзрд┐рддреНрд╡ рдХрд░рддреЗ рд╣реИрдВ | рд╕рдВрдЦреНрдпрд╛рддреНрдордХ рдорд╛рди рд╣реЛрддреЗ рд╣реИрдВ рдЬреЛ рдорд╛рдкреЗ рдЬрд╛ рд╕рдХрддреЗ рд╣реИрдВ |
рдЙрджрд╛рд╣рд░рдг | рд▓рд┐рдВрдЧ (рдкреБрд░реБрд╖, рдорд╣рд┐рд▓рд╛), рд╢рд┐рдХреНрд╖рд╛ рд╕реНрддрд░ | рдКрдВрдЪрд╛рдИ (175 рд╕реЗрдореА), рддрд╛рдкрдорд╛рди (37.5┬░C) |
рдЧрдгрд┐рддреАрдп рд╕рдВрдЪрд╛рд▓рди | рд╕рдВрднрд╡ рдирд╣реАрдВ | рд╕рдВрднрд╡ (рдЬреЛрдбрд╝, рдЧреБрдгрд╛, рдФрд╕рдд) |
рдирд┐рд╖реНрдХрд░реНрд╖
рдЪрд░ рдЕрдиреБрд╕рдВрдзрд╛рди рдХрд╛ рдПрдХ рдЕрдирд┐рд╡рд╛рд░реНрдп рд╣рд┐рд╕реНрд╕рд╛ рд╣реИрдВ рдФрд░ рдЕрдзреНрдпрдпрди рдбрд┐рдЬрд╛рдЗрди, рдбреЗрдЯрд╛ рд╕рдВрдЧреНрд░рд╣, рдФрд░ рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдореЗрдВ рдорд╣рддреНрд╡рдкреВрд░реНрдг рднреВрдорд┐рдХрд╛ рдирд┐рднрд╛рддреЗ рд╣реИрдВред рд╢реНрд░реЗрдгреАрдп рдЪрд░ рд╡рд░реНрдЧреАрдХрд░рдг рдФрд░ рд╕рдореВрд╣рдмрджреНрдз рдбреЗрдЯрд╛ рдореЗрдВ рд╕рд╣рд╛рдпрдХ рд╣реЛрддреЗ рд╣реИрдВ, рдЬрдмрдХрд┐ рдирд┐рд░рдВрддрд░ рдЪрд░ рд╕рдЯреАрдХ рдорд╛рдк рдФрд░ рдЧрдгрд┐рддреАрдп рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдореЗрдВ рдЙрдкрдпреЛрдЧ рдХрд┐рдП рдЬрд╛рддреЗ рд╣реИрдВред
рдЪрд░ рдХреА рд╕рд╣реА рдкрд╣рдЪрд╛рди рдФрд░ рд╡рд░реНрдЧреАрдХрд░рдг рд╕реЗ рдЕрдиреБрд╕рдВрдзрд╛рди рдХреА рд╕рдЯреАрдХрддрд╛, рд╡рд┐рд╢реНрд╡рд╕рдиреАрдпрддрд╛ рдФрд░ рд╡реИрдзрддрд╛ рдореЗрдВ рд╕реБрдзрд╛рд░ рд╣реЛрддрд╛ рд╣реИ,
рдЬрд┐рд╕рд╕реЗ рдЕрдзрд┐рдХ рдкреНрд░рднрд╛рд╡реА рдЕрдзреНрдпрдпрди рдФрд░ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рджреБрдирд┐рдпрд╛ рдореЗрдВ рдЕрдиреБрдкреНрд░рдпреЛрдЧ рд╕рдВрднрд╡ рд╣реЛрддреЗ рд╣реИрдВред
UNIT-1 (1.2) Variables: Meaning and Types (Categorical and Continuous)
Introduction
Variables play a fundamental role in research and data analysis, forming the backbone of scientific investigations across various fields, including psychology, social sciences, and natural sciences. Understanding variables is crucial for designing studies, analyzing data, and interpreting results accurately.
This essay explores the meaning of variables, their significance in research, and the primary types, focusing on categorical and continuous variables. Additionally, it discusses their applications, examples, and key differences.
Meaning of Variables
Definition of a Variable
A variable is any characteristic, number, or quantity that can take different values. It is something that researchers measure, manipulate, or analyze in a study. Variables can represent different aspects of an experiment, such as traits, behaviors, conditions, or outcomes.
For example:
- In a psychological study on stress, stress level is a variable that can vary from low to high.
- In a medical study on blood pressure, blood pressure readings are variables that change from person to person.
Importance of Variables in Research
Variables help researchers:
- Identify relationships between different factors (e.g., Does sleep duration affect memory performance?).
- Test hypotheses and validate theories.
- Measure changes in an experimental setting.
- Make predictions based on data analysis.
For example, in an experiment to test whether a new drug reduces anxiety, variables such as dosage amount (independent variable) and anxiety level (dependent variable) help measure the drugтАЩs effect.
Types of Variables
Variables are classified based on how they are measured and used in research. The two major types are:
- Categorical Variables (Qualitative)
- Continuous Variables (Quantitative)
1. Categorical Variables (Qualitative Variables)
Definition
Categorical variables represent characteristics or qualities that can be grouped into categories or labels. These variables do not have a numerical value that can be meaningfully measured or ordered in a standard way.
For example:
- Gender (Male, Female, Other)
- Marital Status (Single, Married, Divorced, Widowed)
- Eye Color (Brown, Blue, Green)
Types of Categorical Variables
Categorical variables can be divided into two subtypes:
A. Nominal Variables
- Definition: Nominal variables represent categories with no inherent order or ranking.
- Examples:
- Blood type (A, B, AB, O)
- Religion (Christianity, Islam, Hinduism, Buddhism)
- Political Party (Democrat, Republican, Independent)
- Key Characteristic: The categories are mutually exclusive (each person fits into only one category), but they cannot be arranged in a meaningful sequence.
B. Ordinal Variables
- Definition: Ordinal variables have categories that follow a logical order or ranking, but the difference between the categories is not necessarily equal.
- Examples:
- Education Level (Primary, Secondary, College, Postgraduate)
- Socioeconomic Status (Low, Middle, High)
- Customer Satisfaction (Very Dissatisfied, Dissatisfied, Neutral, Satisfied, Very Satisfied)
- Key Characteristic: The categories have a rank order, but the intervals between them are not uniform.
Applications of Categorical Variables
Categorical variables are widely used in:
- Survey research (e.g., collecting demographic data).
- Market research (e.g., customer preferences).
- Epidemiology (e.g., disease classification).
For example, a researcher studying mental health disorders may classify patients into categories such as “Anxiety,” “Depression,” and “Bipolar Disorder.”
2. Continuous Variables (Quantitative Variables)
Definition
Continuous variables are numerical values that can be measured on a scale and can take an infinite number of values within a given range.
For example:
- Height (measured in cm or inches)
- Weight (measured in kg or pounds)
- Age (measured in years, months, or days)
Types of Continuous Variables
Continuous variables can be further divided into two types:
A. Interval Variables
- Definition: Interval variables have numerical values where the difference between numbers is meaningful, but there is no true zero point.
- Examples:
- Temperature in Celsius or Fahrenheit (0┬░C does not mean “no temperature”).
- IQ Scores (An IQ of 0 does not indicate an absence of intelligence).
- SAT Scores (A score of 0 does not mean a total lack of ability).
- Key Characteristic: The difference between values is consistent, but the zero point is arbitrary (not a true absence of the measured property).
B. Ratio Variables
- Definition: Ratio variables have all the properties of interval variables, but they include a true zero (meaning “zero” represents an absence of the property).
- Examples:
- Height (0 cm means no height).
- Weight (0 kg means no weight).
- Income (0 dollars means no money).
- Key Characteristic: The data can be compared using ratios (e.g., a person weighing 80 kg is twice as heavy as a person weighing 40 kg).
Applications of Continuous Variables
Continuous variables are commonly used in:
- Medical research (e.g., tracking blood pressure, cholesterol levels).
- Psychological studies (e.g., measuring response times, intelligence scores).
- Physical sciences (e.g., recording temperature changes, measuring speed).
For example, a psychologist studying reaction time may measure how long (in milliseconds) it takes for participants to respond to a stimulus.
Key Differences Between Categorical and Continuous Variables
Feature | Categorical Variables | Continuous Variables |
Definition | Represent characteristics or categories | Represent numerical values measured on a scale |
Types | Nominal and Ordinal | Interval and Ratio |
Measurement | Cannot be measured numerically | Can be measured with precision |
Example Values | Gender (Male, Female), Education Level (Primary, Secondary) | Height (175 cm), Temperature (37.5┬░C) |
Arithmetic Operations | Cannot perform mathematical operations | Can perform mathematical operations (addition, multiplication, etc.) |
Graphical Representation | Bar charts, Pie charts | Histograms, Line graphs |
For example, hair color is a categorical variable, while body weight is a continuous variable because it can take precise values like 65.8 kg.
Conclusion
Variables are an essential part of research, influencing study design, data collection, and statistical analysis. Understanding categorical variables (which describe qualities or groups) and continuous variables (which measure numerical values) helps researchers make informed decisions when analyzing data.
While categorical variables help in grouping and classifying data, continuous variables allow precise measurements and mathematical operations. Both types play a crucial role in scientific research, helping to draw meaningful conclusions and advance knowledge across disciplines.
By correctly identifying and categorizing variables, researchers can enhance the accuracy, reliability, and validity of their findings, leading to more effective studies and real-world applications.
UNIT-1 (1.3) Levels of Measurement- Nominal, Ordinal, Interval, and Ratio.
рдорд╛рдкрди рдХреЗ рд╕реНрддрд░ (Levels of Measurement): рдирд╛рдордорд╛рддреНрд░рд┐рдХ, рдХреНрд░рдордмрджреНрдз, рдЕрдВрддрд░рд┐рдХ, рдФрд░ рдЕрдиреБрдкрд╛рдд
рдкрд░рд┐рдЪрдп
рдорд╛рдкрди (Measurement) рдХрд┐рд╕реА рднреА рдЕрдиреБрд╕рдВрдзрд╛рди рдФрд░ рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХрд╛ рдПрдХ рдореВрд▓рднреВрдд рдкрд╣рд▓реВ рд╣реИред рдбреЗрдЯрд╛ рдХреЛ рдкреНрд░рднрд╛рд╡реА рдврдВрдЧ рд╕реЗ рдПрдХрддреНрд░ рдХрд░рдиреЗ, рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХрд░рдиреЗ рдФрд░ рдЙрд╕рдХреА рд╡реНрдпрд╛рдЦреНрдпрд╛ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╢реЛрдзрдХрд░реНрддрд╛ рдЗрд╕реЗ рд╡рд┐рднрд┐рдиреНрди рд╕реНрддрд░реЛрдВ рдкрд░ рд╡рд░реНрдЧреАрдХреГрдд рдХрд░рддреЗ рд╣реИрдВред рд╕реНрдЯреИрдирд▓реА рд╕реНрдорд┐рде рд╕реНрдЯреАрд╡рдВрд╕ (Stanley Smith Stevens) рдиреЗ 1946 рдореЗрдВ рдорд╛рдкрди рдХреЗ рдЪрд╛рд░ рдкреНрд░рдореБрдЦ рд╕реНрддрд░реЛрдВ рдХреА рдкрд░рд┐рднрд╛рд╖рд╛ рджреА:
- рдирд╛рдордорд╛рддреНрд░рд┐рдХ рд╕реНрддрд░ (Nominal Level)
- рдХреНрд░рдордмрджреНрдз рд╕реНрддрд░ (Ordinal Level)
- рдЕрдВрддрд░рд┐рдХ рд╕реНрддрд░ (Interval Level)
- рдЕрдиреБрдкрд╛рдд рд╕реНрддрд░ (Ratio Level)
рдкреНрд░рддреНрдпреЗрдХ рдорд╛рдкрди рд╕реНрддрд░ рдпрд╣ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХрд░рддрд╛ рд╣реИ рдХрд┐ рдбреЗрдЯрд╛ рдкрд░ рдХреМрди рд╕реЗ рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рд╕рдВрдЪрд╛рд▓рди рдХрд┐рдП рдЬрд╛ рд╕рдХрддреЗ рд╣реИрдВ рдФрд░ рдбреЗрдЯрд╛ рдХреА рд╡реНрдпрд╛рдЦреНрдпрд╛ рдХреИрд╕реЗ рдХреА рдЬрд╛рдиреА рдЪрд╛рд╣рд┐рдПред рдЗрд╕ рдирд┐рдмрдВрдз рдореЗрдВ рдЗрди рдЪрд╛рд░ рд╕реНрддрд░реЛрдВ рдХрд╛ рд╡рд┐рд╕реНрддреГрдд рдЕрдзреНрдпрдпрди рдХрд┐рдпрд╛ рдЬрд╛рдПрдЧрд╛, рдЬрд┐рд╕рдореЗрдВ рдЙрдирдХреА рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдБ, рднрд┐рдиреНрдирддрд╛рдПрдБ рдФрд░ рдЕрдиреБрдкреНрд░рдпреЛрдЧ рд╢рд╛рдорд┐рд▓ рд╣реЛрдВрдЧреЗред
1. рдирд╛рдордорд╛рддреНрд░рд┐рдХ рд╕реНрддрд░ (Nominal Level of Measurement)
рдкрд░рд┐рднрд╛рд╖рд╛
рдирд╛рдордорд╛рддреНрд░рд┐рдХ рдорд╛рдкрди рд╕реНрддрд░ рдЙрди рдЪрд░реЛрдВ рдХреЛ рд╕рдВрджрд░реНрднрд┐рдд рдХрд░рддрд╛ рд╣реИ рдЬреЛ рдбреЗрдЯрд╛ рдХреЛ рд╡рд┐рднрд┐рдиреНрди рд╕рдореВрд╣реЛрдВ рдпрд╛ рд╢реНрд░реЗрдгрд┐рдпреЛрдВ рдореЗрдВ рд╡рд░реНрдЧреАрдХреГрдд рдХрд░рддреЗ рд╣реИрдВ, рд▓реЗрдХрд┐рди рдЙрдирдореЗрдВ рдХреЛрдИ рд╡рд┐рд╢реЗрд╖ рдХреНрд░рдо (Ranking) рдирд╣реАрдВ рд╣реЛрддрд╛ред
рдореБрдЦреНрдп рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдБ
- рдЧреБрдгрд╛рддреНрдордХ (Qualitative) рдбреЗрдЯрд╛ тАУ рдпрд╣ рдорд╛рддреНрд░рд╛рддреНрдордХ рди рд╣реЛрдХрд░ рд╡рд┐рд╢реЗрд╖рддрд╛рдУрдВ рдХреЛ рджрд░реНрд╢рд╛рддрд╛ рд╣реИред
- рдХреЛрдИ рд╡рд┐рд╢реЗрд╖ рдХреНрд░рдо рдирд╣реАрдВ тАУ рд╢реНрд░реЗрдгрд┐рдпреЛрдВ рдХреЛ рдХрд┐рд╕реА рд╡рд┐рд╢реЗрд╖ рдЕрдиреБрдХреНрд░рдо рдореЗрдВ рд╡реНрдпрд╡рд╕реНрдерд┐рдд рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ред
- рдПрдХ-рджреВрд╕рд░реЗ рд╕реЗ рдЕрд▓рдЧ рд╢реНрд░реЗрдгрд┐рдпрд╛рдБ тАУ рдкреНрд░рддреНрдпреЗрдХ рдбреЗрдЯрд╛ рдмрд┐рдВрджреБ рдХреЗрд╡рд▓ рдПрдХ рд╣реА рд╢реНрд░реЗрдгреА рдореЗрдВ рдЖрддрд╛ рд╣реИред
- рдХреЛрдИ рдЧрдгрд┐рддреАрдп рд╕рдВрдЪрд╛рд▓рди рдирд╣реАрдВ тАУ рдЗрд╕рдореЗрдВ рдЬреЛрдбрд╝, рдШрдЯрд╛рд╡ рдЬреИрд╕реЗ рдЧрдгрд┐рддреАрдп рд╕рдВрдЪрд╛рд▓рди рд╕рдВрднрд╡ рдирд╣реАрдВ рд╣реЛрддреЗред
рдЙрджрд╛рд╣рд░рдг
- рд▓рд┐рдВрдЧ (Gender): рдкреБрд░реБрд╖, рдорд╣рд┐рд▓рд╛, рдЕрдиреНрдп
- рд░рдХреНрдд рд╕рдореВрд╣ (Blood Type): A, B, AB, O
- рд░рд╛рд╖реНрдЯреНрд░реАрдпрддрд╛ (Nationality): рднрд╛рд░рддреАрдп, рдЕрдореЗрд░рд┐рдХреА, рдЪреАрдиреА, рдлреНрд░рд╛рдВрд╕реАрд╕реА
- рд░рд╛рдЬрдиреАрддрд┐рдХ рджрд▓ (Political Party): рднрд╛рдЬрдкрд╛, рдХрд╛рдВрдЧреНрд░реЗрд╕, рдЖрдк
- рд╡реИрд╡рд╛рд╣рд┐рдХ рд╕реНрдерд┐рддрд┐ (Marital Status): рдЕрд╡рд┐рд╡рд╛рд╣рд┐рдд, рд╡рд┐рд╡рд╛рд╣рд┐рдд, рддрд▓рд╛рдХрд╢реБрджрд╛
рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рд╡рд┐рдзрд┐рдпрд╛рдБ
- рдореЛрдб (Mode) тАУ рд╕рдмрд╕реЗ рдЕрдзрд┐рдХ рдмрд╛рд░ рдЖрдиреЗ рд╡рд╛рд▓реА рд╢реНрд░реЗрдгреА рдХреЛ рдкрд╣рдЪрд╛рдирдирд╛ред
- рдЪреА-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг (Chi-square test) тАУ рд╡рд┐рднрд┐рдиреНрди рдирд╛рдордорд╛рддреНрд░рд┐рдХ рдЪрд░реЛрдВ рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдз рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдПред
рдЕрдиреБрдкреНрд░рдпреЛрдЧ
- рдмрд╛рдЬрд╛рд░ рдЕрдиреБрд╕рдВрдзрд╛рди тАУ рдЧреНрд░рд╛рд╣рдХреЛрдВ рдХреА рдкреНрд░рд╛рдердорд┐рдХрддрд╛рдУрдВ рдХрд╛ рд╡рд░реНрдЧреАрдХрд░рдгред
- рд╕реНрд╡рд╛рд╕реНрдереНрдп рдЕрдиреБрд╕рдВрдзрд╛рди тАУ рдмреАрдорд╛рд░рд┐рдпреЛрдВ рдХреЗ рдкреНрд░рдХрд╛рд░реЛрдВ рдХрд╛ рд╡рд░реНрдЧреАрдХрд░рдгред
- рд╕рд╛рдорд╛рдЬрд┐рдХ рдЕрдзреНрдпрдпрди тАУ рдЬрд╛рддреАрдпрддрд╛ рдФрд░ рд╕рд╛рдВрд╕реНрдХреГрддрд┐рдХ рдкреГрд╖реНрдарднреВрдорд┐ рдХрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдгред
рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рдпрджрд┐ рдХреЛрдИ рд╢реЛрдзрдХрд░реНрддрд╛ рд░рд╛рдЬрдиреАрддрд┐рдХ рдкреНрд░рд╛рдердорд┐рдХрддрд╛рдУрдВ рдХрд╛ рдЕрдзреНрдпрдпрди рдХрд░ рд░рд╣рд╛ рд╣реИ рдФрд░ рдЙрддреНрддрд░рджрд╛рддрд╛рдУрдВ рдХреЛ рднрд╛рдЬрдкрд╛, рдХрд╛рдВрдЧреНрд░реЗрд╕, рдЖрдк рдЬреИрд╕реЗ рд╕рдореВрд╣реЛрдВ рдореЗрдВ рд╡рд░реНрдЧреАрдХреГрдд рдХрд░рддрд╛ рд╣реИ, рддреЛ рдЗрди рд╢реНрд░реЗрдгрд┐рдпреЛрдВ рдореЗрдВ рдХреЛрдИ рд╕реНрд╡рд╛рднрд╛рд╡рд┐рдХ рдХреНрд░рдо рдирд╣реАрдВ рд╣реЛрдЧрд╛ред
2. рдХреНрд░рдордмрджреНрдз рд╕реНрддрд░ (Ordinal Level of Measurement)
рдкрд░рд┐рднрд╛рд╖рд╛
рдХреНрд░рдордмрджреНрдз рд╕реНрддрд░ рд╡рд╣ рдбреЗрдЯрд╛ рдорд╛рдкрддрд╛ рд╣реИ рдЬрд┐рд╕реЗ рдХрд┐рд╕реА рддрд╛рд░реНрдХрд┐рдХ рдЕрдиреБрдХреНрд░рдо рдореЗрдВ рд╡реНрдпрд╡рд╕реНрдерд┐рдд рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рд╢реНрд░реЗрдгрд┐рдпреЛрдВ рдХреЗ рдмреАрдЪ рдХрд╛ рдЕрдВрддрд░ рд╕рдорд╛рди рдирд╣реАрдВ рд╣реЛрддрд╛ред
рдореБрдЦреНрдп рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдБ
- рдЧреБрдгрд╛рддреНрдордХ рдпрд╛ рдорд╛рддреНрд░рд╛рддреНрдордХ рдбреЗрдЯрд╛ тАУ рдЗрд╕рдореЗрдВ рд╢реНрд░реЗрдгрд┐рдпрд╛рдБ рдФрд░ рд╕рдВрдЦреНрдпрд╛рдПрдБ рджреЛрдиреЛрдВ рд╣реЛ рд╕рдХрддреЗ рд╣реИрдВред
- рддрд╛рд░реНрдХрд┐рдХ рдХреНрд░рдо (Order) рд╣реЛрддрд╛ рд╣реИ тАУ рдбреЗрдЯрд╛ рдХреЛ рдЙрдЪреНрдЪ рдпрд╛ рдирд┐рдореНрди рдХреНрд░рдо рдореЗрдВ рд╡реНрдпрд╡рд╕реНрдерд┐рдд рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИред
- рдЕрд╕рдорд╛рди рдЕрдВрддрд░рд╛рд▓ (Unequal Intervals) тАУ рд╢реНрд░реЗрдгрд┐рдпреЛрдВ рдХреЗ рдмреАрдЪ рдХрд╛ рдЕрдВрддрд░ рдПрдХ рд╕рдорд╛рди рдирд╣реАрдВ рд╣реЛрддрд╛ред
- рд╕реАрдорд┐рдд рдЧрдгрд┐рддреАрдп рд╕рдВрдЪрд╛рд▓рди тАУ рдХреЗрд╡рд▓ рддреБрд▓рдирд╛ (рдЕрдзрд┐рдХ рдпрд╛ рдХрдо) рдХреА рдЬрд╛ рд╕рдХрддреА рд╣реИред
рдЙрджрд╛рд╣рд░рдг
- рд╢рд┐рдХреНрд╖рд╛ рд╕реНрддрд░ (Education Level): рдкреНрд░рд╛рдердорд┐рдХ, рдорд╛рдзреНрдпрдорд┐рдХ, рд╕реНрдирд╛рддрдХ, рдкрд░рд╛рд╕реНрдирд╛рддрдХ
- рд╕рд╛рдорд╛рдЬрд┐рдХ-рдЖрд░реНрдерд┐рдХ рд╕реНрдерд┐рддрд┐ (Socioeconomic Status): рдирд┐рдореНрди, рдордзреНрдпрдо, рдЙрдЪреНрдЪ
- рдЧреНрд░рд╛рд╣рдХ рд╕рдВрддреЛрд╖ (Customer Satisfaction): рдмрд╣реБрдд рдЕрд╕рдВрддреБрд╖реНрдЯ, рдЕрд╕рдВрддреБрд╖реНрдЯ, рд╕рдВрддреБрд╖реНрдЯ, рдмрд╣реБрдд рд╕рдВрддреБрд╖реНрдЯ
- рджрд░реНрдж рдХреА рддреАрд╡реНрд░рддрд╛ (Pain Severity): рд╣рд▓реНрдХрд╛, рдордзреНрдпрдо, рддреАрд╡реНрд░
рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рд╡рд┐рдзрд┐рдпрд╛рдБ
- рдорд╛рдзреНрдпрд┐рдХрд╛ (Median) рдФрд░ рдореЛрдб (Mode) тАУ рд▓реЗрдХрд┐рди рдорд╛рдзреНрдп (Mean) рдХрд╛ рдЙрдкрдпреЛрдЧ рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ред
- рд╕реНрдкреАрдпрд░рдореИрди рд░реИрдВрдХ рд╕рд╣рд╕рдВрдмрдВрдз (SpearmanтАЩs Rank Correlation) тАУ рджреЛ рдХреНрд░рдордмрджреНрдз рдЪрд░реЛрдВ рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдз рдорд╛рдкрдиреЗ рдХреЗ рд▓рд┐рдПред
рдЕрдиреБрдкреНрд░рдпреЛрдЧ
- рд╕рд░реНрд╡реЗрдХреНрд╖рдг рдЕрдиреБрд╕рдВрдзрд╛рди тАУ рдЧреНрд░рд╛рд╣рдХ рд╕рдВрддреБрд╖реНрдЯрд┐ рдХрд╛ рдЖрдХрд▓рди рдХрд░рдирд╛ред
- рдЪрд┐рдХрд┐рддреНрд╕рд╛ рдЕрдзреНрдпрдпрди тАУ рджрд░реНрдж рдХреЗ рд╕реНрддрд░ рдХреЛ рд░реИрдВрдХ рдХрд░рдирд╛ред
- рд╢рд┐рдХреНрд╖рд╛ рдЕрдиреБрд╕рдВрдзрд╛рди тАУ рдЧреНрд░реЗрдбрд┐рдВрдЧ рдкреНрд░рдгрд╛рд▓реА (A, B, C, D)ред
рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рд╣реЛрдЯрд▓ рд░реЗрдЯрд┐рдВрдЧ рдореЗрдВ 5-рд╕реНрдЯрд╛рд░ рд╣реЛрдЯрд▓ рдХреЛ 3-рд╕реНрдЯрд╛рд░ рд╣реЛрдЯрд▓ рд╕реЗ рдмреЗрд╣рддрд░ рдорд╛рдирд╛ рдЬрд╛рддрд╛ рд╣реИ, рд▓реЗрдХрд┐рди 3-рд╕реНрдЯрд╛рд░ рдФрд░ 4-рд╕реНрдЯрд╛рд░ рдХреЗ рдмреАрдЪ рдХреА рдЧреБрдгрд╡рддреНрддрд╛ рдореЗрдВ рдЕрдВрддрд░ рд╕рдорд╛рди рдирд╣реАрдВ рд╣реЛ рд╕рдХрддрд╛ред
3. рдЕрдВрддрд░рд┐рдХ рд╕реНрддрд░ (Interval Level of Measurement)
рдкрд░рд┐рднрд╛рд╖рд╛
рдЕрдВрддрд░рд┐рдХ рд╕реНрддрд░ рдореЗрдВ рдбреЗрдЯрд╛ рдХреЛ рдорд╛рдкрд╛ рдЬрд╛рддрд╛ рд╣реИ рдФрд░ рдЙрд╕рдХреЗ рдорд╛рдиреЛрдВ рдХреЗ рдмреАрдЪ рд╕рдорд╛рди рдЕрдВрддрд░ рд╣реЛрддрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рдЗрд╕рдореЗрдВ рдПрдХ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рд╢реВрдиреНрдп рдмрд┐рдВрджреБ рдирд╣реАрдВ рд╣реЛрддрд╛ред
рдореБрдЦреНрдп рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдБ
- рдорд╛рддреНрд░рд╛рддреНрдордХ рдбреЗрдЯрд╛ тАУ рдХреЗрд╡рд▓ рд╕рдВрдЦреНрдпрд╛рддреНрдордХ рдорд╛рди рд╣реЛрддреЗ рд╣реИрдВред
- рддрд╛рд░реНрдХрд┐рдХ рдХреНрд░рдо тАУ рдбреЗрдЯрд╛ рдПрдХ рдЕрдиреБрдХреНрд░рдо рдореЗрдВ рд╡реНрдпрд╡рд╕реНрдерд┐рдд рд╣реЛрддрд╛ рд╣реИред
- рд╕рдорд╛рди рдЕрдВрддрд░рд╛рд▓ тАУ рд╕рдВрдЦреНрдпрд╛рдУрдВ рдХреЗ рдмреАрдЪ рд╕рдорд╛рди рдЕрдВрддрд░ рд╣реЛрддрд╛ рд╣реИред
- рдХреЛрдИ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рд╢реВрдиреНрдп рдирд╣реАрдВ тАУ рд╢реВрдиреНрдп рдмрд┐рдВрджреБ рдХрд╛ рдХреЛрдИ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рдЕрд░реНрде рдирд╣реАрдВ рд╣реЛрддрд╛ред
рдЙрджрд╛рд╣рд░рдг
- рддрд╛рдкрдорд╛рди (Temperature): 0┬░C рдХрд╛ рдЕрд░реНрде “рдХреЛрдИ рддрд╛рдкрдорд╛рди рдирд╣реАрдВ” рдирд╣реАрдВ рд╣реЛрддрд╛ред
- рдЖрдИрдХреНрдпреВ рд╕реНрдХреЛрд░ (IQ Scores): 0 IQ рдХрд╛ рдЕрд░реНрде “рдмреБрджреНрдзрд┐рдорддреНрддрд╛ рдХрд╛ рдкреВрд░реНрдг рдЕрднрд╛рд╡” рдирд╣реАрдВ рд╣реЛрддрд╛ред
рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рд╡рд┐рдзрд┐рдпрд╛рдБ
- рдФрд╕рдд (Mean), рдорд╛рдзреНрдпрд┐рдХрд╛ (Median), рдФрд░ рдореЛрдб (Mode) рдХреА рдЧрдгрдирд╛ рдХреА рдЬрд╛ рд╕рдХрддреА рд╣реИред
рдЕрдиреБрдкреНрд░рдпреЛрдЧ
- рдордиреЛрд╡реИрдЬреНрдЮрд╛рдирд┐рдХ рдЕрдзреНрдпрдпрди тАУ рдЖрдИрдХреНрдпреВ рдкрд░реАрдХреНрд╖рдгред
- рд╢реИрдХреНрд╖рд┐рдХ рдЕрдиреБрд╕рдВрдзрд╛рди тАУ рдкрд░реАрдХреНрд╖рд╛ рд╕реНрдХреЛрд░ред
4. рдЕрдиреБрдкрд╛рдд рд╕реНрддрд░ (Ratio Level of Measurement)
рдкрд░рд┐рднрд╛рд╖рд╛
рдЕрдиреБрдкрд╛рдд рд╕реНрддрд░ рдЕрдВрддрд░рд┐рдХ рд╕реНрддрд░ рдХреЗ рд╕рдорд╛рди рд╣реЛрддрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рдЗрд╕рдореЗрдВ рдПрдХ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рд╢реВрдиреНрдп рдмрд┐рдВрджреБ рд╣реЛрддрд╛ рд╣реИред
рдореБрдЦреНрдп рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдБ
- рдорд╛рддреНрд░рд╛рддреНрдордХ рдбреЗрдЯрд╛ тАУ рдХреЗрд╡рд▓ рд╕рдВрдЦреНрдпрд╛рддреНрдордХ рдорд╛рдиред
- рд╕рдорд╛рди рдЕрдВрддрд░рд╛рд▓ тАУ рдорд╛рдк рдХреЗ рдмреАрдЪ рд╕рдорд╛рди рдЕрдВрддрд░ рд╣реЛрддрд╛ рд╣реИред
- рд╕рдЪреНрдЪрд╛ рд╢реВрдиреНрдп рдмрд┐рдВрджреБ тАУ 0 рдХрд╛ рдЕрд░реНрде рдкреВрд░реНрдг рдЕрдиреБрдкрд╕реНрдерд┐рддрд┐ рд╣реЛрддрд╛ рд╣реИред
рдЙрджрд╛рд╣рд░рдг
- рдКрдВрдЪрд╛рдИ (Height): 0 рд╕реЗрдореА рдХрд╛ рдЕрд░реНрде “рдХреЛрдИ рдКрдВрдЪрд╛рдИ рдирд╣реАрдВ”ред
- рд╡рдЬрди (Weight): 0 рдХрд┐рдЧреНрд░рд╛ рдХрд╛ рдЕрд░реНрде “рдХреЛрдИ рд╡рдЬрди рдирд╣реАрдВ”ред
- рд╕рдордп (Time): 0 рд╕реЗрдХрдВрдб рдХрд╛ рдЕрд░реНрде “рдХреЛрдИ рд╕рдордп рдирд╣реАрдВ”ред
рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рд╡рд┐рдзрд┐рдпрд╛рдБ
- рд╕рднреА рдЧрдгрд┐рддреАрдп рд╕рдВрдЪрд╛рд▓рди тАУ рдЬреЛрдбрд╝, рдШрдЯрд╛рд╡, рдЧреБрдгрд╛, рднрд╛рдЧред
рдЕрдиреБрдкреНрд░рдпреЛрдЧ
- рдЪрд┐рдХрд┐рддреНрд╕рд╛ рдЕрдиреБрд╕рдВрдзрд╛рди тАУ рд░рдХреНрддрдЪрд╛рдк, рд╣реГрджрдп рдЧрддрд┐ред
- рдЕрд░реНрдерд╢рд╛рд╕реНрддреНрд░ рдФрд░ рд╡реНрдпрд╡рд╕рд╛рдп тАУ рдЖрдп, рдореБрдирд╛рдлрд╛ред
рдирд┐рд╖реНрдХрд░реНрд╖
рдЪрд╛рд░ рдорд╛рдкрди рд╕реНрддрд░реЛрдВ рдХреЛ рд╕рдордЭрдирд╛ рдЖрд╡рд╢реНрдпрдХ рд╣реИ:
- рдирд╛рдордорд╛рддреНрд░рд┐рдХ рд╕реНрддрд░ тАУ рдХреЗрд╡рд▓ рд╡рд░реНрдЧреАрдХрд░рдгред
- рдХреНрд░рдордмрджреНрдз рд╕реНрддрд░ тАУ рд░реИрдВрдХрд┐рдВрдЧ рд╕рдВрднрд╡ рд▓реЗрдХрд┐рди рдЕрдВрддрд░рд╛рд▓ рд╕рдорд╛рди рдирд╣реАрдВред
- рдЕрдВрддрд░рд┐рдХ рд╕реНрддрд░ тАУ рд╕рдорд╛рди рдЕрдВрддрд░рд╛рд▓ рд▓реЗрдХрд┐рди рд╡рд╛рд╕реНрддрд╡рд┐рдХ рд╢реВрдиреНрдп рдирд╣реАрдВред
- рдЕрдиреБрдкрд╛рдд рд╕реНрддрд░ тАУ рд╕рдорд╛рди рдЕрдВрддрд░рд╛рд▓ рдФрд░ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рд╢реВрдиреНрдп, рдЬрд┐рд╕рд╕реЗ рд╕рднреА рдЧрдгрд┐рддреАрдп рд╕рдВрдЪрд╛рд▓рди рд╕рдВрднрд╡ рд╣реЛрддреЗ рд╣реИрдВред
рд╕рд╣реА рдорд╛рдкрди рд╕реНрддрд░ рдЪреБрдирдиреЗ рд╕реЗ рдЕрдиреБрд╕рдВрдзрд╛рди рдХреА рд╕рдЯреАрдХрддрд╛ рдФрд░ рд╡рд┐рд╢реНрд╡рд╕рдиреАрдпрддрд╛ рдмрдврд╝рддреА рд╣реИ, рдЬрд┐рд╕рд╕реЗ рдЕрдзрд┐рдХ рдкреНрд░рднрд╛рд╡реА рдбреЗрдЯрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рд╕рдВрднрд╡ рд╣реЛрддрд╛ рд╣реИред
UNIT-1 (1.3) Levels of Measurement- Nominal, Ordinal, Interval, and Ratio.
Introduction
Measurement is a fundamental aspect of research and statistical analysis. In order to collect, analyze, and interpret data effectively, researchers categorize variables based on the level of measurement they represent. The concept of levels of measurement was introduced by Stanley Smith Stevens in 1946 and includes four main types:
- Nominal Level
- Ordinal Level
- Interval Level
- Ratio Level
Each level of measurement determines the type of statistical operations that can be performed and how data can be interpreted. This essay explores these levels in detail, highlighting their characteristics, differences, and applications in various fields.
1. Nominal Level of Measurement
Definition
The nominal level of measurement refers to variables that categorize data without any inherent order or ranking. These variables represent labels or names that classify data into distinct groups.
Characteristics
- Qualitative (categorical) data тАУ Represents attributes rather than numerical values.
- No meaningful order тАУ Categories cannot be ranked in a logical sequence.
- Mutually exclusive тАУ Each data point belongs to only one category.
- No mathematical operations тАУ Arithmetic calculations (e.g., addition, subtraction) are not meaningful.
Examples
- Gender: Male, Female, Other
- Blood Type: A, B, AB, O
- Nationality: American, Indian, Chinese, French
- Political Affiliation: Democrat, Republican, Independent
- Marital Status: Single, Married, Divorced
Statistical Techniques
- Mode (most frequently occurring category).
- Chi-square test (to assess relationships between nominal variables).
Applications
- Market research (classifying consumer preferences).
- Healthcare studies (categorizing disease types).
- Sociological studies (analyzing ethnicity and cultural backgrounds).
For example, a researcher studying political preferences may categorize respondents as Democrat, Republican, or Independent, but these groups have no inherent order.
2. Ordinal Level of Measurement
Definition
The ordinal level of measurement represents data that can be categorized and ranked in a meaningful order, but the intervals between categories are not necessarily equal.
Characteristics
- Qualitative or quantitative data тАУ Can include both categories and numbers.
- Meaningful order тАУ Data can be ranked (e.g., high to low, best to worst).
- Unequal intervals тАУ Differences between ranks are not consistent.
- Limited mathematical operations тАУ Only comparisons (greater than, less than) are valid.
Examples
- Education Level: Primary, Secondary, College, Postgraduate
- Socioeconomic Status: Low, Middle, High
- Customer Satisfaction: Very Dissatisfied, Dissatisfied, Neutral, Satisfied, Very Satisfied
- Pain Severity: Mild, Moderate, Severe
Statistical Techniques
- Median and mode (but not mean).
- SpearmanтАЩs rank correlation (to measure relationships).
- Mann-Whitney U test (to compare two ordinal groups).
Applications
- Survey research (assessing customer satisfaction).
- Medical studies (ranking pain levels).
- Educational research (grading performance as A, B, C, D).
For example, in a hotel rating system, a 5-star hotel is ranked higher than a 3-star hotel, but the difference in quality between 3-star and 4-star may not be the same as between 4-star and 5-star.
3. Interval Level of Measurement
Definition
The interval level of measurement represents data that is ordered and has equal intervals between values but does not have a true zero point.
Characteristics
- Quantitative data тАУ Only numerical values are used.
- Meaningful order тАУ Values follow a logical sequence.
- Equal intervals тАУ Differences between values are consistent.
- No true zero тАУ Zero does not mean the absence of a quantity.
Examples
- Temperature in Celsius or Fahrenheit (0┬░C does not mean “no temperature”).
- IQ Scores (0 IQ does not mean “no intelligence”).
- SAT Scores (a score of 0 does not mean a total lack of ability).
Statistical Techniques
- Mean, median, and mode can be calculated.
- Standard deviation and variance can be measured.
- t-tests and ANOVA can be used for hypothesis testing.
Applications
- Psychological studies (measuring IQ).
- Education research (exam scores).
- Climate studies (temperature trends).
For example, in an IQ test, a score of 120 is higher than a score of 100, and the difference between 100 and 110 is the same as between 110 and 120, but a score of 0 does not mean “no intelligence.”
4. Ratio Level of Measurement
Definition
The ratio level of measurement includes all the properties of interval measurement but also has a true zero point, meaning zero represents the complete absence of the measured variable.
Characteristics
- Quantitative data тАУ Numeric values only.
- Meaningful order тАУ Values can be ranked logically.
- Equal intervals тАУ Differences between values are consistent.
- True zero point тАУ Zero means “nothing” or “absence” of the quantity.
- All mathematical operations (addition, subtraction, multiplication, division) can be performed.
Examples
- Height (cm, inches) тАУ 0 cm means no height.
- Weight (kg, pounds) тАУ 0 kg means no weight.
- Income ($, тВ╣) тАУ 0 dollars means no income.
- Time (seconds, minutes) тАУ 0 seconds means no time.
Statistical Techniques
- All statistical methods used in interval data.
- Geometric mean and coefficient of variation can be applied.
- Regression analysis and ratio comparisons are possible.
Applications
- Medical research (measuring blood pressure, cholesterol levels).
- Sports science (tracking running speeds, heart rates).
- Economics and business (analyzing revenue and profits).
For example, in weight measurement, 80 kg is twice as heavy as 40 kg, and 0 kg means “no weight,” making it a ratio variable.
Key Differences Between Levels of Measurement
Feature | Nominal | Ordinal | Interval | Ratio |
Data Type | Categorical | Categorical/Quantitative | Quantitative | Quantitative |
Order of Values | No | Yes | Yes | Yes |
Equal Intervals | No | No | Yes | Yes |
True Zero Point | No | No | No | Yes |
Examples | Gender, Blood Type | Education Level, Satisfaction Rating | IQ Score, Temperature | Height, Weight, Income |
Mathematical Operations | Counting | Ranking | Addition, Subtraction | All operations |
Conclusion
Understanding the four levels of measurementтАФnominal, ordinal, interval, and ratioтАФis essential for researchers to determine the appropriate statistical techniques and data analysis methods.
- Nominal data classifies without order.
- Ordinal data ranks with no equal intervals.
- Interval data has equal intervals but no true zero.
- Ratio data has equal intervals and a true zero, allowing for all mathematical calculations.
Choosing the correct level of measurement ensures accurate data interpretation, meaningful comparisons, and reliable statistical analysis across various fields like psychology, business, medicine, and social sciences.
UNIT-2 (2.1) Basic concept of Descriptive and Inferential statistics.
рд╡рд░реНрдгрдирд╛рддреНрдордХ рдФрд░ рдЕрдиреБрдорд╛рдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдХреА рдореВрд▓ рдЕрд╡рдзрд╛рд░рдгрд╛рдПрдБ
рдкрд░рд┐рдЪрдп
рд╕рд╛рдВрдЦреНрдпрд┐рдХреА (Statistics) рдЧрдгрд┐рдд рдХреА рдПрдХ рд╢рд╛рдЦрд╛ рд╣реИ, рдЬреЛ рдбреЗрдЯрд╛ рдХреЗ рд╕рдВрдЧреНрд░рд╣рдг, рд╡рд┐рд╢реНрд▓реЗрд╖рдг, рд╡реНрдпрд╛рдЦреНрдпрд╛ рдФрд░ рдкреНрд░рд╕реНрддреБрддрд┐ рд╕реЗ рд╕рдВрдмрдВрдзрд┐рдд рд╣реИред рдпрд╣ рд╡реНрдпрд╡рд╕рд╛рдп, рд╕реНрд╡рд╛рд╕реНрдереНрдп, рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди, рд╕рд╛рдорд╛рдЬрд┐рдХ рд╡рд┐рдЬреНрдЮрд╛рди рдФрд░ рдЗрдВрдЬреАрдирд┐рдпрд░рд┐рдВрдЧ рд╕рд╣рд┐рдд рд╡рд┐рднрд┐рдиреНрди рдХреНрд╖реЗрддреНрд░реЛрдВ рдореЗрдВ рдорд╣рддреНрд╡рдкреВрд░реНрдг рднреВрдорд┐рдХрд╛ рдирд┐рднрд╛рддреА рд╣реИред рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдХреЛ рдореБрдЦреНрдп рд░реВрдк рд╕реЗ рджреЛ рднрд╛рдЧреЛрдВ рдореЗрдВ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ:
- рд╡рд░реНрдгрдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА (Descriptive Statistics) тАУ рдпрд╣ рдбреЗрдЯрд╛ рдХреЛ рд╕рд╛рд░рд╛рдВрд╢рд┐рдд рдФрд░ рд╡реНрдпрд╡рд╕реНрдерд┐рдд рдХрд░рдиреЗ рдХрд╛ рдХрд╛рд░реНрдп рдХрд░рддреА рд╣реИред
- рдЕрдиреБрдорд╛рдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА (Inferential Statistics) тАУ рдпрд╣ рдПрдХ рдЫреЛрдЯреЗ рдирдореВрдиреЗ (Sample) рд╕реЗ рдкреВрд░реЗ рдЬрдирд╕рдВрдЦреНрдпрд╛ (Population) рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдирд┐рд╖реНрдХрд░реНрд╖ рдирд┐рдХрд╛рд▓рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддреА рд╣реИред
рджреЛрдиреЛрдВ рдкреНрд░рдХрд╛рд░ рдХреЗ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдбреЗрдЯрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдореЗрдВ рдЕрд▓рдЧ-рдЕрд▓рдЧ рдХрд╛рд░реНрдп рдХрд░рддреЗ рд╣реИрдВ, рд▓реЗрдХрд┐рди рд╡реЗ рдЖрдкрд╕ рдореЗрдВ рдЬреБрдбрд╝реЗ рд╣реБрдП рд╣реИрдВред рдЗрд╕ рдирд┐рдмрдВрдз рдореЗрдВ рдЗрдирдХреА рдореВрд▓ рдЕрд╡рдзрд╛рд░рдгрд╛рдУрдВ, рдЕрдВрддрд░, рддрдХрдиреАрдХреЛрдВ рдФрд░ рдЕрдиреБрдкреНрд░рдпреЛрдЧреЛрдВ рдХрд╛ рд╡рд┐рд╕реНрддрд╛рд░ рд╕реЗ рдЕрдзреНрдпрдпрди рдХрд┐рдпрд╛ рдЬрд╛рдПрдЧрд╛ред
1. рд╡рд░реНрдгрдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА (Descriptive Statistics)
рдкрд░рд┐рднрд╛рд╖рд╛
рд╡рд░реНрдгрдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рд╡реЗ рд╡рд┐рдзрд┐рдпрд╛рдБ рд╣реЛрддреА рд╣реИрдВ, рдЬреЛ рдХрд┐рд╕реА рдбреЗрдЯрд╛ рдХреЛ рд╕рд╛рд░рд╛рдВрд╢рд┐рдд (Summarize) рдФрд░ рд╡реНрдпрд╡рд╕реНрдерд┐рдд (Organize) рдХрд░рдХреЗ рдЙрд╕реЗ рд╕рдордЭрдиреЗ рдпреЛрдЧреНрдп рдмрдирд╛рддреА рд╣реИрдВред рдпрд╣ рдбреЗрдЯрд╛ рдХрд╛ рдХреЗрд╡рд▓ рд╡рд░реНрдгрди рдХрд░рддреА рд╣реИ рдФрд░ рдЙрд╕рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рдХреЛрдИ рдирд┐рд╖реНрдХрд░реНрд╖ рдпрд╛ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рдирд╣реАрдВ рд▓рдЧрд╛рддреАред
рдореБрдЦреНрдп рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдБ
- рдмрдбрд╝реЗ рдбреЗрдЯрд╛ рд╕реЗрдЯ рдХреЛ рд╕рд╛рд░рд╛рдВрд╢рд┐рдд рдХрд░рддреА рд╣реИ рддрд╛рд▓рд┐рдХрд╛рдУрдВ, рдЧреНрд░рд╛рдлрд╝ рдФрд░ рд╕рдВрдЦреНрдпрд╛рддреНрдордХ рдорд╛рдкреЛрдВ рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗред
- рдХреЛрдИ рдирд┐рд╖реНрдХрд░реНрд╖ рдпрд╛ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рдирд╣реАрдВ рд▓рдЧрд╛рддреА, рдХреЗрд╡рд▓ рдбреЗрдЯрд╛ рдХрд╛ рд╡рд░реНрдгрди рдХрд░рддреА рд╣реИред
- рдкреИрдЯрд░реНрди рдФрд░ рд╕рдВрдмрдВрдз рдЦреЛрдЬрдиреЗ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреЛрдЧ рдХреА рдЬрд╛рддреА рд╣реИред
рд╡рд░реНрдгрдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдХреЗ рдкреНрд░рдХрд╛рд░
1.1 рдХреЗрдВрджреНрд░реАрдп рдкреНрд░рд╡реГрддреНрддрд┐ рдХреЗ рдорд╛рдк (Measures of Central Tendency)
рдпреЗ рдорд╛рдк рдбреЗрдЯрд╛ рдХреЗ рдХреЗрдВрджреНрд░ рдХреЛ рджрд░реНрд╢рд╛рддреЗ рд╣реИрдВ:
- рдорд╛рдзреНрдп (Mean): рд╕рднреА рдореВрд▓реНрдпреЛрдВ рдХрд╛ рдпреЛрдЧ, рдХреБрд▓ рдореВрд▓реНрдпреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рд╕реЗ рд╡рд┐рднрд╛рдЬрд┐рддред
- рдЙрджрд╛рд╣рд░рдг: рдХрд┐рд╕реА рдХрдХреНрд╖рд╛ рдХреЗ рдЫрд╛рддреНрд░реЛрдВ рдХреА рдФрд╕рдд рдКрдБрдЪрд╛рдИред
- рдорд╛рдзреНрдпрд┐рдХрд╛ (Median): рдбреЗрдЯрд╛ рдХреЛ рдмрдврд╝рддреЗ рдХреНрд░рдо рдореЗрдВ рд╡реНрдпрд╡рд╕реНрдерд┐рдд рдХрд░рдиреЗ рдХреЗ рдмрд╛рдж рдордзреНрдп рдореЗрдВ рд╕реНрдерд┐рдд рдорд╛рдиред
- рдЙрджрд╛рд╣рд░рдг: рдПрдХ рд╕рдореВрд╣ рдХреА рдФрд╕рдд рдЖрдпред
- рдмрд╣реБрд▓рдХ (Mode): рд╕рдмрд╕реЗ рдЕрдзрд┐рдХ рдмрд╛рд░ рдЖрдиреЗ рд╡рд╛рд▓рд╛ рдорд╛рдиред
- рдЙрджрд╛рд╣рд░рдг: рдПрдХ рдкрд░реАрдХреНрд╖рд╛ рдореЗрдВ рд╕рдмрд╕реЗ рдЬреНрдпрд╛рджрд╛ рд╕реНрдХреЛрд░ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдЕрдВрдХред
1.2 рдкреНрд░рд╕рд╛рд░ рдХреЗ рдорд╛рдк (Measures of Dispersion)
рдпреЗ рдорд╛рдк рдпрд╣ рджрд░реНрд╢рд╛рддреЗ рд╣реИрдВ рдХрд┐ рдбреЗрдЯрд╛ рдХрд┐рддрдирд╛ рдлреИрд▓рд╛ рд╣реБрдЖ рд╣реИред
- рдкрд░рд╛рд╕ (Range): рд╕рдмрд╕реЗ рдмрдбрд╝рд╛ рдорд╛рди тАУ рд╕рдмрд╕реЗ рдЫреЛрдЯрд╛ рдорд╛рдиред
- рдЙрджрд╛рд╣рд░рдг: рдпрджрд┐ рдкрд░реАрдХреНрд╖рд╛ рдореЗрдВ рдЙрдЪреНрдЪрддрдо рдЕрдВрдХ 95 рдФрд░ рдиреНрдпреВрдирддрдо 55 рд╣реИрдВ, рддреЛ рдкрд░рд╛рд╕ 40 рд╣реЛрдЧрд╛ред
- рд╡рд┐рдЪрд▓рди (Variance): рдорд╛рдзреНрдп рд╕реЗ рдбреЗрдЯрд╛ рдХреА рднрд┐рдиреНрдирддрд╛ рдХреЛ рджрд░реНрд╢рд╛рддрд╛ рд╣реИред
- рдорд╛рдирдХ рд╡рд┐рдЪрд▓рди (Standard Deviation): рд╡рд┐рдЪрд▓рди рдХрд╛ рд╡рд░реНрдЧрдореВрд▓, рдбреЗрдЯрд╛ рдХреА рдлреИрд▓рд╛рд╡рдЯ рдХреЛ рдорд╛рдкрдиреЗ рдХреЗ рд▓рд┐рдПред
- рдЙрджрд╛рд╣рд░рдг: рдпрджрд┐ рджреЛ рдХрдХреНрд╖рд╛рдУрдВ рдореЗрдВ рдФрд╕рдд рдЕрдВрдХ рд╕рдорд╛рди рд╣реИрдВ, рд▓реЗрдХрд┐рди рдПрдХ рдореЗрдВ рдорд╛рдирдХ рд╡рд┐рдЪрд▓рди рдЕрдзрд┐рдХ рд╣реИ, рддреЛ рдЙрд╕ рдХрдХреНрд╖рд╛ рдХреЗ рдЕрдВрдХреЛрдВ рдореЗрдВ рдЕрдзрд┐рдХ рд╡рд┐рд╡рд┐рдзрддрд╛ рд╣реЛрдЧреАред
1.3 рдбреЗрдЯрд╛ рдХрд╛ рдЧреНрд░рд╛рдлрд╝рд┐рдХрд▓ рдкреНрд░рддрд┐рдирд┐рдзрд┐рддреНрд╡
рдбреЗрдЯрд╛ рдХреЛ рдЧреНрд░рд╛рдлрд╝ рдХреЗ рд░реВрдк рдореЗрдВ рдкреНрд░рд╕реНрддреБрдд рдХрд░рдиреЗ рд╕реЗ рдЙрд╕реЗ рд╕рдордЭрдирд╛ рдЖрд╕рд╛рди рд╣реЛ рдЬрд╛рддрд╛ рд╣реИред
- рд╣рд┐рд╕реНрдЯреЛрдЧреНрд░рд╛рдо (Histogram): рдбреЗрдЯрд╛ рдХреА рдЖрд╡реГрддреНрддрд┐ (Frequency) рдХреЛ рджрд░реНрд╢рд╛рддрд╛ рд╣реИред
- рдмрд╛рд░ рдЧреНрд░рд╛рдлрд╝ (Bar Graph): рд╡рд┐рднрд┐рдиреНрди рд╢реНрд░реЗрдгрд┐рдпреЛрдВ рдХреА рддреБрд▓рдирд╛ рдХрд░рддрд╛ рд╣реИред
- рдкрд╛рдИ рдЪрд╛рд░реНрдЯ (Pie Chart): рд╡рд┐рднрд┐рдиреНрди рд╢реНрд░реЗрдгрд┐рдпреЛрдВ рдХрд╛ рдЕрдиреБрдкрд╛рдд рджрд░реНрд╢рд╛рддрд╛ рд╣реИред
- рдмреЙрдХреНрд╕ рдкреНрд▓реЙрдЯ (Box Plot): рдорд╛рдзреНрдп, рдХреНрд╡рд╛рд░реНрдЯрд╛рдЗрд▓ рдФрд░ рдмрд╛рд╣реНрдп рдореВрд▓реНрдпреЛрдВ (Outliers) рдХреЛ рджрд┐рдЦрд╛рддрд╛ рд╣реИред
рд╡рд░реНрдгрдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдХреЗ рдЕрдиреБрдкреНрд░рдпреЛрдЧ
- рд╢рд┐рдХреНрд╖рд╛: рдЫрд╛рддреНрд░реЛрдВ рдХреЗ рдкрд░реАрдХреНрд╖рд╛ рдкрд░рд┐рдгрд╛рдореЛрдВ рдХрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдгред
- рд╡реНрдпрд╡рд╕рд╛рдп: рдЧреНрд░рд╛рд╣рдХреЛрдВ рдХреА рдкреНрд░рд╛рдердорд┐рдХрддрд╛рдУрдВ рдХреЛ рд╕рдордЭрдирд╛ред
- рд╕реНрд╡рд╛рд╕реНрдереНрдп: рдорд░реАрдЬреЛрдВ рдХреЗ рд╕реНрд╡рд╛рд╕реНрдереНрдп рд░рд┐рдХреЙрд░реНрдб рдХрд╛ рд╕рд╛рд░рд╛рдВрд╢ рдмрдирд╛рдирд╛ред
- рдЦреЗрд▓: рдЦрд┐рд▓рд╛рдбрд╝рд┐рдпреЛрдВ рдХреА рдкреНрд░рджрд░реНрд╢рди рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдХреА рддреБрд▓рдирд╛ рдХрд░рдирд╛ред
рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рдПрдХ рдХрдВрдкрдиреА рдЕрд▓рдЧ-рдЕрд▓рдЧ рд╢рд╣рд░реЛрдВ рдореЗрдВ рдорд╛рд╕рд┐рдХ рдмрд┐рдХреНрд░реА рдХреЗ рдФрд╕рдд рдХреА рдЧрдгрдирд╛ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╡рд░реНрдгрдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд╕рдХрддреА рд╣реИред
2. рдЕрдиреБрдорд╛рдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА (Inferential Statistics)
рдкрд░рд┐рднрд╛рд╖рд╛
рдЕрдиреБрдорд╛рдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рд╡рд╣ рд╡рд┐рдзрд┐рдпрд╛рдБ рд╣реЛрддреА рд╣реИрдВ, рдЬреЛ рдПрдХ рдЫреЛрдЯреЗ рдирдореВрдиреЗ (Sample) рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рдкреВрд░реА рдЬрдирд╕рдВрдЦреНрдпрд╛ (Population) рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдирд┐рд╖реНрдХрд░реНрд╖ рдирд┐рдХрд╛рд▓рддреА рд╣реИрдВред
рдореБрдЦреНрдп рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдБ
- рдирдореВрдиреЗ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рдЬрдирд╕рдВрдЦреНрдпрд╛ рдХрд╛ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рдХрд░рддреА рд╣реИред
- рд╕рдВрднрд╛рд╡реНрдпрддрд╛ рд╕рд┐рджреНрдзрд╛рдВрдд (Probability Theory) рдкрд░ рдЖрдзрд╛рд░рд┐рдд рд╣реЛрддреА рд╣реИред
- рдкрд░рд┐рдХрд▓реНрдкрдирд╛ рдкрд░реАрдХреНрд╖рдг (Hypothesis Testing) рдФрд░ рд╡рд┐рд╢реНрд╡рд╛рд╕ рдЕрдВрддрд░рд╛рд▓ (Confidence Intervals) рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреА рд╣реИред
рдЕрдиреБрдорд╛рдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдХреЗ рдкреНрд░рдХрд╛рд░
2.1 рдирдореВрдХрд░рдг рдФрд░ рдЬрдирд╕рдВрдЦреНрдпрд╛ (Sampling and Population)
- рдЬрдирд╕рдВрдЦреНрдпрд╛ (Population): рд╕рдВрдкреВрд░реНрдг рд╕рдореВрд╣ рдЬрд┐рд╕рдХрд╛ рдЕрдзреНрдпрдпрди рдХрд┐рдпрд╛ рдЬрд╛ рд░рд╣рд╛ рд╣реИред
- рдирдореВрдирд╛ (Sample): рдЬрдирд╕рдВрдЦреНрдпрд╛ рдХрд╛ рдПрдХ рдЫреЛрдЯрд╛ рднрд╛рдЧ, рдЬрд┐рд╕ рдкрд░ рдЕрдзреНрдпрдпрди рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
- рдпрд╛рджреГрдЪреНрдЫрд┐рдХ рдирдореВрдХрд░рдг (Random Sampling): рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░рддрд╛ рд╣реИ рдХрд┐ рдкреНрд░рддреНрдпреЗрдХ рд╡реНрдпрдХреНрддрд┐ рдХреЛ рдЪреБрдиреЗ рдЬрд╛рдиреЗ рдХрд╛ рд╕рдорд╛рди рдЕрд╡рд╕рд░ рдорд┐рд▓реЗред
2.2 рдкрд░рд┐рдХрд▓реНрдкрдирд╛ рдкрд░реАрдХреНрд╖рдг (Hypothesis Testing)
рдпрд╣ рдкрд░реАрдХреНрд╖рдг рдпрд╣ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХрд░рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддрд╛ рд╣реИ рдХрд┐ рдХреЛрдИ рдзрд╛рд░рдгрд╛ рд╕рд╣реА рд╣реИ рдпрд╛ рдирд╣реАрдВред
- рд╢реВрдиреНрдп рдкрд░рд┐рдХрд▓реНрдкрдирд╛ (HтВА): рдХрд╣рддреА рд╣реИ рдХрд┐ рдХреЛрдИ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдЕрдВрддрд░ рдпрд╛ рдкреНрд░рднрд╛рд╡ рдирд╣реАрдВ рд╣реИред
- рд╡реИрдХрд▓реНрдкрд┐рдХ рдкрд░рд┐рдХрд▓реНрдкрдирд╛ (HтВБ): рдХрд╣рддреА рд╣реИ рдХрд┐ рдХреЛрдИ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдЕрдВрддрд░ рдпрд╛ рдкреНрд░рднрд╛рд╡ рд╣реИред
рдЙрджрд╛рд╣рд░рдг:
рдпрджрд┐ рдПрдХ рдХрдВрдкрдиреА рджрд╛рд╡рд╛ рдХрд░рддреА рд╣реИ рдХрд┐ рдЙрд╕рдХрд╛ рдирдпрд╛ рдЖрд╣рд╛рд░ рдкреВрд░рдХ 1 рдорд╣реАрдиреЗ рдореЗрдВ 5 рдХрд┐рд▓реЛ рд╡рдЬрди рдХрдо рдХрд░рддрд╛ рд╣реИ, рддреЛ рдЗрд╕ рджрд╛рд╡реЗ рдХреА рд╡реИрдзрддрд╛ рдкрд░рд┐рдХрд▓реНрдкрдирд╛ рдкрд░реАрдХреНрд╖рдг рджреНрд╡рд╛рд░рд╛ рд╕рддреНрдпрд╛рдкрд┐рдд рдХреА рдЬрд╛ рд╕рдХрддреА рд╣реИред
2.3 рд╡рд┐рд╢реНрд╡рд╛рд╕ рдЕрдВрддрд░рд╛рд▓ (Confidence Interval)
рдпрд╣ рдЕрдиреБрдорд╛рди рд▓рдЧрд╛рддрд╛ рд╣реИ рдХрд┐ рдХрд┐рд╕реА рдЖрдмрд╛рджреА рдХрд╛ рдорд╛рдкрд┐рдд рдореВрд▓реНрдп рдХрд┐рд╕реА рд╕реАрдорд╛ рдХреЗ рднреАрддрд░ рдХрд┐рддрдирд╛ рд╕рдЯреАрдХ рд╣реИред
рдЙрджрд╛рд╣рд░рдг:
рдпрджрд┐ рдПрдХ рд╕рд░реНрд╡реЗрдХреНрд╖рдг рд╕реЗ рдкрддрд╛ рдЪрд▓рддрд╛ рд╣реИ рдХрд┐ 60% рд▓реЛрдЧ рдХрд┐рд╕реА рдиреЗрддрд╛ рдХрд╛ рд╕рдорд░реНрдерди рдХрд░рддреЗ рд╣реИрдВ рдФрд░ рд╡рд┐рд╢реНрд╡рд╛рд╕ рдЕрдВрддрд░рд╛рд▓ ┬▒3% рд╣реИ, рддреЛ рд╕рд╣реА рд╕рдорд░реНрдерди рд╕реНрддрд░ 57% рд╕реЗ 63% рдХреЗ рдмреАрдЪ рд╣реЛрдЧрд╛ред
2.4 рд╕рд╣рд╕рдВрдмрдВрдз рдФрд░ рдкреНрд░рддрд┐рдЧрдорди (Correlation and Regression)
- рд╕рд╣рд╕рдВрдмрдВрдз (Correlation): рджреЛ рдЪрд░реЛрдВ рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдз рдХреЛ рдорд╛рдкрддрд╛ рд╣реИред
- рдкреНрд░рддрд┐рдЧрдорди (Regression): рдПрдХ рдЪрд░ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рджреВрд╕рд░реЗ рдХрд╛ рдЕрдиреБрдорд╛рди рд▓рдЧрд╛рддрд╛ рд╣реИред
рдЙрджрд╛рд╣рд░рдг:
рдПрдХ рдЕрдзреНрдпрдпрди рдореЗрдВ рдкрд╛рдпрд╛ рдЧрдпрд╛ рдХрд┐ рдЕрдзреНрдпрдпрди рдХреЗ рдШрдВрдЯреЗ рдФрд░ рдкрд░реАрдХреНрд╖рд╛ рд╕реНрдХреЛрд░ рдХреЗ рдмреАрдЪ рд╕рдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдз (r = 0.85) рд╣реИ, рдпрд╛рдиреА рдЕрдзрд┐рдХ рдЕрдзреНрдпрдпрди рдХрд░рдиреЗ рд╡рд╛рд▓реЗ рдЫрд╛рддреНрд░реЛрдВ рдХреЗ рдЕрдВрдХ рдЕрдзрд┐рдХ рд╣реЛрддреЗ рд╣реИрдВред
2.5 t-рдкрд░реАрдХреНрд╖рдг рдФрд░ ANOVA (Analysis of Variance)
- t-рдкрд░реАрдХреНрд╖рдг (t-Test): рджреЛ рд╕рдореВрд╣реЛрдВ рдХреА рдФрд╕рдд рддреБрд▓рдирд╛ рдХрд░рддрд╛ рд╣реИред
- ANOVA: рддреАрди рдпрд╛ рдЕрдзрд┐рдХ рд╕рдореВрд╣реЛрдВ рдХреА рдФрд╕рдд рддреБрд▓рдирд╛ рдХрд░рддрд╛ рд╣реИред
рдЙрджрд╛рд╣рд░рдг:
t-рдкрд░реАрдХреНрд╖рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдпрд╣ рдЬрд╛рдВрдЪрдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИ рдХрд┐ рдкреБрд░реБрд╖ рдФрд░ рдорд╣рд┐рд▓рд╛ рдХрд░реНрдордЪрд╛рд░рд┐рдпреЛрдВ рдХреЗ рд╡реЗрддрди рдореЗрдВ рдХреЛрдИ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдЕрдВрддрд░ рд╣реИ рдпрд╛ рдирд╣реАрдВред
рдЕрдиреБрдкреНрд░рдпреЛрдЧ
- рдЪрд┐рдХрд┐рддреНрд╕рд╛: рдХрд┐рд╕реА рдирдИ рджрд╡рд╛ рдХреА рдкреНрд░рднрд╛рд╡рд╢реАрд▓рддрд╛ рдЬрд╛рдВрдЪрдирд╛ред
- рдЕрд░реНрдерд╢рд╛рд╕реНрддреНрд░: рднрд╡рд┐рд╖реНрдп рдореЗрдВ рдореБрджреНрд░рд╛рд╕реНрдлреАрддрд┐ рджрд░ рдХреА рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдХрд░рдирд╛ред
- рд╡рд┐рдкрдгрди: рдЙрдкрднреЛрдХреНрддрд╛ рд╡реНрдпрд╡рд╣рд╛рд░ рдХрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХрд░рдирд╛ред
- рд░рд╛рдЬрдиреАрддрд┐: рдЪреБрдирд╛рд╡ рдкрд░рд┐рдгрд╛рдореЛрдВ рдХрд╛ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рд▓рдЧрд╛рдирд╛ред
3. рд╡рд░реНрдгрдирд╛рддреНрдордХ рдФрд░ рдЕрдиреБрдорд╛рдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдореЗрдВ рдЕрдВрддрд░
рд╡рд┐рд╢реЗрд╖рддрд╛ | рд╡рд░реНрдгрдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА | рдЕрдиреБрдорд╛рдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА |
рдЙрджреНрджреЗрд╢реНрдп | рдбреЗрдЯрд╛ рдХрд╛ рд╕рд╛рд░рд╛рдВрд╢ рджреЗрдирд╛ | рдирд┐рд╖реНрдХрд░реНрд╖ рдирд┐рдХрд╛рд▓рдирд╛ |
рдбреЗрдЯрд╛ рдЙрдкрдпреЛрдЧ | рдкреВрд░реЗ рдбреЗрдЯрд╛ рдХрд╛ рдЙрдкрдпреЛрдЧ | рдирдореВрдиреЗ рдкрд░ рдЖрдзрд╛рд░рд┐рдд |
рддрдХрдиреАрдХреЗрдВ | рдорд╛рдзреНрдп, рдорд╛рдзреНрдпрд┐рдХрд╛, рдмрд╣реБрд▓рдХ | рдкрд░рд┐рдХрд▓реНрдкрдирд╛ рдкрд░реАрдХреНрд╖рдг, рдкреНрд░рддрд┐рдЧрдорди |
рдирд┐рд╖реНрдХрд░реНрд╖
рд╡рд░реНрдгрдирд╛рддреНрдордХ рдФрд░ рдЕрдиреБрдорд╛рдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдбреЗрдЯрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХреЗ рджреЛ рдЖрд╡рд╢реНрдпрдХ рднрд╛рдЧ рд╣реИрдВред рд╡рд░реНрдгрдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдбреЗрдЯрд╛ рдХреЛ рд╕рд╛рд░рд╛рдВрд╢рд┐рдд рдХрд░рддреА рд╣реИ, рдЬрдмрдХрд┐ рдЕрдиреБрдорд╛рдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рдФрд░ рдирд┐рд╖реНрдХрд░реНрд╖ рдирд┐рдХрд╛рд▓рдиреЗ
рдореЗрдВ рдорджрдж рдХрд░рддреА рд╣реИред рджреЛрдиреЛрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рд╡рд┐рдЬреНрдЮрд╛рди, рд╡реНрдпрд╛рдкрд╛рд░, рдЪрд┐рдХрд┐рддреНрд╕рд╛ рдФрд░ рдЕрдиреНрдп рдХреНрд╖реЗрддреНрд░реЛрдВ рдореЗрдВ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ, рдЬрд┐рд╕рд╕реЗ рдбреЗрдЯрд╛-рд╕рдВрдЪрд╛рд▓рд┐рдд рдирд┐рд░реНрдгрдп рд▓реЗрдиреЗ рдореЗрдВ рд╕рд╣рд╛рдпрддрд╛ рдорд┐рд▓рддреА рд╣реИред
UNIT-2 (2.1) Basic concept of Descriptive and Inferential statistics.
Introduction
Statistics is a branch of mathematics that deals with collecting, analyzing, interpreting, and presenting data. It plays a crucial role in various fields, including business, healthcare, psychology, social sciences, and engineering. Broadly, statistics is divided into two major types:
- Descriptive Statistics тАУ It deals with summarizing and organizing data.
- Inferential Statistics тАУ It involves making predictions and generalizations from a sample to a population.
Both types serve different purposes but are interconnected in data analysis. This essay explores their fundamental concepts, differences, techniques, and applications.
1. Descriptive Statistics
Definition
Descriptive statistics refers to the methods used to summarize and organize data in a meaningful way. It provides simple summaries and graphical representations of data but does not allow for generalizations beyond the specific dataset.
Key Features
- Summarizes large data sets using tables, graphs, and numerical measures.
- No conclusions or predictions about the population, only describes the data.
- Used in raw data analysis to find patterns and relationships.
Types of Descriptive Statistics
Descriptive statistics can be divided into three main categories:
1.1 Measures of Central Tendency
These measures represent the center or typical value of a dataset.
- Mean (Arithmetic Average): Sum of all values divided by the total number of observations.
- Example: The average height of students in a class.
- Median: The middle value when data is arranged in ascending order.
- Example: The median income of a group of people.
- Mode: The most frequently occurring value in a dataset.
- Example: The most common exam score in a classroom.
1.2 Measures of Dispersion (Variability)
These measures show how much the data varies or spreads out.
- Range: The difference between the highest and lowest value.
- Example: If the highest test score is 95 and the lowest is 55, the range is 40.
- Variance: The average squared difference from the mean, showing how spread out the data is.
- Standard Deviation: The square root of variance, used to measure data dispersion.
- Example: If two groups have the same average score but different standard deviations, the group with a higher standard deviation has more variation.
1.3 Graphical Representation of Data
Visual representation makes data easier to understand.
- Histograms: Used for frequency distribution.
- Bar Graphs: Used for categorical data comparisons.
- Pie Charts: Show proportions of categories.
- Box Plots: Show median, quartiles, and outliers.
Applications of Descriptive Statistics
- Education: Analyzing student performance.
- Business: Understanding customer preferences.
- Healthcare: Summarizing patient health records.
- Sports: Comparing player statistics.
For example, a company may use descriptive statistics to determine the average monthly sales in different regions.
2. Inferential Statistics
Definition
Inferential statistics involves making predictions or inferences about a population based on a sample. It helps researchers determine the probability that their conclusions apply to a larger group.
Key Features
- Uses sample data to make predictions about a population.
- Involves probability theory to determine the reliability of results.
- Can be used for hypothesis testing and confidence intervals.
Types of Inferential Statistics
Inferential statistics primarily includes hypothesis testing and estimation techniques to draw conclusions.
2.1 Sampling and Population
- Population: The entire group being studied.
- Sample: A smaller subset of the population used for analysis.
- Random Sampling: A method to ensure every individual has an equal chance of selection.
For example, to estimate the average height of all university students, a researcher might measure a sample of 500 students.
2.2 Hypothesis Testing
Hypothesis testing determines whether an assumption (hypothesis) about a population is true.
- Null Hypothesis (HтВА): States there is no significant difference or effect.
- Alternative Hypothesis (HтВБ): Suggests a significant difference or effect exists.
Example:
A company claims that their new diet pill helps people lose 5 kg in a month. A study with 100 participants is conducted to test whether this claim is statistically significant.
2.3 Confidence Intervals
A confidence interval estimates the range in which a population parameter (e.g., mean) is likely to fall.
Example:
A survey finds that 60% of voters support a candidate, with a 95% confidence interval of ┬▒3%. This means the true support level is likely between 57% and 63%.
2.4 Correlation and Regression Analysis
- Correlation: Measures the relationship between two variables (e.g., height and weight).
- Regression: Predicts the value of one variable based on another.
Example:
A study finds a positive correlation (r = 0.85) between hours studied and exam scores, meaning students who study more tend to score higher.
2.5 t-Test and ANOVA (Analysis of Variance)
- t-Test: Compares the means of two groups.
- ANOVA: Compares the means of three or more groups.
Example:
A t-test could compare the average salary of male and female employees to determine if there is a significant difference.
Applications of Inferential Statistics
- Medicine: Determining if a new drug is effective.
- Economics: Predicting future inflation rates.
- Marketing: Analyzing customer behavior trends.
- Political Science: Predicting election results.
For instance, political analysts use inferential statistics to predict election outcomes based on pre-election surveys.
3. Differences Between Descriptive and Inferential Statistics
Feature | Descriptive Statistics | Inferential Statistics |
Purpose | Summarizes and describes data | Makes predictions and generalizations |
Data Usage | Uses the entire dataset | Uses a sample to infer about a population |
Techniques | Measures of central tendency, dispersion, graphs | Hypothesis testing, confidence intervals, regression |
Example | Average test score of students in one school | Predicting national student performance based on a sample |
For example, calculating the average salary of employees in a company is descriptive statistics, but using a sample to predict the national average salary is inferential statistics.
4. Importance of Descriptive and Inferential Statistics
Both descriptive and inferential statistics are essential for decision-making and research:
- In Science and Research: Helps in analyzing experiments and drawing conclusions.
- In Business and Marketing: Assists in understanding market trends and customer behavior.
- In Healthcare: Used for clinical trials and medical research.
- In Education: Helps evaluate student performance and teaching methods.
- In Government and Policy Making: Guides policy decisions and economic planning.
For example, the COVID-19 pandemic saw extensive use of descriptive statistics (tracking daily cases) and inferential statistics (predicting future infection rates).
Conclusion
Descriptive and inferential statistics are two fundamental branches of statistical analysis. Descriptive statistics helps summarize data, while inferential statistics allows us to make predictions and draw conclusions. Both are widely used in various fields, from research and medicine to business and social sciences. Understanding these concepts enables researchers and professionals to make informed, data-driven decisions.
By applying the right statistical methods, we can gain valuable insights from data, ultimately leading to better planning, innovation, and problem-solving in diverse fields.
UNIT-2 (2.2) Frequency distribution of data and Graphic presentation: Histogram, Polygon and Ogive.
рдбреЗрдЯрд╛ рдХрд╛ рдЖрд╡реГрддреНрддрд┐ рд╡рд┐рддрд░рдг рдФрд░ рдЙрд╕рдХрд╛ рдЧреНрд░рд╛рдлрд╝рд┐рдХ рдкреНрд░рд╕реНрддреБрддреАрдХрд░рдг: рд╣рд┐рд╕реНрдЯреЛрдЧреНрд░рд╛рдо, рдкреЙрд▓реАрдЧреЙрди рдФрд░ рдУрдЧрд┐рд╡
рдкрд░рд┐рдЪрдп
рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдореЗрдВ, рдбреЗрдЯрд╛ рдХреЛ рдЕрдХреНрд╕рд░ рдмрдбрд╝реА рдорд╛рддреНрд░рд╛ рдореЗрдВ рдПрдХрддреНрд░ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ, рдЬрд┐рд╕рд╕реЗ рдЗрд╕реЗ рд╕реАрдзреЗ рд╕рдордЭрдирд╛ рдФрд░ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХрд░рдирд╛ рдореБрд╢реНрдХрд┐рд▓ рд╣реЛ рд╕рдХрддрд╛ рд╣реИред рдЗрд╕рд▓рд┐рдП, рдбреЗрдЯрд╛ рдХреЛ рдЖрд╡реГрддреНрддрд┐ рд╡рд┐рддрд░рдг (Frequency Distribution) рдореЗрдВ рд╡реНрдпрд╡рд╕реНрдерд┐рдд рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдФрд░ рдЙрд╕реЗ рд╡рд┐рднрд┐рдиреНрди рдЧреНрд░рд╛рдлрд╝рд┐рдХ рд╡рд┐рдзрд┐рдпреЛрдВ (Graphical Methods) рдЬреИрд╕реЗ рд╣рд┐рд╕реНрдЯреЛрдЧреНрд░рд╛рдо (Histogram), рдЖрд╡реГрддреНрддрд┐ рдмрд╣реБрднреБрдЬ (Frequency Polygon), рдФрд░ рдУрдЧрд┐рд╡ (Ogive) рджреНрд╡рд╛рд░рд╛ рдкреНрд░рджрд░реНрд╢рд┐рдд рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
рдпреЗ рдЧреНрд░рд╛рдлрд╝ рдбреЗрдЯрд╛ рдХреА рдкреНрд░рд╡реГрддреНрддрд┐, рд╡рд┐рддрд░рдг рдФрд░ рдкреИрдЯрд░реНрди рдХреЛ рдЖрд╕рд╛рдиреА рд╕реЗ рд╕рдордЭрдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддреЗ рд╣реИрдВред рдЗрд╕ рдирд┐рдмрдВрдз рдореЗрдВ рд╣рдо рдЖрд╡реГрддреНрддрд┐ рд╡рд┐рддрд░рдг рдХреА рдЕрд╡рдзрд╛рд░рдгрд╛, рдЗрд╕рдХреЗ рдкреНрд░рдХрд╛рд░, рдирд┐рд░реНрдорд╛рдг рдХреА рд╡рд┐рдзрд┐рдпрд╛рдБ, рдФрд░ рдЗрд╕рдХреЗ рдЧреНрд░рд╛рдлрд╝рд┐рдХ рдкреНрд░рддрд┐рдирд┐рдзрд┐рддреНрд╡ рдХреЛ рд╡рд┐рд╕реНрддрд╛рд░ рд╕реЗ рд╕рдордЭреЗрдВрдЧреЗред
1. рдбреЗрдЯрд╛ рдХрд╛ рдЖрд╡реГрддреНрддрд┐ рд╡рд┐рддрд░рдг (Frequency Distribution of Data)
рдкрд░рд┐рднрд╛рд╖рд╛
рдЖрд╡реГрддреНрддрд┐ рд╡рд┐рддрд░рдг рдПрдХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рддрдХрдиреАрдХ рд╣реИ, рдЬрд┐рд╕рдореЗрдВ рдбреЗрдЯрд╛ рдХреЛ рдЕрд▓рдЧ-рдЕрд▓рдЧ рд╡рд░реНрдЧреЛрдВ (Classes) рдпрд╛ рд╕рдореВрд╣реЛрдВ (Groups) рдореЗрдВ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдФрд░ рд╣рд░ рд╡рд░реНрдЧ рдореЗрдВ рдЖрдиреЗ рд╡рд╛рд▓реЗ рдорд╛рдиреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ (Frequency) рдХреЛ рджрд░реНрдЬ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред рдпрд╣ рдмрдбрд╝реА рдорд╛рддреНрд░рд╛ рдореЗрдВ рдбреЗрдЯрд╛ рдХреЛ рд╕рдВрдХреНрд╖реЗрдк рдореЗрдВ рдкреНрд░рд╕реНрддреБрдд рдХрд░рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддрд╛ рд╣реИред
рдореБрдЦреНрдп рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдБ
- рдХрдЪреНрдЪреЗ (Raw) рдбреЗрдЯрд╛ рдХреЛ рдПрдХ рд╡реНрдпрд╡рд╕реНрдерд┐рдд рддрд╛рд▓рд┐рдХрд╛ рдореЗрдВ рдмрджрд▓рддрд╛ рд╣реИред
- рдпрд╣ рджрд┐рдЦрд╛рддрд╛ рд╣реИ рдХрд┐ рдбреЗрдЯрд╛ рдХреЗ рд╡рд┐рднрд┐рдиреНрди рдорд╛рди рдХрд┐рддрдиреА рдмрд╛рд░ рджреЛрд╣рд░рд╛рдП рдЧрдП рд╣реИрдВред
- рдбреЗрдЯрд╛ рдкреИрдЯрд░реНрди рдФрд░ рд░реБрдЭрд╛рдиреЛрдВ рдХреЛ рд╕рдордЭрдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддрд╛ рд╣реИред
- рд╡рд┐рднрд┐рдиреНрди рдЧреНрд░рд╛рдлрд╝рд┐рдХ рд╡рд┐рдзрд┐рдпреЛрдВ рджреНрд╡рд╛рд░рд╛ рдЗрд╕реЗ рдкреНрд░рджрд░реНрд╢рд┐рдд рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИред
рдЖрд╡реГрддреНрддрд┐ рд╡рд┐рддрд░рдг рдХреЗ рдкреНрд░рдХрд╛рд░
1.1 рдЕрд╕рдореВрд╣реАрдХреГрдд рдЖрд╡реГрддреНрддрд┐ рд╡рд┐рддрд░рдг (Ungrouped Frequency Distribution)
рдЬрдм рдбреЗрдЯрд╛ рдХреЗ рдорд╛рди рдХрдо рд╣реЛрддреЗ рд╣реИрдВ, рддреЛ рдЙрдиреНрд╣реЗрдВ рд╡реНрдпрдХреНрддрд┐рдЧрдд рд░реВрдк рд╕реЗ рд╕реВрдЪреАрдмрджреНрдз рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
рдЙрджрд╛рд╣рд░рдг:
10 рдЫрд╛рддреНрд░реЛрдВ рдХреЗ рдкрд░реАрдХреНрд╖рд╛ рдЕрдВрдХреЛрдВ рдХрд╛ рдбреЗрдЯрд╛:
{85, 90, 78, 85, 88, 92, 78, 85, 90, 88}
рдЗрд╕рдХрд╛ рдЖрд╡реГрддреНрддрд┐ рд╡рд┐рддрд░рдг рддрд╛рд▓рд┐рдХрд╛:
рдЕрдВрдХ (x) | рдЖрд╡реГрддреНрддрд┐ (f) |
78 | 2 |
85 | 3 |
88 | 2 |
90 | 2 |
92 | 1 |
1.2 рд╕рдореВрд╣реАрдХреГрдд рдЖрд╡реГрддреНрддрд┐ рд╡рд┐рддрд░рдг (Grouped Frequency Distribution)
рдЬрдм рдбреЗрдЯрд╛ рдмрдбрд╝рд╛ рд╣реЛрддрд╛ рд╣реИ, рддреЛ рдЗрд╕реЗ рдХреБрдЫ рд╡рд░реНрдЧреЛрдВ (Class Intervals) рдореЗрдВ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
рдЙрджрд╛рд╣рд░рдг:
рдЕрдЧрд░ рдХрд┐рд╕реА рдХрдХреНрд╖рд╛ рдореЗрдВ рдЫрд╛рддреНрд░реЛрдВ рдХреЗ рдЕрдВрдХ 40 рд╕реЗ 100 рдХреЗ рдмреАрдЪ рд╣реИрдВ, рддреЛ рдЙрдиреНрд╣реЗрдВ 10 рдХреЗ рдЕрдВрддрд░рд╛рд▓ (Class Width) рдореЗрдВ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИред
рд╡рд░реНрдЧ рдЕрдВрддрд░рд╛рд▓ (Class Interval) | рдЖрд╡реГрддреНрддрд┐ (f) |
40 – 49 | 3 |
50 – 59 | 5 |
60 – 69 | 8 |
70 – 79 | 10 |
80 – 89 | 7 |
90 – 99 | 4 |
рдЖрд╡реГрддреНрддрд┐ рд╡рд┐рддрд░рдг рддрд╛рд▓рд┐рдХрд╛ рдмрдирд╛рдиреЗ рдХреА рдкреНрд░рдХреНрд░рд┐рдпрд╛
- рдбреЗрдЯрд╛ рдПрдХрддреНрд░ рдХрд░рдирд╛ тАУ рдЕрдзреНрдпрдпрди рдХреЗ рд▓рд┐рдП рдЖрд╡рд╢реНрдпрдХ рдбреЗрдЯрд╛ рдкреНрд░рд╛рдкреНрдд рдХрд░реЗрдВред
- рд╕реАрдорд╛ (Range) рдЬреНрдЮрд╛рдд рдХрд░реЗрдВ тАУ рдЕрдзрд┐рдХрддрдо рдФрд░ рдиреНрдпреВрдирддрдо рдорд╛рдиреЛрдВ рдХреЗ рдмреАрдЪ рдХрд╛ рдЕрдВрддрд░ рдирд┐рдХрд╛рд▓реЗрдВред
- рд╡рд░реНрдЧреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рддрдп рдХрд░реЗрдВ тАУ рдЖрдорддреМрд░ рдкрд░ 5 рд╕реЗ 10 рд╡рд░реНрдЧреЛрдВ рдХрд╛ рдЪрдпрди рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
- рд╡рд░реНрдЧ рдЪреМрдбрд╝рд╛рдИ рддрдп рдХрд░реЗрдВ тАУ рд╕реАрдорд╛ рдХреЛ рд╡рд░реНрдЧреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рд╕реЗ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд░реЗрдВред
- рд╡рд░реНрдЧ рдЕрдВрддрд░рд╛рд▓ рдмрдирд╛рдПрдБ тАУ рдкреНрд░рддреНрдпреЗрдХ рд╡рд░реНрдЧ рдХреЛ рдПрдХ рдирд┐рд╢реНрдЪрд┐рдд рд╢реНрд░реЗрдгреА рдореЗрдВ рд░рдЦреЗрдВред
- рдкреНрд░рддреНрдпреЗрдХ рд╡рд░реНрдЧ рдХреА рдЖрд╡реГрддреНрддрд┐ рдЧрд┐рдиреЗрдВ тАУ рдпрд╣ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХрд░реЗрдВ рдХрд┐ рдкреНрд░рддреНрдпреЗрдХ рд╡рд░реНрдЧ рдореЗрдВ рдХрд┐рддрдиреЗ рдбреЗрдЯрд╛ рдЕрдВрдХ рдЖрддреЗ рд╣реИрдВред
2. рдбреЗрдЯрд╛ рдХрд╛ рдЧреНрд░рд╛рдлрд╝рд┐рдХ рдкреНрд░рд╕реНрддреБрддреАрдХрд░рдг (Graphical Presentation of Frequency Distribution)
2.1 рд╣рд┐рд╕реНрдЯреЛрдЧреНрд░рд╛рдо (Histogram)
рдкрд░рд┐рднрд╛рд╖рд╛
рд╣рд┐рд╕реНрдЯреЛрдЧреНрд░рд╛рдо рдПрдХ рдкреНрд░рдХрд╛рд░ рдХрд╛ рдмрд╛рд░ рдЧреНрд░рд╛рдлрд╝ (Bar Graph) рд╣реИ, рдЬреЛ рдХрд┐рд╕реА рдбреЗрдЯрд╛ рдХреЗ рдЖрд╡реГрддреНрддрд┐ рд╡рд┐рддрд░рдг рдХреЛ рджрд░реНрд╢рд╛рддрд╛ рд╣реИред рдЗрд╕рдореЗрдВ рдмрд╛рд░реНрд╕ (Bars) рдЬреБрдбрд╝реЗ рд╣реБрдП рд╣реЛрддреЗ рд╣реИрдВ, рдЬрд┐рд╕рд╕реЗ рдпрд╣ рджрд░реНрд╢рд╛рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдХрд┐ рдбреЗрдЯрд╛ рд╕рддрдд (Continuous) рд╣реИред
рдореБрдЦреНрдп рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдБ
- x-рдЕрдХреНрд╖ (Horizontal Axis) рдкрд░ рд╡рд░реНрдЧ рдЕрдВрддрд░рд╛рд▓ рд╣реЛрддреЗ рд╣реИрдВред
- y-рдЕрдХреНрд╖ (Vertical Axis) рдкрд░ рдЖрд╡реГрддреНрддрд┐ рд╣реЛрддреА рд╣реИред
- рдмрд╛рд░реНрд╕ рдХреЗ рдмреАрдЪ рдХреЛрдИ рдЕрдВрддрд░ (Gap) рдирд╣реАрдВ рд╣реЛрддрд╛ред
рд╣рд┐рд╕реНрдЯреЛрдЧреНрд░рд╛рдо рдмрдирд╛рдиреЗ рдХреА рд╡рд┐рдзрд┐
- x-рдЕрдХреНрд╖ рдкрд░ рд╡рд░реНрдЧ рдЕрдВрддрд░рд╛рд▓ рдЪрд┐рд╣реНрдирд┐рдд рдХрд░реЗрдВред
- y-рдЕрдХреНрд╖ рдкрд░ рдкреНрд░рддреНрдпреЗрдХ рд╡рд░реНрдЧ рдХреА рдЖрд╡реГрддреНрддрд┐ рдХреЛ рджрд░реНрд╢рд╛рдПрдБред
- рдкреНрд░рддреНрдпреЗрдХ рд╡рд░реНрдЧ рдХреЗ рд▓рд┐рдП рдЖрдпрдд (Rectangles) рдмрдирд╛рдПрдБ, рдЬрд┐рдирдХреА рдКрдБрдЪрд╛рдИ рдЖрд╡реГрддреНрддрд┐ рдХреЗ рдмрд░рд╛рдмрд░ рд╣реЛред
рд╣рд┐рд╕реНрдЯреЛрдЧреНрд░рд╛рдо рдХреЗ рдЙрдкрдпреЛрдЧ
- рдпрд╣ рдбреЗрдЯрд╛ рд╡рд┐рддрд░рдг рдХреЛ рджрд░реНрд╢рд╛рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддрд╛ рд╣реИред
- рдпрд╣ рд╕рд╛рдорд╛рдиреНрдп (Normal), рдЕрд╕рд╛рдорд╛рдиреНрдп (Skewed) рдпрд╛ рджреНрд╡рд┐рдХ рдкрд░реНрд╡рддреАрдп (Bimodal) рд╡рд┐рддрд░рдг рдХреЛ рджрд┐рдЦрд╛рддрд╛ рд╣реИред
- рдпрд╣ рд╡реНрдпрд╡рд╕рд╛рдп, рд╡рд┐рдЬреНрдЮрд╛рди рдФрд░ рдЕрдиреБрд╕рдВрдзрд╛рди рдореЗрдВ рд╡реНрдпрд╛рдкрдХ рд░реВрдк рд╕реЗ рдкреНрд░рдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
2.2 рдЖрд╡реГрддреНрддрд┐ рдмрд╣реБрднреБрдЬ (Frequency Polygon)
рдкрд░рд┐рднрд╛рд╖рд╛
рдЖрд╡реГрддреНрддрд┐ рдмрд╣реБрднреБрдЬ (Frequency Polygon) рдПрдХ рд░реЗрдЦрд╛ рдЧреНрд░рд╛рдлрд╝ (Line Graph) рд╣реЛрддрд╛ рд╣реИ, рдЬреЛ рд╡рд░реНрдЧ рдЕрдВрддрд░рд╛рд▓реЛрдВ рдХреЗ рдордзреНрдп рдмрд┐рдВрджреБрдУрдВ (Midpoints) рдХреЛ рдЖрд╡реГрддреНрддрд┐ рдХреЗ рдЕрдиреБрд╕рд╛рд░ рдЬреЛрдбрд╝рдХрд░ рдмрдирд╛рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
рдореБрдЦреНрдп рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдБ
- x-рдЕрдХреНрд╖ рдкрд░ рд╡рд░реНрдЧ рдордзреНрдпрдмрд┐рдВрджреБ рд╣реЛрддреЗ рд╣реИрдВред
- y-рдЕрдХреНрд╖ рдкрд░ рдЖрд╡реГрддреНрддрд┐рдпрд╛рдБ рд╣реЛрддреА рд╣реИрдВред
- рдмрд┐рдВрджреБрдУрдВ рдХреЛ рд░реЗрдЦрд╛рдУрдВ рджреНрд╡рд╛рд░рд╛ рдЬреЛрдбрд╝рд╛ рдЬрд╛рддрд╛ рд╣реИред
рдЖрд╡реГрддреНрддрд┐ рдмрд╣реБрднреБрдЬ рдмрдирд╛рдиреЗ рдХреА рд╡рд┐рдзрд┐
- рдкреНрд░рддреНрдпреЗрдХ рд╡рд░реНрдЧ рдХрд╛ рдордзреНрдпрдмрд┐рдВрджреБ (Midpoint) рдирд┐рдХрд╛рд▓реЗрдВ: рдордзреНрдпрдмрд┐рдВрджреБ=рдирд┐рдореНрди┬ард╕реАрдорд╛+рдЙрдЪреНрдЪ┬ард╕реАрдорд╛2\text{рдордзреНрдпрдмрд┐рдВрджреБ} = \frac{\text{рдирд┐рдореНрди рд╕реАрдорд╛} + \text{рдЙрдЪреНрдЪ рд╕реАрдорд╛}}{2}
- рдкреНрд░рддреНрдпреЗрдХ рдордзреНрдпрдмрд┐рдВрджреБ рдХреЗ рд▓рд┐рдП рдЖрд╡реГрддреНрддрд┐ рдмрд┐рдВрджреБ (Points) рдмрдирд╛рдПрдБред
- рдмрд┐рдВрджреБрдУрдВ рдХреЛ рд░реЗрдЦрд╛ рджреНрд╡рд╛рд░рд╛ рдЬреЛрдбрд╝реЗрдВред
- рдмрд╣реБрднреБрдЬ рдХреЛ рджреЛрдиреЛрдВ рд╕рд┐рд░реЛрдВ рдкрд░ x-рдЕрдХреНрд╖ рд╕реЗ рдорд┐рд▓рд╛рдПрдБред
рдЖрд╡реГрддреНрддрд┐ рдмрд╣реБрднреБрдЬ рдХреЗ рдЙрдкрдпреЛрдЧ
- рдпрд╣ рдбреЗрдЯрд╛ рд╡рд┐рддрд░рдг рдХреЛ рд╕реНрдкрд╖реНрдЯ рд░реВрдк рд╕реЗ рджрд░реНрд╢рд╛рддрд╛ рд╣реИред
- рдпрд╣ рд╡рд┐рднрд┐рдиреНрди рдбреЗрдЯрд╛ рд╕рдореВрд╣реЛрдВ рдХреА рддреБрд▓рдирд╛ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреЛрдЧреА рд╣реЛрддрд╛ рд╣реИред
- рдпрд╣ рд╕рдордп-рд╢реНрд░реГрдВрдЦрд▓рд╛ (Time-Series) рдбреЗрдЯрд╛ рдореЗрдВ рдмрджрд▓рд╛рд╡ рдХреЛ рджрд┐рдЦрд╛рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддрд╛ рд╣реИред
2.3 рдУрдЧрд┐рд╡ (Ogive рдпрд╛ Cumulative Frequency Curve)
рдкрд░рд┐рднрд╛рд╖рд╛
рдУрдЧрд┐рд╡ (Ogive) рдПрдХ рд╡рдХреНрд░ (Curve) рд╣реЛрддрд╛ рд╣реИ, рдЬреЛ рд╕рдВрдЪрдпреА рдЖрд╡реГрддреНрддрд┐рдпреЛрдВ (Cumulative Frequencies) рдХреЛ рдкреНрд░рджрд░реНрд╢рд┐рдд рдХрд░рддрд╛ рд╣реИред
рдУрдЧрд┐рд╡ рдХреЗ рдкреНрд░рдХрд╛рд░
- Less than Ogive: рдЗрд╕рдореЗрдВ рдЙрди рдореВрд▓реНрдпреЛрдВ рдХреА рдХреБрд▓ рд╕рдВрдЦреНрдпрд╛ рд╣реЛрддреА рд╣реИ рдЬреЛ рдХрд┐рд╕реА рд╡рд░реНрдЧ рд╕реАрдорд╛ рд╕реЗ рдХрдо рд╣реЛрддреЗ рд╣реИрдВред
- More than Ogive: рдЗрд╕рдореЗрдВ рдЙрди рдореВрд▓реНрдпреЛрдВ рдХреА рдХреБрд▓ рд╕рдВрдЦреНрдпрд╛ рд╣реЛрддреА рд╣реИ рдЬреЛ рдХрд┐рд╕реА рд╡рд░реНрдЧ рд╕реАрдорд╛ рд╕реЗ рдЕрдзрд┐рдХ рд╣реЛрддреЗ рд╣реИрдВред
рдУрдЧрд┐рд╡ рдмрдирд╛рдиреЗ рдХреА рд╡рд┐рдзрд┐
- рд╕рдВрдЪрдпреА рдЖрд╡реГрддреНрддрд┐ рддрд╛рд▓рд┐рдХрд╛ рдмрдирд╛рдПрдБред
- рд╡рд░реНрдЧ рд╕реАрдорд╛рдУрдВ рдХреЗ рдЦрд┐рд▓рд╛рдл рд╕рдВрдЪрдпреА рдЖрд╡реГрддреНрддрд┐рдпреЛрдВ рдХреЛ рдкреНрд▓реЙрдЯ рдХрд░реЗрдВред
- рдПрдХ рдЪрд┐рдХрдиреА рд╡рдХреНрд░ (Smooth Curve) рдмрдирд╛рдПрдБред
рдУрдЧрд┐рд╡ рдХреЗ рдЙрдкрдпреЛрдЧ
- рдпрд╣ рдорд╛рдзреНрдпрд┐рдХрд╛ (Median) рдФрд░ рдкреНрд░рддрд┐рд╢рддрдХ (Percentiles) рдХреЛ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХрд░рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддрд╛ рд╣реИред
- рдпрд╣ рдбреЗрдЯрд╛ рд╕рдВрдЪрдп (Cumulative Growth) рдХреЛ рджрд┐рдЦрд╛рддрд╛ рд╣реИред
рдирд┐рд╖реНрдХрд░реНрд╖
рдЖрд╡реГрддреНрддрд┐ рд╡рд┐рддрд░рдг рдбреЗрдЯрд╛ рдХреЛ рд╡реНрдпрд╡рд╕реНрдерд┐рдд рдХрд░рдиреЗ рдХрд╛ рдПрдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рддрд░реАрдХрд╛ рд╣реИ, рдЬрд┐рд╕рд╕реЗ рдбреЗрдЯрд╛ рдХреЛ рдЖрд╕рд╛рдиреА рд╕реЗ рд╕рдордЭрд╛ рдФрд░ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИред рд╣рд┐рд╕реНрдЯреЛрдЧреНрд░рд╛рдо, рдЖрд╡реГрддреНрддрд┐ рдмрд╣реБрднреБрдЬ рдФрд░ рдУрдЧрд┐рд╡ рдЬреИрд╕реЗ рдЧреНрд░рд╛рдлрд╝рд┐рдХ рдЙрдкрдХрд░рдг рдбреЗрдЯрд╛ рд╡рд┐рддрд░рдг рдХреЗ рдкреИрдЯрд░реНрди рдХреЛ рд╕реНрдкрд╖реНрдЯ рд░реВрдк рд╕реЗ рдкреНрд░рджрд░реНрд╢рд┐рдд рдХрд░рддреЗ рд╣реИрдВред рдЗрди рддрдХрдиреАрдХреЛрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рд╡рд┐рднрд┐рдиреНрди рдХреНрд╖реЗрддреНрд░реЛрдВ рдЬреИрд╕реЗ рд╢рд┐рдХреНрд╖рд╛, рд╡реНрдпрд╛рдкрд╛рд░, рдЪрд┐рдХрд┐рддреНрд╕рд╛, рдФрд░ рдЕрдиреБрд╕рдВрдзрд╛рди рдореЗрдВ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рддрд╛рдХрд┐ рдирд┐рд░реНрдгрдп рд▓реЗрдиреЗ рдореЗрдВ рд╕рд╣рд╛рдпрддрд╛ рдорд┐рд▓ рд╕рдХреЗред
UNIT-2 (2.2) Frequency distribution of data and Graphic presentation: Histogram, Polygon and Ogive.
Introduction
In statistics, data is often collected in large quantities, making it difficult to analyze or interpret in its raw form. To make sense of data, statisticians organize it into a structured form known as a frequency distribution and represent it visually using different graphs, including histograms, frequency polygons, and ogives. These graphical representations help in understanding patterns, trends, and distributions of data effectively.
This essay explores the concept of frequency distribution, its types, methods of construction, and its graphical representations, specifically histogram, frequency polygon, and ogive.
1. Frequency Distribution of Data
Definition
A frequency distribution is a systematic way of arranging data into classes or groups along with their corresponding frequencies (the number of times a particular value or group of values appears). It helps in summarizing large datasets for easier analysis.
Key Features
- Organizes raw data into a structured format.
- Displays the frequency (count) of values in each group.
- Helps identify trends and patterns in data.
- Useful for statistical analysis and graphical representation.
Types of Frequency Distribution
- Ungrouped Frequency Distribution
- Used when data values are few and can be listed individually.
- Example: Test scores of 10 students тАУ {85, 90, 78, 85, 88, 92, 78, 85, 90, 88}.
- Frequency table:
Score (x) | Frequency (f) |
78 | 2 |
85 | 3 |
88 | 2 |
90 | 2 |
92 | 1 |
- Grouped Frequency Distribution
- Used for large datasets by dividing data into class intervals.
- Example: Student test scores ranging from 40 to 100, grouped in class intervals of 10.
Class Interval | Frequency (f) |
40 – 49 | 3 |
50 – 59 | 5 |
60 – 69 | 8 |
70 – 79 | 10 |
80 – 89 | 7 |
90 – 99 | 4 |
Steps to Construct a Frequency Distribution Table
- Collect the data тАУ Gather the dataset to be analyzed.
- Determine the range тАУ Find the difference between the highest and lowest values.
- Select the number of class intervals тАУ Typically between 5 and 10 for readability.
- Determine class width тАУ Divide the range by the number of intervals.
- Create class intervals тАУ Ensure they are mutually exclusive and exhaustive.
- Count the frequency тАУ Record how many values fall into each interval.
2. Graphical Presentation of Frequency Distribution
Graphical representation makes it easier to visualize data patterns. The three primary graphs for frequency distributions are histograms, frequency polygons, and ogives.
2.1 Histogram
Definition
A histogram is a bar graph that represents the frequency distribution of a dataset. Unlike bar charts, histograms have adjacent bars, showing that the data is continuous.
Features of a Histogram
- The x-axis (horizontal axis) represents the class intervals.
- The y-axis (vertical axis) represents the frequency of occurrences.
- Bars are adjacent, indicating continuous data.
Steps to Construct a Histogram
- Draw x-axis and label it with class intervals.
- Draw y-axis and label it with frequencies.
- Draw rectangular bars for each class interval, where the height represents the frequency.
- Ensure there are no gaps between bars.
Example
Class Interval | Frequency (f) |
40 – 49 | 3 |
50 – 59 | 5 |
60 – 69 | 8 |
70 – 79 | 10 |
80 – 89 | 7 |
90 – 99 | 4 |
In the histogram, the bars for each class interval would have the following heights: 3, 5, 8, 10, 7, and 4.
Uses of Histogram
- Helps in understanding the distribution shape (normal, skewed, bimodal, etc.).
- Useful in statistical analysis for large datasets.
- Commonly used in quality control and research studies.
2.2 Frequency Polygon
Definition
A frequency polygon is a line graph that connects the midpoints of the tops of histogram bars, providing a smoother representation of data distribution.
Features of a Frequency Polygon
- The x-axis represents class midpoints.
- The y-axis represents frequencies.
- A continuous line is drawn through plotted points.
Steps to Construct a Frequency Polygon
- Find the midpoints of each class interval: Midpoint=Lower┬аBound+Upper┬аBound2\text{Midpoint} = \frac{\text{Lower Bound} + \text{Upper Bound}}{2}
- Plot the midpoints against the frequencies.
- Connect the points using straight lines.
- Extend the polygon to the x-axis at both ends for closure.
Example Calculation for Midpoints
Class Interval | Midpoint | Frequency (f) |
40 – 49 | 44.5 | 3 |
50 – 59 | 54.5 | 5 |
60 – 69 | 64.5 | 8 |
70 – 79 | 74.5 | 10 |
80 – 89 | 84.5 | 7 |
90 – 99 | 94.5 | 4 |
Uses of Frequency Polygon
- Shows overall trends in data distribution.
- Easier to compare multiple distributions on the same graph.
- Useful in understanding fluctuations over intervals.
2.3 Ogive (Cumulative Frequency Curve)
Definition
An ogive is a graph that represents cumulative frequencies, showing how data accumulates over intervals. There are two types:
- Less than ogive: Plots cumulative frequencies of values less than class limits.
- More than ogive: Plots cumulative frequencies of values greater than class limits.
Features of an Ogive
- The x-axis represents class boundaries.
- The y-axis represents cumulative frequencies.
- A smooth curve is drawn through the plotted points.
Steps to Construct an Ogive
- Create a cumulative frequency table:
Class Interval | Frequency (f) | Cumulative Frequency (Less than) |
40 – 49 | 3 | 3 |
50 – 59 | 5 | 3 + 5 = 8 |
60 – 69 | 8 | 8 + 8 = 16 |
70 – 79 | 10 | 16 + 10 = 26 |
80 – 89 | 7 | 26 + 7 = 33 |
90 – 99 | 4 | 33 + 4 = 37 |
- Plot cumulative frequencies against the class boundaries.
- Draw a smooth curve through the points.
Uses of Ogive
- Helps in determining median and percentiles.
- Useful in comparing distributions.
- Shows cumulative trends effectively.
Conclusion
Frequency distributions and their graphical representationsтАФhistograms, frequency polygons, and ogivesтАФare essential tools in statistics. They provide insights into data distribution, trends, and patterns, making it easier to interpret and analyze large datasets. These methods are widely used in research, business, healthcare, and other fields to make data-driven decisions. Understanding how to construct and interpret these graphs is fundamental for statistical analysis and real-world applications.
UNIT-2(2.3) Measures of Central tendency: Calculation of Mean, Median and Mode.
рдХреЗрдиреНрджреНрд░реАрдп рдкреНрд░рд╡реГрддреНрддрд┐ рдХреЗ рдорд╛рдк: рдорд╛рдзреНрдп, рдорд╛рдзреНрдпрд┐рдХрд╛ рдФрд░ рдмрд╣реБрд▓рдХ рдХреА рдЧрдгрдирд╛
рдкрд░рд┐рдЪрдп
рд╕рд╛рдВрдЦреНрдпрд┐рдХреА (Statistics) рдореЗрдВ, рдХреЗрдиреНрджреНрд░реАрдп рдкреНрд░рд╡реГрддреНрддрд┐ рдХреЗ рдорд╛рдк (Measures of Central Tendency) рдХрд╛ рдЙрдкрдпреЛрдЧ рдбреЗрдЯрд╛ рдХреЗ рдХреЗрдВрджреНрд░реАрдп рдпрд╛ рд╕рд╛рдорд╛рдиреНрдп рдорд╛рди рдХреЛ рд╕рдордЭрдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред рддреАрди рдкреНрд░рдореБрдЦ рдХреЗрдиреНрджреНрд░реАрдп рдкреНрд░рд╡реГрддреНрддрд┐ рдХреЗ рдорд╛рдк рд╣реЛрддреЗ рд╣реИрдВ:
- рдорд╛рдзреНрдп (Mean) тАУ рд╕рднреА рдорд╛рдиреЛрдВ рдХреЗ рдпреЛрдЧ рдХреЛ рдХреБрд▓ рдорд╛рдиреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рд╕реЗ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд░рдХреЗ рдкреНрд░рд╛рдкреНрдд рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
- рдорд╛рдзреНрдпрд┐рдХрд╛ (Median) тАУ рдЬрдм рдбреЗрдЯрд╛ рдХреЛ рдХреНрд░рдордмрджреНрдз рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ, рддреЛ рдпрд╣ рдордзреНрдп рдорд╛рди рд╣реЛрддрд╛ рд╣реИред
- рдмрд╣реБрд▓рдХ (Mode) тАУ рдбреЗрдЯрд╛ рдореЗрдВ рд╕рдмрд╕реЗ рдЕрдзрд┐рдХ рдмрд╛рд░ рдЖрдиреЗ рд╡рд╛рд▓рд╛ рдорд╛рдиред
рдпреЗ рддреАрдиреЛрдВ рдорд╛рдк рдбреЗрдЯрд╛ рдХреЗ рд╡рд┐рддрд░рдг рдХреЛ рдЕрд▓рдЧ-рдЕрд▓рдЧ рддрд░реАрдХреЛрдВ рд╕реЗ рд╡реНрдпрд╛рдЦреНрдпрд╛ рдХрд░рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддреЗ рд╣реИрдВред рдЗрд╕ рдирд┐рдмрдВрдз рдореЗрдВ рд╣рдо рдорд╛рдзреНрдп, рдорд╛рдзреНрдпрд┐рдХрд╛ рдФрд░ рдмрд╣реБрд▓рдХ рдХреА рдкрд░рд┐рднрд╛рд╖рд╛, рд╕реВрддреНрд░ рдФрд░ рдЙрдирдХреА рдЧрдгрдирд╛ рдХреЛ рд╡рд┐рд╕реНрддреГрдд рд░реВрдк рд╕реЗ рд╕рдордЭреЗрдВрдЧреЗред
1. рдорд╛рдзреНрдп (Mean)
рдкрд░рд┐рднрд╛рд╖рд╛
рдорд╛рдзреНрдп рдХреЛ рдЖрдорддреМрд░ рдкрд░ рдФрд╕рдд (Average) рдХрд╣рд╛ рдЬрд╛рддрд╛ рд╣реИред рдпрд╣ рд╕рднреА рдбреЗрдЯрд╛ рдорд╛рдиреЛрдВ рдХреЗ рдпреЛрдЧ рдХреЛ рдХреБрд▓ рдорд╛рдиреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рд╕реЗ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд░рдХреЗ рдкреНрд░рд╛рдкреНрдд рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
рдорд╛рдзреНрдп рдХреЗ рд╕реВрддреНрд░
(рдХ) рдЕрд╕рдореВрд╣реАрдХреГрдд рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рдорд╛рдзреНрдп
рдорд╛рдзреНрдп(X╦Й)=тИСXN\text{рдорд╛рдзреНрдп} (\bar{X}) = \frac{\sum X}{N}
рдЬрд╣рд╛рдБ,
- тИСX\sum X = рд╕рднреА рдорд╛рдиреЛрдВ рдХрд╛ рдпреЛрдЧ
- NN = рдХреБрд▓ рдорд╛рдиреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛
(рдЦ) рд╕рдореВрд╣реАрдХреГрдд рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рдорд╛рдзреНрдп
рдорд╛рдзреНрдп(X╦Й)=тИСfXтИСf\text{рдорд╛рдзреНрдп} (\bar{X}) = \frac{\sum fX}{\sum f}
рдЬрд╣рд╛рдБ,
- ff = рдкреНрд░рддреНрдпреЗрдХ рд╡рд░реНрдЧ рдХреА рдЖрд╡реГрддреНрддрд┐
- XX = рдкреНрд░рддреНрдпреЗрдХ рд╡рд░реНрдЧ рдХрд╛ рдордзреНрдп рдмрд┐рдВрджреБ
- тИСfX\sum fX = рд╕рднреА рд╡рд░реНрдЧреЛрдВ рдХреЗ рдордзреНрдп рдмрд┐рдВрджреБ рдФрд░ рдЙрдирдХреА рдЖрд╡реГрддреНрддрд┐рдпреЛрдВ рдХреЗ рдЧреБрдгрдирдлрд▓ рдХрд╛ рдпреЛрдЧ
- тИСf\sum f = рдХреБрд▓ рдЖрд╡реГрддреНрддрд┐
рдЙрджрд╛рд╣рд░рдг 1: рдЕрд╕рдореВрд╣реАрдХреГрдд рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рдорд╛рдзреНрдп
рдорд╛рди рд▓реАрдЬрд┐рдП 5 рдЫрд╛рддреНрд░реЛрдВ рдХреЗ рдЕрдВрдХ рдЗрд╕ рдкреНрд░рдХрд╛рд░ рд╣реИрдВ: 40, 50, 60, 70, 80
рдорд╛рдзреНрдп=(40+50+60+70+80)5=3005=60\text{рдорд╛рдзреНрдп} = \frac{(40 + 50 + 60 + 70 + 80)}{5} = \frac{300}{5} = 60
рдЙрджрд╛рд╣рд░рдг 2: рд╕рдореВрд╣реАрдХреГрдд рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рдорд╛рдзреНрдп
рдиреАрдЪреЗ рджрд┐рдП рдЧрдП рдбреЗрдЯрд╛ рдХреЛ рджреЗрдЦреЗрдВ:
рд╡рд░реНрдЧ рдЕрдВрддрд░рд╛рд▓ (Class Interval) | рдЖрд╡реГрддреНрддрд┐ (f) | рдордзреНрдп рдмрд┐рдВрджреБ (X) | fX |
10 – 20 | 3 | 15 | 45 |
20 – 30 | 5 | 25 | 125 |
30 – 40 | 7 | 35 | 245 |
40 – 50 | 10 | 45 | 450 |
50 – 60 | 5 | 55 | 275 |
рдпреЛрдЧ (Total) | 30 | 1140 |
рдорд╛рдзреНрдп=114030=38\text{рдорд╛рдзреНрдп} = \frac{1140}{30} = 38
рдЗрд╕ рдкреНрд░рдХрд╛рд░, рдЗрд╕ рдбреЗрдЯрд╛ рдХрд╛ рдорд╛рдзреНрдп 38 рд╣реИред
2. рдорд╛рдзреНрдпрд┐рдХрд╛ (Median)
рдкрд░рд┐рднрд╛рд╖рд╛
рдорд╛рдзреНрдпрд┐рдХрд╛ рдПрдХ рдРрд╕рд╛ рдорд╛рди рд╣реИ рдЬреЛ рдбреЗрдЯрд╛ рдХреЛ рджреЛ рд╕рдорд╛рди рднрд╛рдЧреЛрдВ рдореЗрдВ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд░рддрд╛ рд╣реИред
рдорд╛рдзреНрдпрд┐рдХрд╛ рдЬреНрдЮрд╛рдд рдХрд░рдиреЗ рдХреА рдкреНрд░рдХреНрд░рд┐рдпрд╛
- рдбреЗрдЯрд╛ рдХреЛ рдЖрд░реЛрд╣реА рдХреНрд░рдо (Ascending Order) рдореЗрдВ рд╡реНрдпрд╡рд╕реНрдерд┐рдд рдХрд░реЗрдВред
- рдорд╛рдзреНрдпрд┐рдХрд╛ рдХрд╛ рд╕реНрдерд╛рди рдирд┐рдХрд╛рд▓реЗрдВ: рдорд╛рдзреНрдпрд┐рдХрд╛┬ард╕реНрдерд╛рди=N+12\text{рдорд╛рдзреНрдпрд┐рдХрд╛ рд╕реНрдерд╛рди} = \frac{N+1}{2} рдЬрд╣рд╛рдБ NN рдХреБрд▓ рдорд╛рдиреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рд╣реИред
- рдпрджрд┐ NN рд╡рд┐рд╖рдо рд╣реИ, рддреЛ рдорд╛рдзреНрдпрд┐рдХрд╛ рд╕реАрдзрд╛ рдордзреНрдп рдорд╛рди рд╣реЛрдЧрд╛ред
- рдпрджрд┐ NN рд╕рдо рд╣реИ, рддреЛ рдорд╛рдзреНрдпрд┐рдХрд╛ рджреЛ рдордзреНрдп рдорд╛рдиреЛрдВ рдХрд╛ рдФрд╕рдд рд╣реЛрдЧрд╛ред
рд╕рдореВрд╣реАрдХреГрдд рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рдорд╛рдзреНрдпрд┐рдХрд╛ рдХрд╛ рд╕реВрддреНрд░
рдорд╛рдзреНрдпрд┐рдХрд╛=L+(N2тИТCFf)├Чh\text{рдорд╛рдзреНрдпрд┐рдХрд╛} = L + \left( \frac{\frac{N}{2} – CF}{f} \right) \times h
рдЬрд╣рд╛рдБ:
- LL = рдорд╛рдзреНрдпрд┐рдХрд╛ рд╡рд░реНрдЧ рдХреА рдирд┐рдореНрди рд╕реАрдорд╛
- NN = рдХреБрд▓ рдЖрд╡реГрддреНрддрд┐
- CFCF = рдорд╛рдзреНрдпрд┐рдХрд╛ рд╡рд░реНрдЧ рдХреЗ рдкрд╣рд▓реЗ рдХреА рд╕рдВрдЪрдпреА рдЖрд╡реГрддреНрддрд┐
- ff = рдорд╛рдзреНрдпрд┐рдХрд╛ рд╡рд░реНрдЧ рдХреА рдЖрд╡реГрддреНрддрд┐
- hh = рд╡рд░реНрдЧ рдЪреМрдбрд╝рд╛рдИ
рдЙрджрд╛рд╣рд░рдг 1: рдЕрд╕рдореВрд╣реАрдХреГрдд рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рдорд╛рдзреНрдпрд┐рдХрд╛
рдорд╛рди рд▓реАрдЬрд┐рдП, рдбреЗрдЯрд╛ рдЗрд╕ рдкреНрд░рдХрд╛рд░ рд╣реИ: 25, 30, 35, 40, 45, 50, 55
рдпрд╣рд╛рдБ N=7N = 7 (рд╡рд┐рд╖рдо рд╕рдВрдЦреНрдпрд╛), рдЗрд╕рд▓рд┐рдП:
рдорд╛рдзреНрдпрд┐рдХрд╛ рд╕реНрдерд╛рди=7+12=4\text{рдорд╛рдзреНрдпрд┐рдХрд╛ рд╕реНрдерд╛рди} = \frac{7+1}{2} = 4
рдЗрд╕рд▓рд┐рдП, 4рд╡рд╛рдБ рдорд╛рди = 40, рдЕрддрдГ рдорд╛рдзреНрдпрд┐рдХрд╛ = 40ред
рдпрджрд┐ рдбреЗрдЯрд╛ рд╣реЛрддрд╛: 25, 30, 35, 40, 45, 50 (рд╕рдо рд╕рдВрдЦреНрдпрд╛ N=6N = 6),
рдорд╛рдзреНрдпрд┐рдХрд╛=(35+40)2=37.5\text{рдорд╛рдзреНрдпрд┐рдХрд╛} = \frac{(35 + 40)}{2} = 37.5
3. рдмрд╣реБрд▓рдХ (Mode)
рдкрд░рд┐рднрд╛рд╖рд╛
рдмрд╣реБрд▓рдХ рд╡рд╣ рдорд╛рди рд╣реЛрддрд╛ рд╣реИ рдЬреЛ рдбреЗрдЯрд╛ рдореЗрдВ рд╕рдмрд╕реЗ рдЕрдзрд┐рдХ рдмрд╛рд░ рдЖрддрд╛ рд╣реИред
рдмрд╣реБрд▓рдХ рдЬреНрдЮрд╛рдд рдХрд░рдиреЗ рдХреА рдкреНрд░рдХреНрд░рд┐рдпрд╛
- рдЕрд╕рдореВрд╣реАрдХреГрдд рдбреЗрдЯрд╛ рдореЗрдВ рд╕рдмрд╕реЗ рдЕрдзрд┐рдХ рдмрд╛рд░ рдЖрдиреЗ рд╡рд╛рд▓рд╛ рдорд╛рди рдЦреЛрдЬреЗрдВред
- рд╕рдореВрд╣реАрдХреГрдд рдбреЗрдЯрд╛ рдореЗрдВ рд╕рдмрд╕реЗ рдЕрдзрд┐рдХ рдЖрд╡реГрддреНрддрд┐ рд╡рд╛рд▓реЗ рд╡рд░реНрдЧ (Modal Class) рдХреА рдкрд╣рдЪрд╛рди рдХрд░реЗрдВред
- рдирд┐рдореНрди рд╕реВрддреНрд░ рдХрд╛ рдкреНрд░рдпреЛрдЧ рдХрд░реЗрдВ:
рдмрд╣реБрд▓рдХ=L+(f1тИТf0(2f1тИТf0тИТf2))├Чh\text{рдмрд╣реБрд▓рдХ} = L + \left( \frac{f_1 – f_0}{(2f_1 – f_0 – f_2)} \right) \times h
рдЬрд╣рд╛рдБ:
- LL = рдмрд╣реБрд▓рдХ рд╡рд░реНрдЧ рдХреА рдирд┐рдореНрди рд╕реАрдорд╛
- f1f_1 = рдмрд╣реБрд▓рдХ рд╡рд░реНрдЧ рдХреА рдЖрд╡реГрддреНрддрд┐
- f0f_0 = рдмрд╣реБрд▓рдХ рд╡рд░реНрдЧ рд╕реЗ рдкрд╣рд▓реЗ рдХреА рдЖрд╡реГрддреНрддрд┐
- f2f_2 = рдмрд╣реБрд▓рдХ рд╡рд░реНрдЧ рдХреЗ рдмрд╛рдж рдХреА рдЖрд╡реГрддреНрддрд┐
- hh = рд╡рд░реНрдЧ рдЪреМрдбрд╝рд╛рдИ
рдЙрджрд╛рд╣рд░рдг 1: рдЕрд╕рдореВрд╣реАрдХреГрдд рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рдмрд╣реБрд▓рдХ
рдпрджрд┐ рдбреЗрдЯрд╛ рдЗрд╕ рдкреНрд░рдХрд╛рд░ рд╣реИ: 2, 3, 3, 5, 6, 3, 8, 9, 3
рддреЛ рд╕рдмрд╕реЗ рдЕрдзрд┐рдХ рдмрд╛рд░ 3 рдЖрддрд╛ рд╣реИ, рдЕрддрдГ рдмрд╣реБрд▓рдХ = 3ред
рдЙрджрд╛рд╣рд░рдг 2: рд╕рдореВрд╣реАрдХреГрдд рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рдмрд╣реБрд▓рдХ
рд╡рд░реНрдЧ рдЕрдВрддрд░рд╛рд▓ | рдЖрд╡реГрддреНрддрд┐ (f) |
10 – 20 | 3 |
20 – 30 | 7 |
30 – 40 | 12 |
40 – 50 | 8 |
50 – 60 | 5 |
рдмрд╣реБрд▓рдХ=30+(12тИТ7(2├Ч12тИТ7тИТ8))├Ч10\text{рдмрд╣реБрд▓рдХ} = 30 + \left( \frac{12 – 7}{(2 \times 12 – 7 – 8)} \right) \times 10 =30+5.56=35.56= 30 + 5.56 = 35.56
рдЕрддрдГ рдмрд╣реБрд▓рдХ = 35.56ред
рдирд┐рд╖реНрдХрд░реНрд╖
рдорд╛рдзреНрдп, рдорд╛рдзреНрдпрд┐рдХрд╛ рдФрд░ рдмрд╣реБрд▓рдХ рдбреЗрдЯрд╛ рдХрд╛ рдХреЗрдВрджреНрд░реАрдп рдорд╛рди рдЬреНрдЮрд╛рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рдорд╛рдк рд╣реИрдВред рдорд╛рдзреНрдп рдФрд╕рдд рдХреЛ рджрд░реНрд╢рд╛рддрд╛ рд╣реИ, рдорд╛рдзреНрдпрд┐рдХрд╛ рдордзреНрдп рдорд╛рди рдХреЛ рдмрддрд╛рддрд╛ рд╣реИ, рдФрд░ рдмрд╣реБрд▓рдХ рд╕рдмрд╕реЗ рдЕрдзрд┐рдХ рдмрд╛рд░ рдЖрдиреЗ рд╡рд╛рд▓реЗ рдорд╛рди рдХреЛ рдЗрдВрдЧрд┐рдд рдХрд░рддрд╛ рд╣реИред рдпреЗ рдЙрдкрд╛рдп рдЕрдиреБрд╕рдВрдзрд╛рди, рд╡реНрдпрд╛рдкрд╛рд░, рдЕрд░реНрдерд╢рд╛рд╕реНрддреНрд░, рдФрд░ рд╡рд┐рдЬреНрдЮрд╛рди рдореЗрдВ рдирд┐рд░реНрдгрдп рд▓реЗрдиреЗ рдХреЗ рд▓рд┐рдП рдЖрд╡рд╢реНрдпрдХ рд╣реЛрддреЗ рд╣реИрдВред
UNIT-2(2.3) Measures of Central tendency: Calculation of Mean, Median and Mode.
Introduction
In statistics, measures of central tendency are used to describe the central or typical value of a dataset. The three most commonly used measures are:
- Mean (Average) тАУ The sum of all values divided by the number of values.
- Median тАУ The middle value when data is arranged in order.
- Mode тАУ The most frequently occurring value(s) in the dataset.
Each measure provides a different perspective on data distribution and is useful in different scenarios. In this essay, we will explore the definitions, formulas, and step-by-step calculations of mean, median, and mode for both ungrouped and grouped data with examples.
1. Mean (Arithmetic Mean)
Definition
The mean is the sum of all observations divided by the total number of observations. It is the most commonly used measure of central tendency.
Formula for Mean
(a) Mean for Ungrouped Data
Mean(X╦Й)=тИСXN\text{Mean} (\bar{X}) = \frac{\sum X}{N}
where:
- тИСX\sum X = Sum of all values
- NN = Total number of values
(b) Mean for Grouped Data
Mean(X╦Й)=тИСfXтИСf\text{Mean} (\bar{X}) = \frac{\sum fX}{\sum f}
where:
- ff = Frequency of each class
- XX = Midpoint of each class interval
- тИСfX\sum fX = Sum of the product of midpoints and frequencies
- тИСf\sum f = Total frequency
Example 1: Mean for Ungrouped Data
Consider the marks of 5 students: 40, 50, 60, 70, 80
Mean=(40+50+60+70+80)5=3005=60\text{Mean} = \frac{(40 + 50 + 60 + 70 + 80)}{5} = \frac{300}{5} = 60
Example 2: Mean for Grouped Data
Consider the following grouped frequency distribution:
Class Interval | Frequency (f) | Midpoint (X) | fX |
10 – 20 | 3 | 15 | 45 |
20 – 30 | 5 | 25 | 125 |
30 – 40 | 7 | 35 | 245 |
40 – 50 | 10 | 45 | 450 |
50 – 60 | 5 | 55 | 275 |
Total | 30 | 1140 |
Mean=114030=38\text{Mean} = \frac{1140}{30} = 38
Thus, the mean of this dataset is 38.
2. Median
Definition
The median is the middle value of an ordered dataset. It divides the data into two equal halves.
Steps to Find the Median
- Arrange the data in ascending order.
- Find the position of the median using the formula: Median┬аPosition=N+12\text{Median Position} = \frac{N+1}{2} where NN is the total number of values.
- If NN is odd, the median is the middle value.
- If NN is even, the median is the average of the two middle values.
Formula for Median in Grouped Data
Median=L+(N2тИТCFf)├Чh\text{Median} = L + \left( \frac{\frac{N}{2} – CF}{f} \right) \times h
where:
- LL = Lower boundary of the median class
- NN = Total frequency
- CFCF = Cumulative frequency before the median class
- ff = Frequency of the median class
- hh = Class width
Example 1: Median for Ungrouped Data
Consider the dataset: 25, 30, 35, 40, 45, 50, 55
Total values: N=7N = 7 (odd), so the median is:
Median Position=7+12=4\text{Median Position} = \frac{7+1}{2} = 4
Thus, the 4th value is 40, so median = 40.
If the dataset were: 25, 30, 35, 40, 45, 50 (even N=6N = 6),
Median=(35+40)2=37.5\text{Median} = \frac{(35 + 40)}{2} = 37.5
Example 2: Median for Grouped Data
Consider the dataset:
Class Interval | Frequency (f) | Cumulative Frequency (CF) |
10 – 20 | 3 | 3 |
20 – 30 | 5 | 8 |
30 – 40 | 7 | 15 |
40 – 50 | 10 | 25 |
50 – 60 | 5 | 30 |
Total N=30N = 30, so N/2=15N/2 = 15. The median class is 30 – 40 (where CF reaches 15).
Median=30+(15тИТ87)├Ч10\text{Median} = 30 + \left( \frac{15 – 8}{7} \right) \times 10 =30+(77)├Ч10=30+10=40= 30 + \left( \frac{7}{7} \right) \times 10 = 30 + 10 = 40
Thus, the median = 40.
3. Mode
Definition
The mode is the value that appears most frequently in a dataset. It is useful for categorical, discrete, and continuous data.
Steps to Find the Mode
- Identify the most frequently occurring value in ungrouped data.
- In grouped data, find the modal class (class with the highest frequency).
- Use the formula for grouped data:
Mode=L+(f1тИТf0(2f1тИТf0тИТf2))├Чh\text{Mode} = L + \left( \frac{f_1 – f_0}{(2f_1 – f_0 – f_2)} \right) \times h
where:
- LL = Lower boundary of the modal class
- f1f_1 = Frequency of the modal class
- f0f_0 = Frequency of the class before the modal class
- f2f_2 = Frequency of the class after the modal class
- hh = Class width
Example 1: Mode for Ungrouped Data
Given the data: 2, 3, 3, 5, 6, 3, 8, 9, 3
Since 3 appears the most times, the mode = 3.
Example 2: Mode for Grouped Data
Class Interval | Frequency (f) |
10 – 20 | 3 |
20 – 30 | 7 |
30 – 40 | 12 |
40 – 50 | 8 |
50 – 60 | 5 |
Using the formula:
Mode=30+(12тИТ7(2├Ч12тИТ7тИТ8))├Ч10\text{Mode} = 30 + \left( \frac{12 – 7}{(2 \times 12 – 7 – 8)} \right) \times 10 =30+(5(24тИТ15))├Ч10= 30 + \left( \frac{5}{(24 – 15)} \right) \times 10 =30+(59)├Ч10= 30 + \left( \frac{5}{9} \right) \times 10 =30+5.56=35.56= 30 + 5.56 = 35.56
Thus, mode = 35.56.
Conclusion
The three measures of central tendencyтАФmean, median, and modeтАФprovide different insights into a dataset. The mean is most affected by extreme values, while the median is more robust, and the mode is useful for identifying common values. These measures are widely used in research, economics, psychology, and business analytics for data analysis and decision-making. Understanding how to calculate and interpret them is essential for statistical studies.
UNIT-2(2.4) Measures of Variability: Calculation of Range, QD, AD, SD.
рдкреНрд░рд╕рд░рдг рдХреЗ рдорд╛рдк: рд╕реАрдорд╛ (Range), рдЪрддреБрд░реНрдердХ рд╡рд┐рдЪрд▓рди (QD), рдорд╛рдзреНрдп рдкрд░рд╛рд╕ рд╡рд┐рдЪрд▓рди (AD), рдФрд░ рдорд╛рдирдХ рд╡рд┐рдЪрд▓рди (SD) рдХреА рдЧрдгрдирд╛
рдкрд░рд┐рдЪрдп
рд╕рд╛рдВрдЦреНрдпрд┐рдХреА (Statistics) рдореЗрдВ, рдкреНрд░рд╕рд░рдг (Variability) рдпрд╣ рджрд░реНрд╢рд╛рддрд╛ рд╣реИ рдХрд┐ рдХрд┐рд╕реА рдбреЗрдЯрд╛ рд╕реЗрдЯ рдХреЗ рдорд╛рди рдХрд┐рддрдиреЗ рдлреИрд▓реЗ рд╣реБрдП рдпрд╛ рдПрдХ-рджреВрд╕рд░реЗ рд╕реЗ рдХрд┐рддрдиреЗ рднрд┐рдиреНрди рд╣реИрдВред рдЬрдмрдХрд┐ рдХреЗрдиреНрджреНрд░реАрдп рдкреНрд░рд╡реГрддреНрддрд┐ рдХреЗ рдорд╛рдк (Measures of Central Tendency) (рдЬреИрд╕реЗ рдорд╛рдзреНрдп, рдорд╛рдзреНрдпрд┐рдХрд╛ рдФрд░ рдмрд╣реБрд▓рдХ) рдбреЗрдЯрд╛ рдХреЗ рдХреЗрдВрджреНрд░реАрдп рдорд╛рди рдХреЛ рд╡реНрдпрдХреНрдд рдХрд░рддреЗ рд╣реИрдВ, рдкреНрд░рд╕рд░рдг рдХреЗ рдорд╛рдк рдбреЗрдЯрд╛ рдХреА рд╡рд┐рд╡рд┐рдзрддрд╛ рдпрд╛ рдлреИрд▓рд╛рд╡ рдХреЛ рджрд░реНрд╢рд╛рддреЗ рд╣реИрдВред
рдкреНрд░рд╕рд░рдг рдХреЗ рдЪрд╛рд░ рдкреНрд░рдореБрдЦ рдорд╛рдк рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рд╣реИрдВ:
- рд╕реАрдорд╛ (Range) тАУ рдЕрдзрд┐рдХрддрдо рдФрд░ рдиреНрдпреВрдирддрдо рдорд╛рди рдХреЗ рдмреАрдЪ рдХрд╛ рдЕрдВрддрд░ред
- рдЪрддреБрд░реНрдердХ рд╡рд┐рдЪрд▓рди (Quartile Deviation – QD) тАУ рдордзреНрдп 50% рдбреЗрдЯрд╛ рдХреА рдкреНрд░рд╕рд░рдг рд╕реАрдорд╛ред
- рдорд╛рдзреНрдп рдкрд░рд╛рд╕ рд╡рд┐рдЪрд▓рди (Mean Absolute Deviation – AD) тАУ рдкреНрд░рддреНрдпреЗрдХ рдбреЗрдЯрд╛ рдмрд┐рдВрджреБ рдФрд░ рдорд╛рдзреНрдп рдХреЗ рдмреАрдЪ рдФрд╕рдд рд╡рд┐рдЪрд▓рдиред
- рдорд╛рдирдХ рд╡рд┐рдЪрд▓рди (Standard Deviation – SD) тАУ рдбреЗрдЯрд╛ рдХреЗ рдорд╛рдзреНрдп рд╕реЗ рдФрд╕рдд рджреВрд░реА рдХрд╛ рдПрдХ рд╕рдЯреАрдХ рдорд╛рдкред
рдЗрд╕ рд▓реЗрдЦ рдореЗрдВ, рд╣рдо рдЗрди рдЪрд╛рд░реЛрдВ рдорд╛рдкреЛрдВ рдХреА рдкрд░рд┐рднрд╛рд╖рд╛, рд╕реВрддреНрд░ рдФрд░ рдЧрдгрдирд╛ рдХреЛ рд╡рд┐рд╕реНрддрд╛рд░ рд╕реЗ рд╕рдордЭреЗрдВрдЧреЗред
1. рд╕реАрдорд╛ (Range)
рдкрд░рд┐рднрд╛рд╖рд╛
рд╕реАрдорд╛ (Range) рдкреНрд░рд╕рд░рдг рдХрд╛ рд╕рдмрд╕реЗ рд╕рд░рд▓ рдорд╛рдк рд╣реИред рдпрд╣ рдбреЗрдЯрд╛ рд╕реЗрдЯ рдореЗрдВ рдЕрдзрд┐рдХрддрдо рдФрд░ рдиреНрдпреВрдирддрдо рдорд╛рди рдХреЗ рдмреАрдЪ рдХреЗ рдЕрдВрддрд░ рдХреЛ рджрд░реНрд╢рд╛рддрд╛ рд╣реИред
рд╕реАрдорд╛ рдХрд╛ рд╕реВрддреНрд░
рд╕реАрдорд╛=рдЕрдзрд┐рдХрддрдо рдорд╛рдитИТрдиреНрдпреВрдирддрдо рдорд╛рди\text{рд╕реАрдорд╛} = \text{рдЕрдзрд┐рдХрддрдо рдорд╛рди} – \text{рдиреНрдпреВрдирддрдо рдорд╛рди}
рдЙрджрд╛рд╣рд░рдг 1: рдЕрд╕рдореВрд╣реАрдХреГрдд рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рд╕реАрдорд╛
рдорд╛рди рд▓реАрдЬрд┐рдП рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдбреЗрдЯрд╛ рд╣реИ: 5, 12, 20, 25, 30
рд╕реАрдорд╛=30тИТ5=25\text{рд╕реАрдорд╛} = 30 – 5 = 25
рдЙрджрд╛рд╣рд░рдг 2: рд╕рдореВрд╣реАрдХреГрдд рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рд╕реАрдорд╛
рдиреАрдЪреЗ рджрд┐рдпрд╛ рдЧрдпрд╛ рдбреЗрдЯрд╛ рджреЗрдЦреЗрдВ:
рд╡рд░реНрдЧ рдЕрдВрддрд░рд╛рд▓ | рдЖрд╡реГрддреНрддрд┐ (f) |
10 – 20 | 5 |
20 – 30 | 10 |
30 – 40 | 7 |
40 – 50 | 8 |
50 – 60 | 5 |
рд╕реАрдорд╛=60тИТ10=50\text{рд╕реАрдорд╛} = 60 – 10 = 50
рд╕реАрдорд╛ рдХреА рд╕реАрдорд╛рдПрдБ
- рдпрд╣ рдХреЗрд╡рд▓ рджреЛ рдЪрд░рдо рдорд╛рдиреЛрдВ рдкрд░ рдирд┐рд░реНрднрд░ рдХрд░рддрд╛ рд╣реИ, рдЬрд┐рд╕рд╕реЗ рдпрд╣ рдЖрдЙрдЯрд▓рд╛рдпрд░реНрд╕ (рдЪрд░рдо рдорд╛рдиреЛрдВ) рд╕реЗ рдкреНрд░рднрд╛рд╡рд┐рдд рд╣реЛрддрд╛ рд╣реИред
- рдпрд╣ рдбреЗрдЯрд╛ рдХреЗ рд╡рд┐рддрд░рдг рдХреА рдкреВрд░реА рдЬрд╛рдирдХрд╛рд░реА рдирд╣реАрдВ рджреЗрддрд╛ред
2. рдЪрддреБрд░реНрдердХ рд╡рд┐рдЪрд▓рди (Quartile Deviation – QD)
рдкрд░рд┐рднрд╛рд╖рд╛
рдЪрддреБрд░реНрдердХ рд╡рд┐рдЪрд▓рди (QD) рдпрд╣ рджрд░реНрд╢рд╛рддрд╛ рд╣реИ рдХрд┐ рдбреЗрдЯрд╛ рдХреЗ рдордзреНрдп 50% рдорд╛рди рдХрд┐рддрдиреЗ рдлреИрд▓реЗ рд╣реБрдП рд╣реИрдВред рдпрд╣ рддреАрд╕рд░реЗ рдЪрддреБрд░реНрдердХ (QтВГ) рдФрд░ рдкрд╣рд▓реЗ рдЪрддреБрд░реНрдердХ (QтВБ) рдХреЗ рдмреАрдЪ рдХрд╛ рдЕрдВрддрд░ рд╣реЛрддрд╛ рд╣реИ, рдЬрд┐рд╕реЗ рдЕрд░реНрджреНрдз-рдЪрддреБрд░реНрдердХ рдкрд░рд╛рд╕ (Semi-Interquartile Range) рднреА рдХрд╣рд╛ рдЬрд╛рддрд╛ рд╣реИред
рдЪрддреБрд░реНрдердХ рд╡рд┐рдЪрд▓рди рдХрд╛ рд╕реВрддреНрд░
QD=Q3тИТQ12\text{QD} = \frac{Q_3 – Q_1}{2}
рдЬрд╣рд╛рдБ:
- QтВБ (рдкреНрд░рдердо рдЪрддреБрд░реНрдердХ) = рд╡рд╣ рдорд╛рди рдЬрд┐рд╕рдХреЗ рдиреАрдЪреЗ 25% рдбреЗрдЯрд╛ рд╕реНрдерд┐рдд рд╣реЛрддрд╛ рд╣реИред
- QтВГ (рддреГрддреАрдп рдЪрддреБрд░реНрдердХ) = рд╡рд╣ рдорд╛рди рдЬрд┐рд╕рдХреЗ рдиреАрдЪреЗ 75% рдбреЗрдЯрд╛ рд╕реНрдерд┐рдд рд╣реЛрддрд╛ рд╣реИред
рдЙрджрд╛рд╣рд░рдг: рдЕрд╕рдореВрд╣реАрдХреГрдд рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП QD
рдорд╛рди рд▓реАрдЬрд┐рдП рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдбреЗрдЯрд╛ рд╣реИ: 10, 15, 20, 25, 30, 35, 40, 45, 50
- QтВБ рд╕реНрдерд╛рди = (N+1)4=(9+1)4=2.5\frac{(N+1)}{4} = \frac{(9+1)}{4} = 2.5
- QтВБ = 15 + 0.5 \times (20 – 15) = 17.5
- QтВГ рд╕реНрдерд╛рди = 3├Ч(N+1)4=3├Ч104=7.53 \times \frac{(N+1)}{4} = 3 \times \frac{10}{4} = 7.5
- QтВГ = 40 + 0.5 \times (45 – 40) = 42.5
QD=42.5тИТ17.52=252=12.5\text{QD} = \frac{42.5 – 17.5}{2} = \frac{25}{2} = 12.5
3. рдорд╛рдзреНрдп рдкрд░рд╛рд╕ рд╡рд┐рдЪрд▓рди (Mean Absolute Deviation – AD)
рдкрд░рд┐рднрд╛рд╖рд╛
рдорд╛рдзреНрдп рдкрд░рд╛рд╕ рд╡рд┐рдЪрд▓рди (AD) рдкреНрд░рддреНрдпреЗрдХ рдбреЗрдЯрд╛ рдмрд┐рдВрджреБ рдФрд░ рдорд╛рдзреНрдп (X╦Й\bar{X}) рдХреЗ рдмреАрдЪ рдФрд╕рдд рд╡рд┐рдЪрд▓рди рдХреЛ рдорд╛рдкрддрд╛ рд╣реИред
рдорд╛рдзреНрдп рдкрд░рд╛рд╕ рд╡рд┐рдЪрд▓рди рдХрд╛ рд╕реВрддреНрд░
AD=тИСтИгXтИТX╦ЙтИгN\text{AD} = \frac{\sum |X – \bar{X}|}{N}
рдЙрджрд╛рд╣рд░рдг: AD рдХреА рдЧрдгрдирд╛
рдбреЗрдЯрд╛: 5, 10, 15, 20, 25
- рдорд╛рдзреНрдп (X╦Й\bar{X}) рдирд┐рдХрд╛рд▓реЗрдВ:
X╦Й=5+10+15+20+255=15\bar{X} = \frac{5 + 10 + 15 + 20 + 25}{5} = 15
- рдкреНрд░рддреНрдпреЗрдХ рдорд╛рди рдХрд╛ рдорд╛рдзреНрдп рд╕реЗ рд╡рд┐рдЪрд▓рди рд▓реЗрдВ:
| X | тИгXтИТX╦ЙтИг|X – \bar{X}| | |—-|——————| | 5 | тИг5тИТ15тИг=10|5 – 15| = 10 | | 10 | тИг10тИТ15тИг=5|10 – 15| = 5 | | 15 | тИг15тИТ15тИг=0|15 – 15| = 0 | | 20 | тИг20тИТ15тИг=5|20 – 15| = 5 | | 25 | тИг25тИТ15тИг=10|25 – 15| = 10 |
- AD рдирд┐рдХрд╛рд▓реЗрдВ:
AD=(10+5+0+5+10)5=305=6\text{AD} = \frac{(10 + 5 + 0 + 5 + 10)}{5} = \frac{30}{5} = 6
4. рдорд╛рдирдХ рд╡рд┐рдЪрд▓рди (Standard Deviation – SD)
рдкрд░рд┐рднрд╛рд╖рд╛
рдорд╛рдирдХ рд╡рд┐рдЪрд▓рди (SD) рдбреЗрдЯрд╛ рдХреЗ рдорд╛рдзреНрдп рд╕реЗ рдФрд╕рдд рд╡рд┐рдЪрд▓рди рдХреЛ рджрд░реНрд╢рд╛рддрд╛ рд╣реИ рдФрд░ рдкреНрд░рд╕рд░рдг рдХрд╛ рд╕рдмрд╕реЗ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдорд╛рдк рд╣реИред
рдорд╛рдирдХ рд╡рд┐рдЪрд▓рди рдХрд╛ рд╕реВрддреНрд░
╧Г=тИС(XтИТX╦Й)2N\sigma = \sqrt{\frac{\sum (X – \bar{X})^2}{N}}
рдЙрджрд╛рд╣рд░рдг: SD рдХреА рдЧрдгрдирд╛
X | XтИТX╦ЙX – \bar{X} | (XтИТX╦Й)2(X – \bar{X})^2 |
5 | -10 | 100 |
10 | -5 | 25 |
15 | 0 | 0 |
20 | 5 | 25 |
25 | 10 | 100 |
╧Г2=(100+25+0+25+100)5=50\sigma^2 = \frac{(100 + 25 + 0 + 25 + 100)}{5} = 50 ╧Г=50тЙИ7.07\sigma = \sqrt{50} \approx 7.07
рдирд┐рд╖реНрдХрд░реНрд╖
рдкреНрд░рд╕рд░рдг рдХреЗ рдпреЗ рдорд╛рдк (Range, QD, AD, рдФрд░ SD) рдбреЗрдЯрд╛ рдХреЗ рдлреИрд▓рд╛рд╡ рдХреЛ рд╕рдордЭрдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддреЗ рд╣реИрдВред
- рд╕реАрдорд╛ рд╕рд░рд▓ рд╣реИ, рд▓реЗрдХрд┐рди рдЪрд░рдо рдорд╛рдиреЛрдВ рд╕реЗ рдкреНрд░рднрд╛рд╡рд┐рдд рд╣реЛрддреА рд╣реИред
- рдЪрддреБрд░реНрдердХ рд╡рд┐рдЪрд▓рди рдордзреНрдп 50% рдбреЗрдЯрд╛ рдХреА рд╡рд┐рд╡рд┐рдзрддрд╛ рджрд┐рдЦрд╛рддрд╛ рд╣реИред
- рдорд╛рдзреНрдп рдкрд░рд╛рд╕ рд╡рд┐рдЪрд▓рди рдбреЗрдЯрд╛ рдХреА рд╡рд╛рд╕реНрддрд╡рд┐рдХ рджреВрд░реА рдХреЛ рджрд░реНрд╢рд╛рддрд╛ рд╣реИред
- рдорд╛рдирдХ рд╡рд┐рдЪрд▓рди рд╕рдмрд╕реЗ рд╕рдЯреАрдХ рдФрд░ рд╡реНрдпрд╛рдкрдХ рд░реВрдк рд╕реЗ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рдиреЗ рд╡рд╛рд▓рд╛ рдорд╛рдк рд╣реИред
рдпреЗ рдорд╛рдк рдЕрд░реНрдерд╢рд╛рд╕реНрддреНрд░, рд╡реНрдпрд╡рд╕рд╛рдп рдФрд░ рдЕрдиреБрд╕рдВрдзрд╛рди рдореЗрдВ рдорд╣рддреНрд╡рдкреВрд░реНрдг рднреВрдорд┐рдХрд╛ рдирд┐рднрд╛рддреЗ рд╣реИрдВред
UNIT-2(2.4) Measures of Variability: Calculation of Range, QD, AD, SD.
Introduction
In statistics, variability refers to the extent to which data points in a dataset differ from each other. While measures of central tendency (mean, median, and mode) provide information about the central value of a dataset, measures of variability describe how spread out or dispersed the data is.
The most commonly used measures of variability are:
- Range тАУ The difference between the maximum and minimum values.
- Quartile Deviation (QD) тАУ The spread of the middle 50% of the data.
- Mean Absolute Deviation (AD) тАУ The average of the absolute differences between each data point and the mean.
- Standard Deviation (SD) тАУ The most widely used measure, which tells us how much data deviates from the mean.
In this essay, we will discuss the meaning, formulas, and calculations of each measure with examples.
1. Range
Definition
The range is the simplest measure of variability. It is calculated as the difference between the highest and lowest values in a dataset.
Formula for Range
Range=Maximum ValueтИТMinimum Value\text{Range} = \text{Maximum Value} – \text{Minimum Value}
Example 1: Range for Ungrouped Data
Consider the dataset: 5, 12, 20, 25, 30
Range=30тИТ5=25\text{Range} = 30 – 5 = 25
Example 2: Range for Grouped Data
Consider the following grouped frequency distribution:
Class Interval | Frequency |
10 – 20 | 5 |
20 – 30 | 10 |
30 – 40 | 7 |
40 – 50 | 8 |
50 – 60 | 5 |
Range=60тИТ10=50\text{Range} = 60 – 10 = 50
Limitations of Range
- Affected by extreme values (outliers).
- Ignores the distribution of data between the maximum and minimum values.
2. Quartile Deviation (QD) or Semi-Interquartile Range
Definition
Quartile Deviation (QD) measures the spread of the middle 50% of the dataset. It is half the difference between the third quartile (QтВГ) and the first quartile (QтВБ).
Formula for Quartile Deviation
Quartile Deviation(QD)=Q3тИТQ12\text{Quartile Deviation} (QD) = \frac{Q_3 – Q_1}{2}
where:
- QтВБ (First Quartile) = The value below which 25% of the data lies.
- QтВГ (Third Quartile) = The value below which 75% of the data lies.
Example: QD for Ungrouped Data
Consider the dataset: 10, 15, 20, 25, 30, 35, 40, 45, 50
- QтВБ position = (N+1)4=(9+1)4=2.5\frac{(N+1)}{4} = \frac{(9+1)}{4} = 2.5
- QтВБ = (2nd value) + 0.5 ├Ч (3rd value – 2nd value)
- QтВБ = 15 + 0.5 ├Ч (20 – 15) = 17.5
- QтВГ position = 3├Ч(N+1)4=3├Ч104=7.53 \times \frac{(N+1)}{4} = 3 \times \frac{10}{4} = 7.5
- QтВГ = (7th value) + 0.5 ├Ч (8th value – 7th value)
- QтВГ = 40 + 0.5 ├Ч (45 – 40) = 42.5
QD=42.5тИТ17.52=252=12.5\text{QD} = \frac{42.5 – 17.5}{2} = \frac{25}{2} = 12.5
3. Mean Absolute Deviation (AD)
Definition
Mean Absolute Deviation (AD) is the average of the absolute differences between each data point and the mean. It is a measure of how much data varies from the mean.
Formula for Mean Absolute Deviation
For a dataset with values X1,X2,…,XNX_1, X_2, …, X_N:
AD=тИСтИгXтИТX╦ЙтИгN\text{AD} = \frac{\sum |X – \bar{X}|}{N}
where:
- X╦Й\bar{X} = Mean
- NN = Total number of observations
Example: AD Calculation
Consider the dataset: 5, 10, 15, 20, 25
- Calculate the mean:
X╦Й=5+10+15+20+255=15\bar{X} = \frac{5 + 10 + 15 + 20 + 25}{5} = 15
- Find absolute deviations from the mean:
| X | тИгXтИТX╦ЙтИг|X – \bar{X}| | |—-|——————| | 5 | тИг5тИТ15тИг=10|5 – 15| = 10 | | 10 | тИг10тИТ15тИг=5|10 – 15| = 5 | | 15 | тИг15тИТ15тИг=0|15 – 15| = 0 | | 20 | тИг20тИТ15тИг=5|20 – 15| = 5 | | 25 | тИг25тИТ15тИг=10|25 – 15| = 10 |
- Calculate AD:
AD=(10+5+0+5+10)5=305=6\text{AD} = \frac{(10 + 5 + 0 + 5 + 10)}{5} = \frac{30}{5} = 6
4. Standard Deviation (SD)
Definition
Standard Deviation (SD) measures the average deviation of values from the mean, considering squared differences.
Formula for Standard Deviation
For ungrouped data:
SD(╧Г)=тИС(XтИТX╦Й)2N\text{SD} (\sigma) = \sqrt{\frac{\sum (X – \bar{X})^2}{N}}
For grouped data:
SD(╧Г)=тИСf(XтИТX╦Й)2тИСf\text{SD} (\sigma) = \sqrt{\frac{\sum f(X – \bar{X})^2}{\sum f}}
Example: SD Calculation
Consider the dataset: 5, 10, 15, 20, 25
- Find the mean: X╦Й=15\bar{X} = 15
- Find squared deviations from the mean:
X | XтИТX╦ЙX – \bar{X} | (XтИТX╦Й)2(X – \bar{X})^2 |
5 | -10 | 100 |
10 | -5 | 25 |
15 | 0 | 0 |
20 | 5 | 25 |
25 | 10 | 100 |
- Calculate variance:
╧Г2=(100+25+0+25+100)5=2505=50\sigma^2 = \frac{(100 + 25 + 0 + 25 + 100)}{5} = \frac{250}{5} = 50
- Calculate SD:
╧Г=50тЙИ7.07\sigma = \sqrt{50} \approx 7.07
Conclusion
Measures of variability (Range, QD, AD, and SD) are essential to understand the spread of data.
- Range is simple but affected by outliers.
- Quartile Deviation focuses on the middle 50% of data.
- Mean Absolute Deviation gives a straightforward measure of dispersion.
- Standard Deviation is the most reliable measure, widely used in statistics and research.
Understanding these measures helps in making better decisions, especially in fields like economics, psychology, and business analytics.
UNIT-3(3.1) Correlation: Concept, Types of correlation.
рд╕рд╣рд╕рдВрдмрдВрдз (Correlation): рдЕрд╡рдзрд╛рд░рдгрд╛ рдФрд░ рдкреНрд░рдХрд╛рд░
рдкрд░рд┐рдЪрдп
рд╕рд╣рд╕рдВрдмрдВрдз (Correlation) рд╕рд╛рдВрдЦреНрдпрд┐рдХреА (Statistics) рдХрд╛ рдПрдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╡рд┐рд╖рдп рд╣реИ, рдЬреЛ рджреЛ рдпрд╛ рдЕрдзрд┐рдХ рдЪрд░реЛрдВ (Variables) рдХреЗ рдмреАрдЪ рдХреЗ рд╕рдВрдмрдВрдз рдХреЛ рдорд╛рдкрддрд╛ рд╣реИред рдпрд╣ рдпрд╣ рдмрддрд╛рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддрд╛ рд╣реИ рдХрд┐ рдпрджрд┐ рдПрдХ рдЪрд░ рдмрдврд╝рддрд╛ рдпрд╛ рдШрдЯрддрд╛ рд╣реИ, рддреЛ рджреВрд╕рд░рд╛ рдЪрд░ рдХрд┐рд╕ рдкреНрд░рдХрд╛рд░ рдкреНрд░рднрд╛рд╡рд┐рдд рд╣реЛрддрд╛ рд╣реИред
рд╕рд╣рд╕рдВрдмрдВрдз рдХрд╛ рдЙрдкрдпреЛрдЧ рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди, рдЕрд░реНрдерд╢рд╛рд╕реНрддреНрд░, рд╡реНрдпрд╡рд╕рд╛рдп, рдЪрд┐рдХрд┐рддреНрд╕рд╛ рдФрд░ рд╢рд┐рдХреНрд╖рд╛ рд╕рд╣рд┐рдд рдХрдИ рдХреНрд╖реЗрддреНрд░реЛрдВ рдореЗрдВ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди рдореЗрдВ рдпрд╣ рдкрддрд╛ рд▓рдЧрд╛рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИ рдХрд┐ рдЕрдзреНрдпрдпрди рдХреЗ рдШрдВрдЯреЛрдВ рдФрд░ рдкрд░реАрдХреНрд╖рд╛ рдХреЗ рдЕрдВрдХреЛрдВ рдХреЗ рдмреАрдЪ рдХреЛрдИ рд╕рдВрдмрдВрдз рд╣реИ рдпрд╛ рдирд╣реАрдВред
рдЗрд╕ рд▓реЗрдЦ рдореЗрдВ, рд╣рдо рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рд╡рд┐рд╖рдпреЛрдВ рдХреЛ рд╡рд┐рд╕реНрддрд╛рд░ рд╕реЗ рд╕рдордЭреЗрдВрдЧреЗ:
- рд╕рд╣рд╕рдВрдмрдВрдз рдХреА рдЕрд╡рдзрд╛рд░рдгрд╛
- рд╕рд╣рд╕рдВрдмрдВрдз рдХреЗ рдкреНрд░рдХрд╛рд░
- рд╡рд╛рд╕реНрддрд╡рд┐рдХ рдЬреАрд╡рди рдореЗрдВ рд╕рд╣рд╕рдВрдмрдВрдз рдХреЗ рдЙрджрд╛рд╣рд░рдг
1. рд╕рд╣рд╕рдВрдмрдВрдз рдХреА рдЕрд╡рдзрд╛рд░рдгрд╛
рдкрд░рд┐рднрд╛рд╖рд╛
рд╕рд╣рд╕рдВрдмрдВрдз рд╡рд╣ рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рдорд╛рдк рд╣реИ рдЬреЛ рдпрд╣ рджрд░реНрд╢рд╛рддрд╛ рд╣реИ рдХрд┐ рджреЛ рдЪрд░ рдПрдХ рджреВрд╕рд░реЗ рд╕реЗ рдХрд┐рддрдиреЗ рдЬреБрдбрд╝реЗ рд╣реБрдП рд╣реИрдВред рдпрд╣ рдпрд╣ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХрд░рддрд╛ рд╣реИ рдХрд┐ рдпрджрд┐ рдПрдХ рдЪрд░ рдмрдврд╝рддрд╛ рдпрд╛ рдШрдЯрддрд╛ рд╣реИ, рддреЛ рджреВрд╕рд░рд╛ рдЪрд░ рдХрд┐рд╕ рд╣рдж рддрдХ рдЙрд╕реА рджрд┐рд╢рд╛ рдореЗрдВ рдмрдврд╝реЗрдЧрд╛ рдпрд╛ рдШрдЯреЗрдЧрд╛ред
рд╕рд╣рд╕рдВрдмрдВрдз рдХреА рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдБ
- рджрд┐рд╢рд╛ (Direction) тАУ рд╕рд╣рд╕рдВрдмрдВрдз рд╕рдХрд╛рд░рд╛рддреНрдордХ (Positive), рдирдХрд╛рд░рд╛рддреНрдордХ (Negative), рдпрд╛ рд╢реВрдиреНрдп (Zero) рд╣реЛ рд╕рдХрддрд╛ рд╣реИред
- рд╢рдХреНрддрд┐ (Strength) тАУ рд╕рд╣рд╕рдВрдмрдВрдз рдХрд╛ рдкрд░рд┐рдорд╛рдг рд╕рд╣рд╕рдВрдмрдВрдз рдЧреБрдгрд╛рдВрдХ (Correlation Coefficient) рджреНрд╡рд╛рд░рд╛ рдорд╛рдкрд╛ рдЬрд╛рддрд╛ рд╣реИред
- рд╕рдВрддреБрд▓рди (Symmetry) тАУ XX рдФрд░ YY рдХреЗ рдмреАрдЪ рд╕рд╣рд╕рдВрдмрдВрдз рд╕рдорд╛рди рд╣реЛрддрд╛ рд╣реИ, рдЪрд╛рд╣реЗ рдЙрд╕реЗ XX рд╕реЗ YY рдХреА рдУрд░ рдпрд╛ YY рд╕реЗ XX рдХреА рдУрд░ рдорд╛рдкрд╛ рдЬрд╛рдПред
рдЧрдгрд┐рддреАрдп рдЕрднрд┐рд╡реНрдпрдХреНрддрд┐
рд╕рд╣рд╕рдВрдмрдВрдз рдХреЛ рдкрд┐рдпрд░реНрд╕рди рд╕рд╣рд╕рдВрдмрдВрдз рдЧреБрдгрд╛рдВрдХ (Pearson Correlation Coefficient, r) рджреНрд╡рд╛рд░рд╛ рдорд╛рдкрд╛ рдЬрд╛рддрд╛ рд╣реИ, рдЬрд┐рд╕рдХрд╛ рд╕реВрддреНрд░ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рд╣реИ:
r=nтИСXYтИТ(тИСX)(тИСY)[nтИСX2тИТ(тИСX)2][nтИСY2тИТ(тИСY)2]r = \frac{n \sum XY – (\sum X)(\sum Y)}{\sqrt{[n \sum X^2 – (\sum X)^2][n \sum Y^2 – (\sum Y)^2]}}
рдЬрд╣рд╛рдБ:
- rr = рд╕рд╣рд╕рдВрдмрдВрдз рдЧреБрдгрд╛рдВрдХ
- X,YX, Y = рджреЛ рдЪрд░
- nn = рдХреБрд▓ рдбреЗрдЯрд╛ рдмрд┐рдВрджреБ рдХреА рд╕рдВрдЦреНрдпрд╛
рд╕рд╣рд╕рдВрдмрдВрдз рдХрд╛ рдорд╛рди -1 рдФрд░ +1 рдХреЗ рдмреАрдЪ рд╣реЛрддрд╛ рд╣реИ:
- r=+1r = +1 тЖТ рдкреВрд░реНрдгрдд: рд╕рдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдз
- r=тИТ1r = -1 тЖТ рдкреВрд░реНрдгрдд: рдирдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдз
- r=0r = 0 тЖТ рдХреЛрдИ рд╕рд╣рд╕рдВрдмрдВрдз рдирд╣реАрдВ
2. рд╕рд╣рд╕рдВрдмрдВрдз рдХреЗ рдкреНрд░рдХрд╛рд░
рд╕рд╣рд╕рдВрдмрдВрдз рдХреЛ рджрд┐рд╢рд╛, рдЪрд░реЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛, рдФрд░ рдорд╛рдкрдиреЗ рдХреА рд╡рд┐рдзрд┐ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рд╡рд░реНрдЧреАрдХреГрдд рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИред
A. рд╕рдВрдмрдВрдз рдХреА рджрд┐рд╢рд╛ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рд╕рд╣рд╕рдВрдмрдВрдз
1. рд╕рдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдз (Positive Correlation)
- рдЬрдм рдПрдХ рдЪрд░ рдмрдврд╝рддрд╛ рд╣реИ, рддреЛ рджреВрд╕рд░рд╛ рднреА рдмрдврд╝рддрд╛ рд╣реИ рдФрд░ рдЬрдм рдПрдХ рдШрдЯрддрд╛ рд╣реИ, рддреЛ рджреВрд╕рд░рд╛ рднреА рдШрдЯрддрд╛ рд╣реИред
- рдЙрджрд╛рд╣рд░рдг: рд▓рдВрдмрд╛рдИ рдФрд░ рд╡рдЬрди тАУ рдЕрдзрд┐рдХ рд▓рдВрдмрд╛рдИ рд╡рд╛рд▓реЗ рд▓реЛрдЧ рдЖрдорддреМрд░ рдкрд░ рдЕрдзрд┐рдХ рд╡рдЬрди рд╡рд╛рд▓реЗ рд╣реЛрддреЗ рд╣реИрдВред
- рдЧреНрд░рд╛рдлрд╝ рдкрд░ рдпрд╣ рдКрдкрд░ рдХреА рдУрд░ рдврд▓рд╛рди рдХреЗ рд░реВрдк рдореЗрдВ рджрд┐рдЦрддрд╛ рд╣реИред
2. рдирдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдз (Negative Correlation)
- рдЬрдм рдПрдХ рдЪрд░ рдмрдврд╝рддрд╛ рд╣реИ, рддреЛ рджреВрд╕рд░рд╛ рдШрдЯрддрд╛ рд╣реИ рдФрд░ рдЬрдм рдПрдХ рдШрдЯрддрд╛ рд╣реИ, рддреЛ рджреВрд╕рд░рд╛ рдмрдврд╝рддрд╛ рд╣реИред
- рдЙрджрд╛рд╣рд░рдг: рддрдирд╛рд╡ рдФрд░ рдиреАрдВрдж рдХрд╛ рд╕рдордп тАУ рдЕрдзрд┐рдХ рддрдирд╛рд╡ рд╕реЗ рдХрдо рдиреАрдВрдж рдЖрддреА рд╣реИред
- рдЧреНрд░рд╛рдлрд╝ рдкрд░ рдпрд╣ рдиреАрдЪреЗ рдХреА рдУрд░ рдврд▓рд╛рди рдХреЗ рд░реВрдк рдореЗрдВ рджрд┐рдЦрддрд╛ рд╣реИред
3. рд╢реВрдиреНрдп рд╕рд╣рд╕рдВрдмрдВрдз (Zero Correlation)
- рдЬрдм рджреЛрдиреЛрдВ рдЪрд░реЛрдВ рдХреЗ рдмреАрдЪ рдХреЛрдИ рд╕рдВрдмрдВрдз рдирд╣реАрдВ рд╣реЛрддрд╛ред
- рдЙрджрд╛рд╣рд░рдг: рдЬреВрддреЗ рдХрд╛ рдЖрдХрд╛рд░ рдФрд░ рдмреБрджреНрдзрд┐рдорддреНрддрд╛ тАУ рдЗрди рджреЛрдиреЛрдВ рдХреЗ рдмреАрдЪ рдХреЛрдИ рд╕рдВрдмрдВрдз рдирд╣реАрдВ рд╣реИред
- рдЧреНрд░рд╛рдлрд╝ рдкрд░ рдбреЗрдЯрд╛ рдмрд┐рдВрджреБ рдмрд┐рдирд╛ рдХрд┐рд╕реА рдкреИрдЯрд░реНрди рдХреЗ рдмрд┐рдЦрд░реЗ рд╣реБрдП рджрд┐рдЦрддреЗ рд╣реИрдВред
B. рдЪрд░реЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рд╕рд╣рд╕рдВрдмрдВрдз
1. рд╕рд░рд▓ рд╕рд╣рд╕рдВрдмрдВрдз (Simple Correlation)
- рдЬрдм рдХреЗрд╡рд▓ рджреЛ рдЪрд░ рд╢рд╛рдорд┐рд▓ рд╣реЛрддреЗ рд╣реИрдВред
- рдЙрджрд╛рд╣рд░рдг: рддрд╛рдкрдорд╛рди рдФрд░ рдЖрдЗрд╕рдХреНрд░реАрдо рдХреА рдмрд┐рдХреНрд░реАред
2. рдмрд╣реБ-рд╕рд╣рд╕рдВрдмрдВрдз (Multiple Correlation)
- рдЬрдм рддреАрди рдпрд╛ рдЕрдзрд┐рдХ рдЪрд░ рд╢рд╛рдорд┐рд▓ рд╣реЛрддреЗ рд╣реИрдВред
- рдЙрджрд╛рд╣рд░рдг: рд╡реЗрддрди, рдХрд╛рд░реНрдп-рдЕрдиреБрднрд╡, рдФрд░ рд╢рд┐рдХреНрд╖рд╛ рд╕реНрддрд░ рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдзред
3. рдЖрдВрд╢рд┐рдХ рд╕рд╣рд╕рдВрдмрдВрдз (Partial Correlation)
- рдЬрдм рддреАрд╕рд░реЗ рдЪрд░ рдХреЗ рдкреНрд░рднрд╛рд╡ рдХреЛ рдирд┐рдпрдВрддреНрд░рд┐рдд рдХрд░рдиреЗ рдХреЗ рдмрд╛рдж рджреЛ рдЪрд░реЛрдВ рдХреЗ рдмреАрдЪ рд╕рд╣рд╕рдВрдмрдВрдз рдХреА рдЧрдгрдирд╛ рдХреА рдЬрд╛рддреА рд╣реИред
- рдЙрджрд╛рд╣рд░рдг: рд╡реНрдпрд╛рдпрд╛рдо рдФрд░ рд╡рдЬрди рдШрдЯрд╛рдиреЗ рдХрд╛ рд╕рдВрдмрдВрдз, рд▓реЗрдХрд┐рди рдЖрд╣рд╛рд░ рдХреЗ рдкреНрд░рднрд╛рд╡ рдХреЛ рд╣рдЯрд╛рдХрд░ред
C. рдорд╛рдкрди рд╡рд┐рдзрд┐ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рд╕рд╣рд╕рдВрдмрдВрдз
1. рдкрд┐рдпрд░реНрд╕рди рд╕рд╣рд╕рдВрдмрдВрдз (PearsonтАЩs Correlation Coefficient, r)
- рдЬрдм рджреЛрдиреЛрдВ рдЪрд░ рд╕рддрдд (Continuous) рдФрд░ рд░реИрдЦрд┐рдХ (Linear) рд╣реЛрддреЗ рд╣реИрдВред
2. рд╕реНрдкреАрдпрд░рдореИрди рд░реИрдВрдХ рд╕рд╣рд╕рдВрдмрдВрдз (SpearmanтАЩs Rank Correlation, rтВЫ)
- рдЬрдм рдбреЗрдЯрд╛ рдХреНрд░рдордмрджреНрдз (Ranked) рд╣реЛред
- рдЙрджрд╛рд╣рд░рдг: рдЫрд╛рддреНрд░реЛрдВ рдХреЗ рдкрд░реАрдХреНрд╖рд╛ рдЕрдВрдХ рдФрд░ рдЦреЗрд▓ рдкреНрд░рджрд░реНрд╢рди рд░реИрдВрдХред
- рд╕реВрддреНрд░:
rs=1тИТ6тИСd2n(n2тИТ1)r_s = 1 – \frac{6 \sum d^2}{n(n^2 – 1)}
3. рдХреЗрдВрдбрд▓ рдХрд╛ рдЯрд╛рдЙ (KendallтАЩs Tau Correlation)
- рдЫреЛрдЯреЗ рдбреЗрдЯрд╛ рд╕реЗрдЯреНрд╕ рдХреЗ рд▓рд┐рдП рдЕрдзрд┐рдХ рд╕рдЯреАрдХ рд╡рд┐рдзрд┐ред
- рдЬрдм рдбреЗрдЯрд╛ рдХреНрд░рдордмрджреНрдз (Ordinal) рд╣реЛред
4. рдкреЙрдЗрдВрдЯ-рдмрд┐рд╕реЗрд░рд┐рдпрд▓ рд╕рд╣рд╕рдВрдмрдВрдз (Point-Biserial Correlation)
- рдЬрдм рдПрдХ рдЪрд░ рд╕рддрдд рдФрд░ рджреВрд╕рд░рд╛ рджреНрд╡рд┐рдЪрд░ (Binary: Yes/No, 0/1) рд╣реЛред
- рдЙрджрд╛рд╣рд░рдг: рд▓рд┐рдВрдЧ (рдкреБрд░реБрд╖/рдорд╣рд┐рд▓рд╛) рдФрд░ рдкрд░реАрдХреНрд╖рд╛ рдЕрдВрдХреЛрдВ рдХрд╛ рд╕рдВрдмрдВрдзред
5. рдлрд╛рдИ рдЧреБрдгрд╛рдВрдХ (Phi Coefficient, ╧Ж)
- рдЬрдм рджреЛрдиреЛрдВ рдЪрд░ рджреНрд╡рд┐рдЪрд░ (Binary) рд╣реЛрдВред
- рдЙрджрд╛рд╣рд░рдг: рдзреВрдореНрд░рдкрд╛рди (рд╣рд╛рдБ/рдирд╣реАрдВ) рдФрд░ рдлреЗрдлрдбрд╝реЛрдВ рдХреЗ рдХреИрдВрд╕рд░ (рд╣рд╛рдБ/рдирд╣реАрдВ) рдХрд╛ рд╕рдВрдмрдВрдзред
3. рд╡рд╛рд╕реНрддрд╡рд┐рдХ рдЬреАрд╡рди рдореЗрдВ рд╕рд╣рд╕рдВрдмрдВрдз рдХреЗ рдЙрджрд╛рд╣рд░рдг
1. рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди рдореЗрдВ
- рдЖрдИрдХреНрдпреВ рдФрд░ рд╢реИрдХреНрд╖рдгрд┐рдХ рдкреНрд░рджрд░реНрд╢рди тЖТ рд╕рдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдзред
- рддрдирд╛рд╡ рдФрд░ рдорд╛рдирд╕рд┐рдХ рд╕реНрд╡рд╛рд╕реНрдереНрдп тЖТ рдирдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдзред
2. рд╡реНрдпрд╡рд╕рд╛рдп рдФрд░ рдЕрд░реНрдерд╢рд╛рд╕реНрддреНрд░ рдореЗрдВ
- рд╡рд┐рдЬреНрдЮрд╛рдкрди рдФрд░ рдмрд┐рдХреНрд░реА тЖТ рд╕рдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдзред
- рдореБрджреНрд░рд╛рд╕реНрдлреАрддрд┐ рдФрд░ рдХреНрд░рдп рд╢рдХреНрддрд┐ тЖТ рдирдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдзред
3. рдЪрд┐рдХрд┐рддреНрд╕рд╛ рдФрд░ рд╕реНрд╡рд╛рд╕реНрдереНрдп рдореЗрдВ
- рдзреВрдореНрд░рдкрд╛рди рдФрд░ рдлреЗрдлрдбрд╝реЛрдВ рдХреЗ рдХреИрдВрд╕рд░ рдХрд╛ рдЦрддрд░рд╛ тЖТ рд╕рдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдзред
- рд╡реНрдпрд╛рдпрд╛рдо рдФрд░ рдХреЛрд▓реЗрд╕реНрдЯреНрд░реЙрд▓ рд╕реНрддрд░ тЖТ рдирдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдзред
4. рд╢рд┐рдХреНрд╖рд╛ рдореЗрдВ
- рдЕрдзреНрдпрдпрди рдХрд╛ рд╕рдордп рдФрд░ рдкрд░реАрдХреНрд╖рд╛ рдЕрдВрдХ тЖТ рд╕рдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдзред
- рдЕрдиреБрдкрд╕реНрдерд┐рддрд┐ рдФрд░ рдЕрдХрд╛рджрдорд┐рдХ рдкреНрд░рджрд░реНрд╢рди тЖТ рдирдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдзред
4. рд╕рд╣рд╕рдВрдмрдВрдз рдХреА рд╕реАрдорд╛рдПрдБ
- рд╕рд╣рд╕рдВрдмрдВрдз рдХрд╛рд░рдгрддрд╛ (Causation) рдХреЛ рд╕рд┐рджреНрдз рдирд╣реАрдВ рдХрд░рддрд╛ред
- рдЧреИрд░-рд░реИрдЦрд┐рдХ рд╕рдВрдмрдВрдзреЛрдВ рдХреЛ рдкрд╣рдЪрд╛рди рдирд╣реАрдВ рд╕рдХрддрд╛ред
- рдЕрддреНрдпрдзрд┐рдХ рдореВрд▓реНрдпреЛрдВ (Outliers) рд╕реЗ рдкреНрд░рднрд╛рд╡рд┐рдд рд╣реЛрддрд╛ рд╣реИред
- рдЧреБрдкреНрдд рдЪрд░реЛрдВ рдХрд╛ рдкреНрд░рднрд╛рд╡ рдЕрдирджреЗрдЦрд╛ рдХрд░рддрд╛ рд╣реИред
рдирд┐рд╖реНрдХрд░реНрд╖
рд╕рд╣рд╕рдВрдмрдВрдз рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдореЗрдВ рдПрдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдЯреВрд▓ рд╣реИ, рдЬреЛ рдбреЗрдЯрд╛ рдореЗрдВ рдкреИрдЯрд░реНрди рдФрд░ рд░реБрдЭрд╛рди рдХреА рдкрд╣рдЪрд╛рди рдХрд░рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддрд╛ рд╣реИред рд╡рд┐рднрд┐рдиреНрди рдкреНрд░рдХрд╛рд░ рдХреЗ рд╕рд╣рд╕рдВрдмрдВрдз рдЕрд▓рдЧ-рдЕрд▓рдЧ рдкрд░рд┐рд╕реНрдерд┐рддрд┐рдпреЛрдВ рдореЗрдВ рдЙрдкрдпреЛрдЧ рдХрд┐рдП рдЬрд╛рддреЗ рд╣реИрдВред рд╣рд╛рд▓рд╛рдБрдХрд┐, рдпрд╣ рд╕рдордЭрдирд╛ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╣реИ рдХрд┐ рд╕рд╣рд╕рдВрдмрдВрдз рдХреЗрд╡рд▓ рджреЛ рдЪрд░реЛрдВ рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдз рдХреЛ рджрд░реНрд╢рд╛рддрд╛ рд╣реИ, рдпрд╣ рдпрд╣ рд╕рд╛рдмрд┐рдд рдирд╣реАрдВ рдХрд░рддрд╛ рдХрд┐ рдПрдХ рдЪрд░ рджреВрд╕рд░реЗ рдХрд╛ рдХрд╛рд░рдг рд╣реИред
UNIT-3(3.1) Correlation: Concept, Types of correlation.
Introduction
Correlation is a fundamental concept in statistics that measures the relationship between two or more variables. It helps in understanding whether an increase or decrease in one variable is associated with an increase or decrease in another variable. Correlation is widely used in various fields such as psychology, economics, business, and medical research to identify patterns and relationships between data points.
For example, in psychology, correlation can help determine whether there is a relationship between study hours and exam scores or between stress levels and sleep duration. In business, it can show whether an increase in advertising expenditure leads to higher sales.
This essay will cover:
- The concept of correlation
- The types of correlation
- Examples of correlation in real-life scenarios
1. Concept of Correlation
Definition
Correlation refers to the statistical relationship between two variables, indicating how one variable changes in response to another. It does not establish causation (cause-and-effect relationship), but it helps identify patterns and trends in data.
Properties of Correlation
- Direction: Correlation can be positive, negative, or zero (no correlation).
- Strength: The correlation coefficient determines the strength of the relationship between variables.
- Symmetry: Correlation between variable X and variable Y is the same as between Y and X.
Mathematical Representation
Correlation is usually measured using the Pearson Correlation Coefficient (r), which is calculated as:
r=nтИСXYтИТ(тИСX)(тИСY)[nтИСX2тИТ(тИСX)2][nтИСY2тИТ(тИСY)2]r = \frac{n \sum XY – (\sum X)(\sum Y)}{\sqrt{[n \sum X^2 – (\sum X)^2][n \sum Y^2 – (\sum Y)^2]}}
where:
- rr = correlation coefficient
- X,YX, Y = variables
- nn = number of data points
The value of rr always lies between -1 and +1.
2. Types of Correlation
Correlation can be classified based on direction, number of variables, and method of measurement.
A. Based on Direction of Relationship
1. Positive Correlation
- If one variable increases, the other also increases, and vice versa.
- Example: Height and weight тАУ Taller people tend to weigh more.
- Graphically, this is represented by an upward-sloping trend.
2. Negative Correlation
- If one variable increases, the other decreases, and vice versa.
- Example: Stress and sleep duration тАУ More stress often leads to less sleep.
- Represented by a downward-sloping trend.
3. Zero (No) Correlation
- There is no relationship between the two variables.
- Example: Shoe size and intelligence тАУ No connection exists between them.
- Graphically, the points appear scattered without a clear pattern.
B. Based on Number of Variables
1. Simple Correlation
- Involves only two variables.
- Example: The relationship between temperature and ice cream sales.
2. Multiple Correlation
- Involves three or more variables.
- Example: The correlation between salary, work experience, and education level.
3. Partial Correlation
- Examines the relationship between two variables while controlling the effect of a third variable.
- Example: The correlation between exercise and weight loss, while controlling for diet.
C. Based on Method of Measurement
1. PearsonтАЩs Correlation Coefficient (r)
- Measures linear relationship between two continuous variables.
- Values range from -1 to +1:
- r = +1 тЖТ Perfect positive correlation
- r = -1 тЖТ Perfect negative correlation
- r = 0 тЖТ No correlation
2. SpearmanтАЩs Rank Correlation
- Used when data is ordinal (ranked data) instead of continuous.
- Example: Ranking students based on marks and ranking their performance in sports.
- Formula:
rs=1тИТ6тИСd2n(n2тИТ1)r_s = 1 – \frac{6 \sum d^2}{n(n^2 – 1)}
where dd is the difference between ranks, and nn is the number of observations.
3. KendallтАЩs Tau Correlation
- Similar to SpearmanтАЩs Rank Correlation, but more accurate for small datasets.
- Used in cases where data is ordinal or non-parametric.
4. Point-Biserial Correlation
- Measures the relationship between one continuous variable and one binary variable (0/1, Yes/No).
- Example: Relationship between gender (Male/Female) and test scores.
5. Phi Coefficient (╧Ж)
- Used when both variables are binary (dichotomous).
- Example: Relationship between smoking (Yes/No) and lung disease (Yes/No).
3. Real-Life Applications of Correlation
1. Psychology
- IQ and academic performance тЖТ Positive correlation.
- Stress and mental health тЖТ Negative correlation.
2. Business and Economics
- Advertising expenditure and sales тЖТ Positive correlation.
- Inflation and purchasing power тЖТ Negative correlation.
3. Healthcare and Medicine
- Smoking and lung cancer risk тЖТ Positive correlation.
- Exercise and cholesterol levels тЖТ Negative correlation.
4. Education
- Study time and grades тЖТ Positive correlation.
- Absenteeism and academic performance тЖТ Negative correlation.
4. Limitations of Correlation
- Correlation does not imply causation
- A high correlation does not mean that one variable causes the other to change.
- Example: Ice cream sales and drowning deaths are correlated, but the real cause is hot weather.
- Non-linear relationships are not detected
- PearsonтАЩs correlation works only for linear relationships.
- Outliers affect correlation
- Extreme values can distort the correlation coefficient.
- Correlation does not account for hidden variables
- There may be a third factor influencing both variables.
Conclusion
Correlation is a crucial statistical tool used to measure relationships between variables. It helps in data analysis across multiple domains, including psychology, business, healthcare, and education. Understanding the types of correlation тАУ positive, negative, and zero тАУ along with various methods like PearsonтАЩs and SpearmanтАЩs correlation allows researchers to draw meaningful insights from data.
However, it is important to remember that correlation does not imply causation. A strong correlation between two variables does not mean that one variable directly influences the other. Therefore, correlation should be used carefully, considering other statistical methods to determine causal relationships.
By applying correlation analysis effectively, we can improve decision-making in various fields, from predicting market trends to understanding human behavior.
UNIT-3(3.2) Calculation of Correlation: Product moment and Rank difference method.
рд╕рд╣рд╕рдВрдмрдВрдз рдХреА рдЧрдгрдирд╛: рдЙрддреНрдкрд╛рдж-рдореЛрдореЗрдВрдЯ рд╡рд┐рдзрд┐ рдФрд░ рд░реИрдВрдХ-рдЕрдВрддрд░ рд╡рд┐рдзрд┐
рдкрд░рд┐рдЪрдп
рд╕рд╣рд╕рдВрдмрдВрдз (Correlation) рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдХреА рдПрдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╡рд┐рдзрд┐ рд╣реИ, рдЬреЛ рдпрд╣ рдорд╛рдкрддреА рд╣реИ рдХрд┐ рджреЛ рдЪрд░ (Variables) рдХреЗ рдмреАрдЪ рдХрд┐рддрдирд╛ рдФрд░ рдХрд┐рд╕ рдкреНрд░рдХрд╛рд░ рдХрд╛ рд╕рдВрдмрдВрдз рд╣реИред рдпрд╣ рд╣рдореЗрдВ рдпрд╣ рд╕рдордЭрдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддрд╛ рд╣реИ рдХрд┐ рдпрджрд┐ рдПрдХ рдЪрд░ рдмрджрд▓рддрд╛ рд╣реИ, рддреЛ рджреВрд╕рд░рд╛ рдЪрд░ рдЙрд╕ рдкрд░ рдХреНрдпрд╛ рдкреНрд░рднрд╛рд╡ рдбрд╛рд▓рддрд╛ рд╣реИред
рд╕рд╣рд╕рдВрдмрдВрдз рдХреА рдЧрдгрдирд╛ рдХреЗ рдХрдИ рддрд░реАрдХреЗ рд╣реИрдВ, рд▓реЗрдХрд┐рди рд╕рдмрд╕реЗ рдкреНрд░рдореБрдЦ рджреЛ рддрд░реАрдХреЗ рд╣реИрдВ:
- рдЙрддреНрдкрд╛рдж-рдореЛрдореЗрдВрдЯ рд╡рд┐рдзрд┐ (Product Moment Method) рдЬрд┐рд╕реЗ рдкрд┐рдпрд░реНрд╕рди рд╕рд╣рд╕рдВрдмрдВрдз рдЧреБрдгрд╛рдВрдХ (PearsonтАЩs Correlation Coefficient) рднреА рдХрд╣рд╛ рдЬрд╛рддрд╛ рд╣реИред
- рд░реИрдВрдХ-рдЕрдВрддрд░ рд╡рд┐рдзрд┐ (Rank Difference Method) рдЬрд┐рд╕реЗ рд╕реНрдкреАрдпрд░рдореИрди рд░реИрдВрдХ рд╕рд╣рд╕рдВрдмрдВрдз (SpearmanтАЩs Rank Correlation Coefficient) рднреА рдХрд╣рд╛ рдЬрд╛рддрд╛ рд╣реИред
рдЗрд╕ рд▓реЗрдЦ рдореЗрдВ рд╣рдо рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рд╡рд┐рд╖рдпреЛрдВ рдкрд░ рд╡рд┐рд╕реНрддрд╛рд░ рд╕реЗ рдЪрд░реНрдЪрд╛ рдХрд░реЗрдВрдЧреЗ:
- рд╕рд╣рд╕рдВрдмрдВрдз рдХреА рдЕрд╡рдзрд╛рд░рдгрд╛ рдФрд░ рдорд╣рддреНрд╡
- рдЙрддреНрдкрд╛рдж-рдореЛрдореЗрдВрдЯ рд╡рд┐рдзрд┐ (PearsonтАЩs Correlation Coefficient)
- рд░реИрдВрдХ-рдЕрдВрддрд░ рд╡рд┐рдзрд┐ (SpearmanтАЩs Rank Correlation Coefficient)
- рд╡рд╛рд╕реНрддрд╡рд┐рдХ рдЬреАрд╡рди рдореЗрдВ рд╕рд╣рд╕рдВрдмрдВрдз рдХреЗ рдЕрдиреБрдкреНрд░рдпреЛрдЧ
- рд╕рд╣рд╕рдВрдмрдВрдз рдХреА рд╕реАрдорд╛рдПрдБ
1. рд╕рд╣рд╕рдВрдмрдВрдз рдХреА рдЕрд╡рдзрд╛рд░рдгрд╛ рдФрд░ рдорд╣рддреНрд╡
рд╕рд╣рд╕рдВрдмрдВрдз рдХреА рдкрд░рд┐рднрд╛рд╖рд╛
рд╕рд╣рд╕рдВрдмрдВрдз рджреЛ рдЪрд░реЛрдВ рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдз рдХреЛ рдорд╛рдкрдиреЗ рдХрд╛ рдПрдХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рдЙрдкрд╛рдп рд╣реИред рдЗрд╕рдХрд╛ рдорд╛рди -1 рд╕реЗ +1 рдХреЗ рдмреАрдЪ рд╣реЛрддрд╛ рд╣реИ:
- +1 тЖТ рдкреВрд░реНрдгрдд: рд╕рдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдз (рдпрджрд┐ рдПрдХ рдЪрд░ рдмрдврд╝рддрд╛ рд╣реИ, рддреЛ рджреВрд╕рд░рд╛ рднреА рдмрдврд╝рддрд╛ рд╣реИ)ред
- -1 тЖТ рдкреВрд░реНрдгрдд: рдирдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдз (рдпрджрд┐ рдПрдХ рдЪрд░ рдмрдврд╝рддрд╛ рд╣реИ, рддреЛ рджреВрд╕рд░рд╛ рдШрдЯрддрд╛ рд╣реИ)ред
- 0 тЖТ рдХреЛрдИ рд╕рд╣рд╕рдВрдмрдВрдз рдирд╣реАрдВ (рджреЛрдиреЛрдВ рдЪрд░реЛрдВ рдХреЗ рдмреАрдЪ рдХреЛрдИ рд╕рдВрдмрдВрдз рдирд╣реАрдВ)ред
рд╕рд╣рд╕рдВрдмрдВрдз рдХрд╛ рдорд╣рддреНрд╡
- рдпрд╣ рдПрдХ рдЪрд░ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рджреВрд╕рд░реЗ рдЪрд░ рдХреА рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдХрд░рдиреЗ рдореЗрдВ рд╕рд╣рд╛рдпрдХ рд╣реЛрддрд╛ рд╣реИред
- рдпрд╣ рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди, рд╡реНрдпрд╡рд╕рд╛рдп, рдЕрд░реНрдерд╢рд╛рд╕реНрддреНрд░ рдФрд░ рдЪрд┐рдХрд┐рддреНрд╕рд╛ рдЕрдиреБрд╕рдВрдзрд╛рди рдореЗрдВ рд╡реНрдпрд╛рдкрдХ рд░реВрдк рд╕реЗ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
- рдпрд╣ рдбреЗрдЯрд╛ рдХреЗ рдкреИрдЯрд░реНрди рдХреЛ рд╕рдордЭрдиреЗ рдФрд░ рдмреЗрд╣рддрд░ рдирд┐рд░реНрдгрдп рд▓реЗрдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддрд╛ рд╣реИред
2. рдЙрддреНрдкрд╛рдж-рдореЛрдореЗрдВрдЯ рд╡рд┐рдзрд┐ (PearsonтАЩs Correlation Coefficient, r)
рдЕрд╡рдзрд╛рд░рдгрд╛
рдпрд╣ рд╡рд┐рдзрд┐ рджреЛ рд╕рддрдд (Continuous) рдЪрд░реЛрдВ рдХреЗ рдмреАрдЪ рд░реИрдЦрд┐рдХ рд╕рдВрдмрдВрдз (Linear Relationship) рдХреЛ рдорд╛рдкрдиреЗ рдХреЗ рд▓рд┐рдП рдкреНрд░рдпреЛрдЧ рдХреА рдЬрд╛рддреА рд╣реИред рдпрд╣ рд╡рд┐рдзрд┐ рдЙрди рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рд╕рдмрд╕реЗ рдЙрдкрдпреБрдХреНрдд рд╣реЛрддреА рд╣реИ рдЬреЛ рд╕рд╛рдорд╛рдиреНрдп рд╡рд┐рддрд░рдг (Normally Distributed) рдореЗрдВ рд╣реЛрддреЗ рд╣реИрдВред
рд╕рдореАрдХрд░рдг
рдкрд┐рдпрд░реНрд╕рди рд╕рд╣рд╕рдВрдмрдВрдз рдЧреБрдгрд╛рдВрдХ (rr) рдХреА рдЧрдгрдирд╛ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рд╕реВрддреНрд░ рд╕реЗ рдХреА рдЬрд╛рддреА рд╣реИ:
r=nтИСXYтИТ(тИСX)(тИСY)[nтИСX2тИТ(тИСX)2][nтИСY2тИТ(тИСY)2]r = \frac{n \sum XY – (\sum X)(\sum Y)}{\sqrt{[n \sum X^2 – (\sum X)^2][n \sum Y^2 – (\sum Y)^2]}}
рдЬрд╣рд╛рдБ:
- XX рдФрд░ YY рджреЛ рдЪрд░ рд╣реИрдВред
- nn рдбреЗрдЯрд╛ рдмрд┐рдВрджреБрдУрдВ рдХреА рдХреБрд▓ рд╕рдВрдЦреНрдпрд╛ рд╣реИред
- тИСXY\sum XY рджреЛрдиреЛрдВ рдЪрд░реЛрдВ рдХреЗ рдЙрддреНрдкрд╛рдж рдХрд╛ рдпреЛрдЧ рд╣реИред
- тИСX\sum X рдФрд░ тИСY\sum Y рдЪрд░реЛрдВ рдХреЗ рд╡реНрдпрдХреНрддрд┐рдЧрдд рдорд╛рдиреЛрдВ рдХрд╛ рдпреЛрдЧ рд╣реИред
- тИСX2\sum X^2 рдФрд░ тИСY2\sum Y^2 рдЪрд░реЛрдВ рдХреЗ рд╡рд░реНрдЧреЛрдВ рдХрд╛ рдпреЛрдЧ рд╣реИред
рдЪрд░рдг-рджрд░-рдЪрд░рдг рдЧрдгрдирд╛ (рдЙрджрд╛рд╣рд░рдг)
рдорд╛рди рд▓реАрдЬрд┐рдП рдХрд┐ рд╣рдореЗрдВ рдЕрдзреНрдпрдпрди рдХреЗ рдШрдВрдЯреЗ (X) рдФрд░ рдкрд░реАрдХреНрд╖рд╛ рдХреЗ рдЕрдВрдХ (Y) рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдз рдЦреЛрдЬрдирд╛ рд╣реИред
рдЫрд╛рддреНрд░ | рдЕрдзреНрдпрдпрди рдШрдВрдЯреЗ (X) | рдкрд░реАрдХреНрд╖рд╛ рдЕрдВрдХ (Y) | X2X^2 | Y2Y^2 | XYXY |
1 | 2 | 40 | 4 | 1600 | 80 |
2 | 3 | 50 | 9 | 2500 | 150 |
3 | 5 | 65 | 25 | 4225 | 325 |
4 | 6 | 70 | 36 | 4900 | 420 |
5 | 8 | 90 | 64 | 8100 | 720 |
рдЕрдм рдЧрдгрдирд╛ рдХрд░реЗрдВ:
- тИСX=24\sum X = 24, тИСY=315\sum Y = 315
- тИСX2=138\sum X^2 = 138, тИСY2=21325\sum Y^2 = 21325
- тИСXY=1695\sum XY = 1695
r=(5)(1695)тИТ(24)(315)[5(138)тИТ(24)2][5(21325)тИТ(315)2]r = \frac{(5)(1695) – (24)(315)}{\sqrt{[5(138) – (24)^2][5(21325) – (315)^2]}} r=0.997r = 0.997
рдЪреВрдБрдХрд┐ rтЙИ1r \approx 1, рдпрд╣ рдмрд╣реБрдд рдордЬрдмреВрдд рд╕рдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдз рдХреЛ рджрд░реНрд╢рд╛рддрд╛ рд╣реИред
3. рд░реИрдВрдХ-рдЕрдВрддрд░ рд╡рд┐рдзрд┐ (SpearmanтАЩs Rank Correlation Coefficient, rтВЫ)
рдЕрд╡рдзрд╛рд░рдгрд╛
рдЬрдм рдбреЗрдЯрд╛ рдХреНрд░рдордмрджреНрдз (Ranked) рд╣реЛрддрд╛ рд╣реИ, рддреЛ рд╣рдо рд╕реНрдкреАрдпрд░рдореИрди рд░реИрдВрдХ рд╕рд╣рд╕рдВрдмрдВрдз рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╣реИрдВред рдпрд╣ рдЧреИрд░-рд░реИрдЦрд┐рдХ (Non-Linear) рд╕рдВрдмрдВрдзреЛрдВ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреБрдХреНрдд рд╣реЛрддрд╛ рд╣реИред
рд╕рдореАрдХрд░рдг
rs=1тИТ6тИСd2n(n2тИТ1)r_s = 1 – \frac{6 \sum d^2}{n(n^2 – 1)}
рдЬрд╣рд╛рдБ:
- dd = рджреЛ рдЪрд░реЛрдВ рдХреА рд░реИрдВрдХ рдХреЗ рдмреАрдЪ рдХрд╛ рдЕрдВрддрд░
- nn = рдХреБрд▓ рдбреЗрдЯрд╛ рдмрд┐рдВрджреБ рдХреА рд╕рдВрдЦреНрдпрд╛
рдЪрд░рдг-рджрд░-рдЪрд░рдг рдЧрдгрдирд╛ (рдЙрджрд╛рд╣рд░рдг)
рдЫрд╛рддреНрд░ | рдЕрдзреНрдпрдпрди рдШрдВрдЯреЗ (X) | рд░реИрдВрдХ (X) | рдкрд░реАрдХреНрд╖рд╛ рдЕрдВрдХ (Y) | рд░реИрдВрдХ (Y) | d=XтИТYd = X – Y | d2d^2 |
1 | 2 | 1 | 40 | 1 | 0 | 0 |
2 | 3 | 2 | 50 | 2 | 0 | 0 |
3 | 5 | 3 | 65 | 3 | 0 | 0 |
4 | 6 | 4 | 70 | 4 | 0 | 0 |
5 | 8 | 5 | 90 | 5 | 0 | 0 |
rs=1тИТ6(0)5(52тИТ1)r_s = 1 – \frac{6(0)}{5(5^2 – 1)} rs=1r_s = 1
рдЪреВрдБрдХрд┐ rs=1r_s = 1, рдпрд╣ рдкреВрд░реНрдг рд╕рдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдз рдХреЛ рджрд░реНрд╢рд╛рддрд╛ рд╣реИред
4. рд╡рд╛рд╕реНрддрд╡рд┐рдХ рдЬреАрд╡рди рдореЗрдВ рд╕рд╣рд╕рдВрдмрдВрдз рдХреЗ рдЕрдиреБрдкреНрд░рдпреЛрдЧ
- рд╢рд┐рдХреНрд╖рд╛ тАУ рдЕрдзреНрдпрдпрди рдХреЗ рдШрдВрдЯреЗ рдФрд░ рдкрд░реАрдХреНрд╖рд╛ рдХреЗ рдЕрдВрдХреЛрдВ рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдзред
- рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди тАУ рддрдирд╛рд╡ рд╕реНрддрд░ рдФрд░ рдорд╛рдирд╕рд┐рдХ рд╕реНрд╡рд╛рд╕реНрдереНрдп рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдзред
- рд╡реНрдпрд╡рд╕рд╛рдп тАУ рд╡рд┐рдЬреНрдЮрд╛рдкрди рд╡реНрдпрдп рдФрд░ рдмрд┐рдХреНрд░реА рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдзред
- рдЪрд┐рдХрд┐рддреНрд╕рд╛ тАУ рд╡реНрдпрд╛рдпрд╛рдо рдФрд░ рдХреЛрд▓реЗрд╕реНрдЯреНрд░реЙрд▓ рд╕реНрддрд░ рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдзред
5. рд╕рд╣рд╕рдВрдмрдВрдз рдХреА рд╕реАрдорд╛рдПрдБ
- рд╕рдВрдмрдВрдз рдХрд╛ рдХрд╛рд░рдг рдирд╣реАрдВ рдмрддрд╛рддрд╛ (Correlation does not imply causation)ред
- рд╡рд┐рд╖рдо рдорд╛рди (Outliers) рд╕реЗ рдкреНрд░рднрд╛рд╡рд┐рдд рд╣реЛ рд╕рдХрддрд╛ рд╣реИред
- рдХреЗрд╡рд▓ рд░реИрдЦрд┐рдХ рд╕рдВрдмрдВрдзреЛрдВ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреБрдХреНрддред
рдирд┐рд╖реНрдХрд░реНрд╖
рдкрд┐рдпрд░реНрд╕рди рд╡рд┐рдзрд┐ рд╕рддрдд рдФрд░ рд░реИрдЦрд┐рдХ рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреБрдХреНрдд рд╣реИ, рдЬрдмрдХрд┐ рд╕реНрдкреАрдпрд░рдореИрди рд╡рд┐рдзрд┐ рдХреНрд░рдордмрджреНрдз рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рдЕрдзрд┐рдХ рдЙрдкрдпреБрдХреНрдд рд╣реЛрддреА рд╣реИред рджреЛрдиреЛрдВ рд╡рд┐рдзрд┐рдпрд╛рдБ рд╢реЛрдзрдХрд░реНрддрд╛рдУрдВ рдФрд░ рд╡рд┐рд╢реНрд▓реЗрд╖рдХреЛрдВ рдХреЛ рдбреЗрдЯрд╛ рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдзреЛрдВ рдХреА рд╕рдордЭ рдмрдирд╛рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддреА рд╣реИрдВред
UNIT-3(3.2) Calculation of Correlation: Product moment and Rank difference method.
Introduction
Correlation is a statistical technique used to measure the strength and direction of a relationship between two variables. It helps researchers and analysts understand how one variable changes in response to another. There are multiple ways to calculate correlation, but the Product Moment Method (PearsonтАЩs Correlation Coefficient) and the Rank Difference Method (SpearmanтАЩs Rank Correlation Coefficient) are the most commonly used.
This essay will cover:
- Concept of correlation and its significance
- Product Moment Method (PearsonтАЩs Correlation Coefficient)
- Rank Difference Method (SpearmanтАЩs Rank Correlation Coefficient)
- Real-life applications of correlation
- Limitations of correlation
1. Concept of Correlation and Its Significance
Definition
Correlation is a statistical measure that expresses the extent to which two variables are related to each other. It ranges from -1 to +1, where:
- +1 indicates a perfect positive correlation (when one variable increases, the other also increases).
- -1 indicates a perfect negative correlation (when one variable increases, the other decreases).
- 0 indicates no correlation (no relationship between the variables).
Importance of Correlation in Research
- Helps in predicting one variable based on another.
- Used in psychology, business, economics, and medical research.
- Helps in identifying patterns and making informed decisions.
2. Product Moment Method (PearsonтАЩs Correlation Coefficient, r)
Concept
The Product Moment Method, also known as PearsonтАЩs Correlation Coefficient, measures the linear relationship between two continuous variables. It is suitable for normally distributed data with a linear relationship.
Formula
The Pearson correlation coefficient (rr) is calculated using the formula:
r=nтИСXYтИТ(тИСX)(тИСY)[nтИСX2тИТ(тИСX)2][nтИСY2тИТ(тИСY)2]r = \frac{n \sum XY – (\sum X)(\sum Y)}{\sqrt{[n \sum X^2 – (\sum X)^2][n \sum Y^2 – (\sum Y)^2]}}
where:
- XX and YY are the two variables.
- nn is the number of data points.
- тИСXY\sum XY is the sum of the product of paired scores.
- тИСX\sum X and тИСY\sum Y are the sum of individual values of X and Y.
- тИСX2\sum X^2 and тИСY2\sum Y^2 are the sum of squared values of X and Y.
Step-by-Step Calculation
Example:
Suppose we have the following data on studentsтАЩ study hours (X) and exam scores (Y).
Student | Study Hours (X) | Exam Score (Y) | X2X^2 | Y2Y^2 | XYXY |
1 | 2 | 40 | 4 | 1600 | 80 |
2 | 3 | 50 | 9 | 2500 | 150 |
3 | 5 | 65 | 25 | 4225 | 325 |
4 | 6 | 70 | 36 | 4900 | 420 |
5 | 8 | 90 | 64 | 8100 | 720 |
Now, calculate:
- тИСX=2+3+5+6+8=24\sum X = 2 + 3 + 5 + 6 + 8 = 24
- тИСY=40+50+65+70+90=315\sum Y = 40 + 50 + 65 + 70 + 90 = 315
- тИСX2=4+9+25+36+64=138\sum X^2 = 4 + 9 + 25 + 36 + 64 = 138
- тИСY2=1600+2500+4225+4900+8100=21325\sum Y^2 = 1600 + 2500 + 4225 + 4900 + 8100 = 21325
- тИСXY=80+150+325+420+720=1695\sum XY = 80 + 150 + 325 + 420 + 720 = 1695
Using the formula:
r=(5)(1695)тИТ(24)(315)[5(138)тИТ(24)2][5(21325)тИТ(315)2]r = \frac{(5)(1695) – (24)(315)}{\sqrt{[5(138) – (24)^2][5(21325) – (315)^2]}} r=8475тИТ7560[690тИТ576][106625тИТ99225]r = \frac{8475 – 7560}{\sqrt{[690 – 576][106625 – 99225]}} r=915114├Ч7400r = \frac{915}{\sqrt{114 \times 7400}} r=915841800r = \frac{915}{\sqrt{841800}} r=915917.6=0.997r = \frac{915}{917.6} = 0.997
Since rтЙИ1r \approx 1, this indicates a very strong positive correlation between study hours and exam scores.
3. Rank Difference Method (SpearmanтАЩs Rank Correlation Coefficient, rтВЫ)
Concept
The Rank Difference Method, also known as SpearmanтАЩs Rank Correlation Coefficient, is used when data is ordinal (ranked data) rather than continuous. It measures monotonic relationships (where variables move in the same or opposite direction but not necessarily at a constant rate).
Formula
The Spearman rank correlation coefficient (rsr_s) is calculated using:
rs=1тИТ6тИСd2n(n2тИТ1)r_s = 1 – \frac{6 \sum d^2}{n(n^2 – 1)}
where:
- dd is the difference between the ranks of X and Y.
- nn is the number of observations.
Step-by-Step Calculation
Example:
Rank the study hours and exam scores from the previous example.
Student | Study Hours (X) | Rank (X) | Exam Score (Y) | Rank (Y) | d=XтИТYd = X – Y | d2d^2 |
1 | 2 | 1 | 40 | 1 | 0 | 0 |
2 | 3 | 2 | 50 | 2 | 0 | 0 |
3 | 5 | 3 | 65 | 3 | 0 | 0 |
4 | 6 | 4 | 70 | 4 | 0 | 0 |
5 | 8 | 5 | 90 | 5 | 0 | 0 |
Now,
- тИСd2=0\sum d^2 = 0
- n=5n = 5
Using the formula:
rs=1тИТ6(0)5(52тИТ1)r_s = 1 – \frac{6(0)}{5(5^2 – 1)} rs=1тИТ0=1r_s = 1 – 0 = 1
Since rs=1r_s = 1, it indicates a perfect positive correlation between study hours and exam scores.
4. Real-Life Applications of Correlation
- Education тАУ Correlation between attendance and academic performance.
- Psychology тАУ Relationship between stress levels and mental health.
- Business тАУ Impact of advertising expenditure on sales.
- Health тАУ Relationship between exercise and cholesterol levels.
5. Limitations of Correlation
- Does not imply causation тАУ A strong correlation does not mean one variable causes the other.
- Sensitive to outliers тАУ Extreme values can distort correlation values.
- Limited to linear relationships тАУ PearsonтАЩs correlation does not work well for non-linear relationships.
Conclusion
The Product Moment Method (PearsonтАЩs Correlation Coefficient) is ideal for continuous and linear data, while the Rank Difference Method (SpearmanтАЩs Rank Correlation Coefficient) is better suited for ranked or ordinal data. Both methods provide valuable insights into relationships between variables, helping researchers and analysts make data-driven decisions.
UNIT-3(3.3) Calculation of t-test: Independent group and Correlated group.
t-рдкрд░рд┐рдХреНрд╖рдг (t-test) рдХреА рдЧрдгрдирд╛: рд╕реНрд╡рддрдВрддреНрд░ рд╕рдореВрд╣ рдФрд░ рд╕рд╣рд╕рдВрдмрджреНрдз рд╕рдореВрд╣
рдкрд░рд┐рдЪрдп
t-рдкрд░рд┐рдХреНрд╖рдг (t-test) рдПрдХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рдкрд░реАрдХреНрд╖рдг рд╣реИ рдЬрд┐рд╕рдХрд╛ рдЙрдкрдпреЛрдЧ рджреЛ рд╕рдореВрд╣реЛрдВ рдХреЗ рдФрд╕рдд (Mean) рдХреА рддреБрд▓рдирд╛ рдХрд░рдиреЗ рдФрд░ рдпрд╣ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдХрд┐ рдЙрдирдХреЗ рдмреАрдЪ рдХрд╛ рдЕрдВрддрд░ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╣реИ рдпрд╛ рдХреЗрд╡рд▓ рд╕рдВрдпреЛрдЧ рдорд╛рддреНрд░ред рдпрд╣ рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди, рд╢рд┐рдХреНрд╖рд╛, рдЪрд┐рдХрд┐рддреНрд╕рд╛ рдФрд░ рд╡реНрдпрд╡рд╕рд╛рдп рдЬреИрд╕реЗ рдХреНрд╖реЗрддреНрд░реЛрдВ рдореЗрдВ рд╡реНрдпрд╛рдкрдХ рд░реВрдк рд╕реЗ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
t-рдкрд░рд┐рдХреНрд╖рдг рдХреЗ рджреЛ рдореБрдЦреНрдп рдкреНрд░рдХрд╛рд░ рд╣реЛрддреЗ рд╣реИрдВ:
- рд╕реНрд╡рддрдВрддреНрд░ рдирдореВрдирд╛ t-рдкрд░рд┐рдХреНрд╖рдг (Independent Samples t-test) – рдЬрдм рджреЛ рдЕрд▓рдЧ-рдЕрд▓рдЧ рд╕рдореВрд╣реЛрдВ рдХреА рддреБрд▓рдирд╛ рдХреА рдЬрд╛рддреА рд╣реИред
- рдпреБрдЧреНрдорд┐рдд (рд╕рд╣рд╕рдВрдмрджреНрдз) рдирдореВрдирд╛ t-рдкрд░рд┐рдХреНрд╖рдг (Paired Samples t-test) – рдЬрдм рдПрдХ рд╣реА рд╕рдореВрд╣ рдХрд╛ рджреЛ рд╕реНрдерд┐рддрд┐рдпреЛрдВ рдореЗрдВ рдпрд╛ рджреЛ рд╕рдордп рдмрд┐рдВрджреБрдУрдВ рдкрд░ рдкрд░реАрдХреНрд╖рдг рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
рдЗрд╕ рд▓реЗрдЦ рдореЗрдВ, рд╣рдо рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдмрд┐рдВрджреБрдУрдВ рдкрд░ рдЪрд░реНрдЪрд╛ рдХрд░реЗрдВрдЧреЗ:
- t-рдкрд░рд┐рдХреНрд╖рдг рдХреА рдЕрд╡рдзрд╛рд░рдгрд╛ рдФрд░ рдЗрд╕рдХрд╛ рдорд╣рддреНрд╡
- рд╕реНрд╡рддрдВрддреНрд░ рдирдореВрдирд╛ t-рдкрд░рд┐рдХреНрд╖рдг тАУ рд╕реВрддреНрд░, рдЧрдгрдирд╛ рдФрд░ рдЙрджрд╛рд╣рд░рдг
- рдпреБрдЧреНрдорд┐рдд (рд╕рд╣рд╕рдВрдмрджреНрдз) рдирдореВрдирд╛ t-рдкрд░рд┐рдХреНрд╖рдг тАУ рд╕реВрддреНрд░, рдЧрдгрдирд╛ рдФрд░ рдЙрджрд╛рд╣рд░рдг
- t-рдкрд░рд┐рдХреНрд╖рдг рдХреЗ рдкрд░рд┐рдгрд╛рдореЛрдВ рдХреА рд╡реНрдпрд╛рдЦреНрдпрд╛
- t-рдкрд░рд┐рдХреНрд╖рдг рдХреА рд╕реАрдорд╛рдПрдБ рдФрд░ рдзрд╛рд░рдгрд╛рдПрдБ
1. t-рдкрд░рд┐рдХреНрд╖рдг рдХреА рдЕрд╡рдзрд╛рд░рдгрд╛ рдФрд░ рдорд╣рддреНрд╡
t-рдкрд░рд┐рдХреНрд╖рдг рдХреНрдпрд╛ рд╣реИ?
t-рдкрд░рд┐рдХреНрд╖рдг рджреЛ рд╕рдореВрд╣реЛрдВ рдХреЗ рдмреАрдЪ рдЕрдВрддрд░ рдХреЛ рдорд╛рдкрдиреЗ рдХрд╛ рдПрдХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рддрд░реАрдХрд╛ рд╣реИред рдпрд╣ t-рд╡рд┐рддрд░рдг (t-distribution) рдкрд░ рдЖрдзрд╛рд░рд┐рдд рд╣реЛрддрд╛ рд╣реИ рдФрд░ рд╡рд┐рд╢реЗрд╖ рд░реВрдк рд╕реЗ рдЫреЛрдЯреЗ рдирдореВрдиреЛрдВ (n < 30) рдХреЗ рд▓рд┐рдП рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
t-рдкрд░рд┐рдХреНрд╖рдг рдХрд╛ рдорд╣рддреНрд╡
- рдпрд╣ рдпрд╣ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХрд░рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддрд╛ рд╣реИ рдХрд┐ рджреЛ рд╕рдореВрд╣реЛрдВ рдХреЗ рдмреАрдЪ рдХрд╛ рдЕрдВрддрд░ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рд╣реИ рдпрд╛ рдХреЗрд╡рд▓ рд╕рдВрдпреЛрдЧрд╡рд╢ рд╣реИред
- рдЕрдиреБрд╕рдВрдзрд╛рди (Research) рдореЗрдВ рдирд┐рдпрдВрддреНрд░рдг (Control) рдФрд░ рдкреНрд░рдпреЛрдЧрд╛рддреНрдордХ (Experimental) рд╕рдореВрд╣ рдХреА рддреБрд▓рдирд╛ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
- рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди, рд╡реНрдпрд╡рд╕рд╛рдп, рд╢рд┐рдХреНрд╖рд╛ рдФрд░ рдЪрд┐рдХрд┐рддреНрд╕рд╛ рдореЗрдВ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдирд┐рд░реНрдгрдп рд▓реЗрдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддрд╛ рд╣реИред
2. рд╕реНрд╡рддрдВрддреНрд░ рдирдореВрдирд╛ t-рдкрд░рд┐рдХреНрд╖рдг (Independent Samples t-test)
рдЕрд╡рдзрд╛рд░рдгрд╛
рдпрд╣ рдкрд░реАрдХреНрд╖рдг рддрдм рдкреНрд░рдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдЬрдм рд╣рдо рджреЛ рд╕реНрд╡рддрдВрддреНрд░ рд╕рдореВрд╣реЛрдВ рдХреА рддреБрд▓рдирд╛ рдХрд░рдирд╛ рдЪрд╛рд╣рддреЗ рд╣реИрдВред рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП,
- рдкреБрд░реБрд╖ рдФрд░ рдорд╣рд┐рд▓рд╛ рдЫрд╛рддреНрд░реЛрдВ рдХреЗ рдкрд░реАрдХреНрд╖рд╛ рдЕрдВрдХреЛрдВ рдХреА рддреБрд▓рдирд╛ред
- рдПрдХ рдирдИ рджрд╡рд╛ рдФрд░ рдПрдХ рдкреНрд▓реЗрд╕рд┐рдмреЛ (Placebo) рдХреЗ рдкреНрд░рднрд╛рд╡ рдХреА рддреБрд▓рдирд╛ред
рд╕реВрддреНрд░
рд╕реНрд╡рддрдВрддреНрд░ рдирдореВрдирд╛ t-рдкрд░рд┐рдХреНрд╖рдг рдХрд╛ рд╕реВрддреНрд░ рдЗрд╕ рдкреНрд░рдХрд╛рд░ рд╣реИ:
t=X1╦ЙтИТX2╦Йs12n1+s22n2t = \frac{\bar{X_1} – \bar{X_2}}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}
рдЬрд╣рд╛рдБ:
- X1╦Й\bar{X_1} рдФрд░ X2╦Й\bar{X_2} = рд╕рдореВрд╣ 1 рдФрд░ рд╕рдореВрд╣ 2 рдХрд╛ рдФрд╕рдд
- s12s_1^2 рдФрд░ s22s_2^2 = рд╕рдореВрд╣ 1 рдФрд░ рд╕рдореВрд╣ 2 рдХрд╛ рдкреНрд░рд╕рд░рдг (Variance)
- n1n_1 рдФрд░ n2n_2 = рд╕рдореВрд╣ 1 рдФрд░ рд╕рдореВрд╣ 2 рдХрд╛ рдирдореВрдирд╛ рдЖрдХрд╛рд░
рд╕реНрд╡рддрдВрддреНрд░рддрд╛ рдХреА рдбрд┐рдЧреНрд░реА (Degrees of Freedom, df) рдХреА рдЧрдгрдирд╛:
df=n1+n2тИТ2df = n_1 + n_2 – 2
рдЧрдгрдирд╛ рдХрд╛ рдЙрджрд╛рд╣рд░рдг
рдЙрджрд╛рд╣рд░рдг:
рдПрдХ рд╢реЛрдзрдХрд░реНрддрд╛ рдпрд╣ рдЬрд╛рдВрдЪрдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рдкрд╛рд░рдВрдкрд░рд┐рдХ рдФрд░ рдЖрдзреБрдирд┐рдХ рд╢рд┐рдХреНрд╖рдг рд╡рд┐рдзрд┐рдпреЛрдВ рд╕реЗ рдЫрд╛рддреНрд░реЛрдВ рдХреЗ рдЕрдВрдХреЛрдВ рдореЗрдВ рдХреЛрдИ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдЕрдВрддрд░ рд╣реИред
рд╕рдореВрд╣ | рдкрд░реАрдХреНрд╖рд╛ рдЕрдВрдХ | рдФрд╕рдд (X╦Й\bar{X}) | рдкреНрд░рд╕рд░рдг (s2s^2) | рдирдореВрдирд╛ рдЖрдХрд╛рд░ (n) |
рдкрд╛рд░рдВрдкрд░рд┐рдХ | 50, 55, 52, 48, 53 | 51.6 | 6.3 | 5 |
рдЖрдзреБрдирд┐рдХ | 60, 62, 58, 65, 63 | 61.6 | 7.3 | 5 |
рдЕрдм рд╕реВрддреНрд░ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░реЗрдВ:
t=51.6тИТ61.66.35+7.35t = \frac{51.6 – 61.6}{\sqrt{\frac{6.3}{5} + \frac{7.3}{5}}} t=тИТ101.26+1.46t = \frac{-10}{\sqrt{1.26 + 1.46}} t=тИТ102.72t = \frac{-10}{\sqrt{2.72}} t=тИТ101.65=тИТ6.06t = \frac{-10}{1.65} = -6.06
рдкрд░рд┐рдгрд╛рдо рдХреА рд╡реНрдпрд╛рдЦреНрдпрд╛
рдпрджрд┐ t-рд╕реВрдЪреА (t-table) рдореЗрдВ df = 8 рдФрд░ ╬▒ = 0.05 рдХреЗ рд▓рд┐рдП рдирд╛рдЬреБрдХ рдорд╛рди (critical value) = 2.306 рд╣реИ, рдФрд░ рдЪреВрдВрдХрд┐ |t| = 6.06 > 2.306, рд╣рдо рд╢реВрдиреНрдп рдкрд░рд┐рдХрд▓реНрдкрдирд╛ (null hypothesis) рдХреЛ рдЕрд╕реНрд╡реАрдХрд╛рд░ рдХрд░рддреЗ рд╣реИрдВред рдЗрд╕рдХрд╛ рдЕрд░реНрде рд╣реИ рдХрд┐ рдЖрдзреБрдирд┐рдХ рд╢рд┐рдХреНрд╖рдг рд╡рд┐рдзрд┐ рдкрд╛рд░рдВрдкрд░рд┐рдХ рд╡рд┐рдзрд┐ рд╕реЗ рдЕрдзрд┐рдХ рдкреНрд░рднрд╛рд╡реА рд╣реИред
3. рдпреБрдЧреНрдорд┐рдд (рд╕рд╣рд╕рдВрдмрджреНрдз) рдирдореВрдирд╛ t-рдкрд░рд┐рдХреНрд╖рдг (Paired Samples t-test)
рдЕрд╡рдзрд╛рд░рдгрд╛
рдЬрдм рд╣рдо рдПрдХ рд╣реА рд╕рдореВрд╣ рдХрд╛ рджреЛ рдЕрд▓рдЧ-рдЕрд▓рдЧ рд╕рдордп рдмрд┐рдВрджреБрдУрдВ рдкрд░ рдкрд░реАрдХреНрд╖рдг рдХрд░рддреЗ рд╣реИрдВ, рддреЛ рд╣рдо рдпреБрдЧреНрдорд┐рдд t-рдкрд░рд┐рдХреНрд╖рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреЗ рд╣реИрдВред рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП:
- рдЫрд╛рддреНрд░реЛрдВ рдХреЗ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рд╕реЗ рдкрд╣рд▓реЗ рдФрд░ рдмрд╛рдж рдХреЗ рдЕрдВрдХреЛрдВ рдХреА рддреБрд▓рдирд╛ред
- рдХрд░реНрдордЪрд╛рд░рд┐рдпреЛрдВ рдХреЗ рддрдирд╛рд╡ рд╕реНрддрд░ рдХреЗ рдкрд╣рд▓реЗ рдФрд░ рдмрд╛рдж рдХреЗ рдорд╛рдкрди рдХреА рддреБрд▓рдирд╛ред
рд╕реВрддреНрд░
t=D╦ЙsD/nt = \frac{\bar{D}}{s_D / \sqrt{n}}
рдЬрд╣рд╛рдБ:
- D╦Й\bar{D} = рдпреБрдЧреНрдорд┐рдд рдЕрдВрддрд░ рдХрд╛ рдФрд╕рдд
- sDs_D = рдЕрдВрддрд░ рдХрд╛ рдорд╛рдирдХ рд╡рд┐рдЪрд▓рди
- nn = рдпреБрдЧреНрдореЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛
рд╕реНрд╡рддрдВрддреНрд░рддрд╛ рдХреА рдбрд┐рдЧреНрд░реА:
df=nтИТ1df = n – 1
рдЧрдгрдирд╛ рдХрд╛ рдЙрджрд╛рд╣рд░рдг
рдЙрджрд╛рд╣рд░рдг:
рдПрдХ рдордиреЛрд╡реИрдЬреНрдЮрд╛рдирд┐рдХ 5 рдХрд░реНрдордЪрд╛рд░рд┐рдпреЛрдВ рдХреЗ рддрдирд╛рд╡ рд╕реНрддрд░ рдХреЛ рддрдирд╛рд╡ рдкреНрд░рдмрдВрдзрди рдХрд╛рд░реНрдпрдХреНрд░рдо рд╕реЗ рдкрд╣рд▓реЗ рдФрд░ рдмрд╛рдж рдореЗрдВ рдорд╛рдкрддрд╛ рд╣реИред
рдХрд░реНрдордЪрд╛рд░реА | рдкрд╣рд▓реЗ (X) | рдмрд╛рдж рдореЗрдВ (Y) | рдЕрдВрддрд░ (D = X – Y) | D2D^2 |
1 | 80 | 72 | 8 | 64 |
2 | 85 | 78 | 7 | 49 |
3 | 78 | 74 | 4 | 16 |
4 | 90 | 83 | 7 | 49 |
5 | 76 | 70 | 6 | 36 |
рдЧрдгрдирд╛ рдХрд░рдиреЗ рдкрд░, t = 9.41 рдЖрддрд╛ рд╣реИред рдпрджрд┐ t-рд╕реВрдЪреА рдХреЗ рдЕрдиреБрд╕рд╛рд░ рдирд╛рдЬреБрдХ рдорд╛рди 2.776 рд╣реИ, рддреЛ |t| > 2.776, рдЬрд┐рд╕рдХрд╛ рдЕрд░реНрде рд╣реИ рдХрд┐ рддрдирд╛рд╡ рдкреНрд░рдмрдВрдзрди рдХрд╛рд░реНрдпрдХреНрд░рдо рдкреНрд░рднрд╛рд╡реА рдерд╛ред
4. t-рдкрд░рд┐рдХреНрд╖рдг рдХреА рд╕реАрдорд╛рдПрдБ рдФрд░ рдзрд╛рд░рдгрд╛рдПрдБ
рдзрд╛рд░рдгрд╛рдПрдБ (Assumptions)
- рдбреЗрдЯрд╛ рдХреЛ рд╕рд╛рдорд╛рдиреНрдп рд╡рд┐рддрд░рдг (Normal Distribution) рдореЗрдВ рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдПред
- рд╕рдореВрд╣реЛрдВ рдХрд╛ рдкреНрд░рд╕рд░рдг рд╕рдорд╛рди рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдП (рд╕реНрд╡рддрдВрддреНрд░ t-рдкрд░рд┐рдХреНрд╖рдг рдХреЗ рд▓рд┐рдП)ред
- рдбреЗрдЯрд╛ рд╕реНрд╡рддрдВрддреНрд░ рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдП (рд╕реНрд╡рддрдВрддреНрд░ t-рдкрд░рд┐рдХреНрд╖рдг рдХреЗ рд▓рд┐рдП)ред
рд╕реАрдорд╛рдПрдБ (Limitations)
- рдЫреЛрдЯреЗ рдирдореВрдирд╛ рдЖрдХрд╛рд░ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреБрдХреНрддред
- рд╡рд┐рд╖рдо рдореВрд▓реНрдпреЛрдВ (Outliers) рд╕реЗ рдкреНрд░рднрд╛рд╡рд┐рдд рд╣реЛ рд╕рдХрддрд╛ рд╣реИред
- рдХреЗрд╡рд▓ рджреЛ рд╕рдореВрд╣реЛрдВ рдХреА рддреБрд▓рдирд╛ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреЛрдЧреАред
рдирд┐рд╖реНрдХрд░реНрд╖
- рд╕реНрд╡рддрдВрддреНрд░ t-рдкрд░рд┐рдХреНрд╖рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рджреЛ рдЕрд▓рдЧ-рдЕрд▓рдЧ рд╕рдореВрд╣реЛрдВ рдХреЗ рдФрд╕рдд рдХреА рддреБрд▓рдирд╛ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
- рдпреБрдЧреНрдорд┐рдд t-рдкрд░рд┐рдХреНрд╖рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдПрдХ рд╣реА рд╕рдореВрд╣ рдХреЗ рдЕрд▓рдЧ-рдЕрд▓рдЧ рд╕реНрдерд┐рддрд┐рдпреЛрдВ рдХреА рддреБрд▓рдирд╛ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
- рдпрд╣ рд╢реЛрдзрдХрд░реНрддрд╛рдУрдВ рдФрд░ рд╡рд┐рд╢реНрд▓реЗрд╖рдХреЛрдВ рдХреЛ рд╕рдореВрд╣реЛрдВ рдХреЗ рдмреАрдЪ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдЕрдВрддрд░ рдХреЛ рд╕рдордЭрдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддрд╛ рд╣реИред
UNIT-3(3.3) Calculation of t-test: Independent group and Correlated group.
Introduction
The t-test is a statistical test used to compare the means of two groups and determine whether the differences between them are statistically significant. It is widely used in research fields such as psychology, education, medicine, and business.
There are two main types of t-tests:
- Independent Samples t-test (for comparing two separate groups)
- Paired (Correlated) Samples t-test (for comparing the same group at different times or conditions)
In this article, we will cover:
- The concept of the t-test and its importance
- Independent Samples t-test тАУ Formula, Calculation, and Example
- Paired (Correlated) Samples t-test тАУ Formula, Calculation, and Example
- Interpretation of t-test results
- Assumptions and Limitations of t-tests
1. Concept of t-test and Its Importance
What is a t-test?
A t-test is a statistical test used to compare the means of two groups to determine if there is a significant difference between them. It is based on the concept of the t-distribution and is used when the sample size is small (n < 30).
Why is the t-test important?
- It helps determine if differences between two groups are real or due to random chance.
- Used in experimental research to compare control and experimental groups.
- Helps in decision-making in psychology, business, education, and healthcare.
2. Independent Samples t-test
Concept
The Independent Samples t-test is used when we compare the means of two different (independent) groups. For example, comparing the exam scores of male and female students or the reaction times of two different groups of participants in an experiment.
Formula
The formula for an independent samples t-test is:
t=X1╦ЙтИТX2╦Йs12n1+s22n2t = \frac{\bar{X_1} – \bar{X_2}}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}
Where:
- X1╦Й\bar{X_1} and X2╦Й\bar{X_2} = Mean of group 1 and group 2
- s12s_1^2 and s22s_2^2 = Variance of group 1 and group 2
- n1n_1 and n2n_2 = Sample size of group 1 and group 2
The degrees of freedom (df) are calculated as:
df=n1+n2тИТ2df = n_1 + n_2 – 2
Step-by-Step Calculation
Example:
A researcher wants to test whether there is a significant difference in the test scores of students taught using traditional methods versus modern teaching methods.
Group | Test Scores | Mean (X╦Й\bar{X}) | Variance (s2s^2) | Sample Size (n) |
Traditional | 50, 55, 52, 48, 53 | 51.6 | 6.3 | 5 |
Modern | 60, 62, 58, 65, 63 | 61.6 | 7.3 | 5 |
Now, apply the formula:
t=51.6тИТ61.66.35+7.35t = \frac{51.6 – 61.6}{\sqrt{\frac{6.3}{5} + \frac{7.3}{5}}} t=тИТ101.26+1.46t = \frac{-10}{\sqrt{1.26 + 1.46}} t=тИТ102.72t = \frac{-10}{\sqrt{2.72}} t=тИТ101.65=тИТ6.06t = \frac{-10}{1.65} = -6.06
Interpretation
If the critical value from the t-table (for df=8df = 8 and ╬▒ = 0.05) is 2.306, since |t| = 6.06 is greater than 2.306, we reject the null hypothesis. This means that the modern teaching method leads to significantly higher scores.
3. Paired (Correlated) Samples t-test
Concept
The Paired (Correlated) Samples t-test is used when comparing two related samples or the same group at different times. For example:
- Measuring students’ test scores before and after a training program.
- Comparing participants’ heart rate before and after an exercise session.
Formula
The formula for a paired t-test is:
t=D╦ЙsD/nt = \frac{\bar{D}}{s_D / \sqrt{n}}
Where:
- D╦Й\bar{D} = Mean of the differences between paired values
- sDs_D = Standard deviation of the differences
- nn = Number of pairs
The degrees of freedom (df) are calculated as:
df=nтИТ1df = n – 1
Step-by-Step Calculation
Example:
A psychologist measures the stress levels of 5 employees before and after a stress management program.
Employee | Before (X) | After (Y) | Difference (D = X – Y) | D2D^2 |
1 | 80 | 72 | 8 | 64 |
2 | 85 | 78 | 7 | 49 |
3 | 78 | 74 | 4 | 16 |
4 | 90 | 83 | 7 | 49 |
5 | 76 | 70 | 6 | 36 |
Now, calculate:
- тИСD=8+7+4+7+6=32\sum D = 8 + 7 + 4 + 7 + 6 = 32
- тИСD2=64+49+16+49+36=214\sum D^2 = 64 + 49 + 16 + 49 + 36 = 214
- D╦Й=тИСDn=325=6.4\bar{D} = \frac{\sum D}{n} = \frac{32}{5} = 6.4
- Variance of D:
sD2=тИСD2тИТ(тИСD)2nnтИТ1s_D^2 = \frac{\sum D^2 – \frac{(\sum D)^2}{n}}{n-1} sD2=214тИТ(32)255тИТ1s_D^2 = \frac{214 – \frac{(32)^2}{5}}{5-1} sD2=214тИТ204.84=9.24=2.3s_D^2 = \frac{214 – 204.8}{4} = \frac{9.2}{4} = 2.3 sD=2.3=1.52s_D = \sqrt{2.3} = 1.52
Now, calculate t:
t=6.41.52/5t = \frac{6.4}{1.52 / \sqrt{5}} t=6.40.68=9.41t = \frac{6.4}{0.68} = 9.41
Interpretation
If the critical value from the t-table (for df=4df = 4 and ╬▒ = 0.05) is 2.776, since |t| = 9.41 is greater than 2.776, we reject the null hypothesis. This means the stress management program significantly reduced stress levels.
4. Interpretation of t-test Results
- If тИгtтИг|t| is greater than the critical value тЖТ Reject the null hypothesis тЖТ There is a significant difference.
- If тИгtтИг|t| is less than the critical value тЖТ Fail to reject the null hypothesis тЖТ No significant difference.
5. Assumptions and Limitations of t-test
Assumptions
- Data should be normally distributed.
- Groups should have equal variances (for independent t-test).
- Observations should be independent (for independent t-test).
Limitations
- Not suitable for non-normal data.
- Sensitive to outliers.
- Works best for small sample sizes.
Conclusion
The Independent Samples t-test is used to compare two separate groups, while the Paired Samples t-test is used for repeated measurements on the same individuals. Understanding these tests helps researchers make informed conclusions about differences in means between groups.
UNIT-4(4.1) Chi square: Concept.
рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг (Chi-Square Test): рдЕрд╡рдзрд╛рд░рдгрд╛, рдкреНрд░рдХрд╛рд░ рдФрд░ рдЕрдиреБрдкреНрд░рдпреЛрдЧ
рдкрд░рд┐рдЪрдп
рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг (Chi-Square Test) рдПрдХ рдЧреИрд░-рдкреИрд░рд╛рдореАрдЯреНрд░рд┐рдХ (Non-Parametric) рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рдкрд░реАрдХреНрд╖рдг рд╣реИ, рдЬрд┐рд╕рдХрд╛ рдЙрдкрдпреЛрдЧ рдпрд╣ рдЬрд╛рдВрдЪрдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рджреЛ рд╢реНрд░реЗрдгреАрдмрджреНрдз (Categorical) рдЪрд░ рдХреЗ рдмреАрдЪ рдХреЛрдИ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╕рдВрдмрдВрдз рд╣реИ рдпрд╛ рдирд╣реАрдВред рдпрд╣ рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди, рдЬреИрд╡ рд╡рд┐рдЬреНрдЮрд╛рди, рд╕рд╛рдорд╛рдЬрд┐рдХ рд╡рд┐рдЬреНрдЮрд╛рди, рдФрд░ рд╡реНрдпрд╡рд╕рд╛рдп рдЬреИрд╕реЗ рдХреНрд╖реЗрддреНрд░реЛрдВ рдореЗрдВ рдЖрд╡реГрддреНрддрд┐ рдбреЗрдЯрд╛ (Frequency Data) рдХреЗ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдФрд░ рдкрд░рд┐рдХрд▓реНрдкрдирд╛ рдкрд░реАрдХреНрд╖рдг (Hypothesis Testing) рдХреЗ рд▓рд┐рдП рд╡реНрдпрд╛рдкрдХ рд░реВрдк рд╕реЗ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
рдпрд╣ рдкрд░реАрдХреНрд╖рдг рдореБрдЦреНрдп рд░реВрдк рд╕реЗ рдирд╛рдордорд╛рддреНрд░ (Nominal) рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ, рдЬрд╣рд╛рдБ рдЪрд░ рдХреЛ рд╡рд┐рднрд┐рдиреНрди рд╢реНрд░реЗрдгрд┐рдпреЛрдВ рдореЗрдВ рд╡рд░реНрдЧреАрдХреГрдд рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рд▓реЗрдХрд┐рди рдЙрдирдХрд╛ рдХреЛрдИ рдирд┐рд╢реНрдЪрд┐рдд рдХреНрд░рдо рдирд╣реАрдВ рд╣реЛрддрд╛ред
рдЗрд╕ рд▓реЗрдЦ рдореЗрдВ рд╣рдо рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдмрд┐рдВрджреБрдУрдВ рдХреЛ рдХрд╡рд░ рдХрд░реЗрдВрдЧреЗ:
- рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреА рдЕрд╡рдзрд╛рд░рдгрд╛
- рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреЗ рдкреНрд░рдХрд╛рд░
- рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рд╕рдорд░реВрдкрддрд╛ рдкрд░реАрдХреНрд╖рдг (Goodness of Fit)
- рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рд╕реНрд╡рддрдВрддреНрд░рддрд╛ рдкрд░реАрдХреНрд╖рдг (Test for Independence)
- рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреА рдкреВрд░реНрд╡-рдзрд╛рд░рдгрд╛рдПрдБ
- рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреА рдЧрдгрдирд╛ (рдЪрд░рдг-рджрд░-рдЪрд░рдг рдкреНрд░рдХреНрд░рд┐рдпрд╛)
- рдкрд░рд┐рдгрд╛рдореЛрдВ рдХреА рд╡реНрдпрд╛рдЦреНрдпрд╛
- рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреЗ рдЕрдиреБрдкреНрд░рдпреЛрдЧ
- рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреА рд╕реАрдорд╛рдПрдБ
1. рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреА рдЕрд╡рдзрд╛рд░рдгрд╛
рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреНрдпрд╛ рд╣реИ?
рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг (╧З┬▓ рдЯреЗрд╕реНрдЯ) рдХрд╛ рдЙрдкрдпреЛрдЧ рдпрд╣ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рджреЛ рд╢реНрд░реЗрдгреАрдмрджреНрдз рдЪрд░ рдХреЗ рдмреАрдЪ рдХреЛрдИ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рдЕрдВрддрд░ рд╣реИред
рдпрд╣ рдкреНрд░реЗрдХреНрд╖рд┐рдд (Observed) рдФрд░ рдЕрдкреЗрдХреНрд╖рд┐рдд (Expected) рдЖрд╡реГрддреНрддрд┐рдпреЛрдВ рдХреЗ рдмреАрдЪ рдХреЗ рдЕрдВрддрд░ рдХреЛ рдорд╛рдкрддрд╛ рд╣реИ рдФрд░ рдпрд╣ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХрд░рддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рдЕрдВрддрд░ рдорд╛рддреНрд░ рд╕рдВрдпреЛрдЧрд╡рд╢ рд╣реИ рдпрд╛ рджреЛ рдЪрд░ рдХреЗ рдмреАрдЪ рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рдХреЛрдИ рд╕рдВрдмрдВрдз рд╣реИред
рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХрд╛ рд╕реВрддреНрд░
╧З2=тИС(OтИТE)2E\chi^2 = \sum \frac{(O – E)^2}{E}
рдЬрд╣рд╛рдБ:
- ╧З2\chi^2 = рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рдорд╛рди
- OO = рдкреНрд░реЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐ (Observed Frequency)
- EE = рдЕрдкреЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐ (Expected Frequency)
рдпрджрд┐ ╧З┬▓ рдХрд╛ рдорд╛рди рдмрдбрд╝рд╛ рд╣реЛрддрд╛ рд╣реИ, рддреЛ рдпрд╣ рджрд░реНрд╢рд╛рддрд╛ рд╣реИ рдХрд┐ рдкреНрд░реЗрдХреНрд╖рд┐рдд рдФрд░ рдЕрдкреЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐рдпреЛрдВ рдХреЗ рдмреАрдЪ рдмрдбрд╝рд╛ рдЕрдВрддрд░ рд╣реИ, рдЬрд┐рд╕рд╕реЗ рдпрд╣ рд╕рдВрднрд╛рд╡рдирд╛ рдмрдврд╝ рдЬрд╛рддреА рд╣реИ рдХрд┐ рджреЛ рдЪрд░ рдПрдХ-рджреВрд╕рд░реЗ рд╕реЗ рд╕рдВрдмрдВрдзрд┐рдд рд╣реИрдВред
2. рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреЗ рдкреНрд░рдХрд╛рд░
A. рд╕рдорд░реВрдкрддрд╛ рдХреЗ рд▓рд┐рдП рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг (Goodness of Fit Test)
рдпрд╣ рдкрд░реАрдХреНрд╖рдг рдпрд╣ рдЬрд╛рдВрдЪрдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рдХреЛрдИ рд╡рд┐рд╢реЗрд╖ рдбреЗрдЯрд╛ рд╕реЗрдЯ рдХрд┐рд╕реА рджрд┐рдП рдЧрдП рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рд╡рд┐рддрд░рдг (Theoretical Distribution) рдХреЗ рдЕрдиреБрд░реВрдк рд╣реИ рдпрд╛ рдирд╣реАрдВред
рдЙрджрд╛рд╣рд░рдг:
рдПрдХ рд╢реЛрдзрдХрд░реНрддрд╛ рдпрд╣ рдкрд░реАрдХреНрд╖рдг рдХрд░рдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рддреАрди рдЕрд▓рдЧ-рдЕрд▓рдЧ рдмреНрд░рд╛рдВрдбреЛрдВ (A, B, рдФрд░ C) рдХреЗ рдЧреНрд░рд╛рд╣рдХ рд╕рдорд╛рди рд░реВрдк рд╕реЗ рд╡рд┐рддрд░рд┐рдд рд╣реИрдВред
рдмреНрд░рд╛рдВрдб | рдкреНрд░реЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐ (O) | рдЕрдкреЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐ (E) |
A | 40 | 50 |
B | 60 | 50 |
C | 50 | 50 |
рдпрд╣ рдкрд░реАрдХреНрд╖рдг рдпрд╣ рдЬрд╛рдВрдЪреЗрдЧрд╛ рдХрд┐ рдХреНрдпрд╛ рдмреНрд░рд╛рдВрдбреЛрдВ рдХреЗ рдмреАрдЪ рдкрд╕рдВрдж рдореЗрдВ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдЕрдВрддрд░ рд╣реИ рдпрд╛ рдирд╣реАрдВред
B. рд╕реНрд╡рддрдВрддреНрд░рддрд╛ рдХреЗ рд▓рд┐рдП рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг (Test for Independence)
рдЗрд╕ рдкрд░реАрдХреНрд╖рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдпрд╣ рдкрддрд╛ рд▓рдЧрд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдХрд┐ рджреЛ рд╢реНрд░реЗрдгреАрдмрджреНрдз рдЪрд░ рд╕реНрд╡рддрдВрддреНрд░ рд╣реИрдВ рдпрд╛ рд╕рдВрдмрдВрдзрд┐рдд рд╣реИрдВред
рдЙрджрд╛рд╣рд░рдг:
рдПрдХ рд╢реЛрдзрдХрд░реНрддрд╛ рдпрд╣ рдкрд░реАрдХреНрд╖рдг рдХрд░рдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реИ рдХрд┐ рд▓рд┐рдВрдЧ (рдкреБрд░реБрд╖/рдорд╣рд┐рд▓рд╛) рдФрд░ рдорддрджрд╛рди рд╡рд░реАрдпрддрд╛ (рдкрд╛рд░реНрдЯреА X / рдкрд╛рд░реНрдЯреА Y) рдХреЗ рдмреАрдЪ рдХреЛрдИ рд╕рдВрдмрдВрдз рд╣реИ рдпрд╛ рдирд╣реАрдВред
рд▓рд┐рдВрдЧ | рдкрд╛рд░реНрдЯреА X | рдкрд╛рд░реНрдЯреА Y |
рдкреБрд░реБрд╖ | 30 | 20 |
рдорд╣рд┐рд▓рд╛ | 25 | 25 |
рдпрджрд┐ рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рджрд░реНрд╢рд╛рддрд╛ рд╣реИ рдХрд┐ рдЕрдВрддрд░ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╣реИ, рддреЛ рдпрд╣ рдирд┐рд╖реНрдХрд░реНрд╖ рдирд┐рдХрд╛рд▓рд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИ рдХрд┐ рд▓рд┐рдВрдЧ рдФрд░ рдорддрджрд╛рди рд╡рд░реАрдпрддрд╛ рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдз рд╣реИред
3. рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреА рдкреВрд░реНрд╡-рдзрд╛рд░рдгрд╛рдПрдБ
- рдбреЗрдЯрд╛ рд╢реНрд░реЗрдгреАрдмрджреНрдз рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдП (рдЬреИрд╕реЗ рд▓рд┐рдВрдЧ, рд╡реНрдпрд╡рд╕рд╛рдп, рдкрд╕рдВрдж)ред
- рд╕рднреА рдЕрд╡рд▓реЛрдХрди рд╕реНрд╡рддрдВрддреНрд░ рд╣реЛрдиреЗ рдЪрд╛рд╣рд┐рдП (рд╣рд░ рдбреЗрдЯрд╛ рдмрд┐рдВрджреБ рдПрдХ рдЕрд▓рдЧ рд╡рд┐рд╖рдп рдХрд╛ рдкреНрд░рддрд┐рдирд┐рдзрд┐рддреНрд╡ рдХрд░рддрд╛ рд╣реИ)ред
- рд╣рд░ рд╢реНрд░реЗрдгреА рдХреА рдЕрдкреЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐ рдХрдо рд╕реЗ рдХрдо 5 рд╣реЛрдиреА рдЪрд╛рд╣рд┐рдПред
- рдирдореВрдирд╛ рдЖрдХрд╛рд░ рдкрд░реНрдпрд╛рдкреНрдд рд░реВрдк рд╕реЗ рдмрдбрд╝рд╛ рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдПред
4. рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреА рдЧрдгрдирд╛ (рдЪрд░рдг-рджрд░-рдЪрд░рдг рдкреНрд░рдХреНрд░рд┐рдпрд╛)
рдЙрджрд╛рд╣рд░рдг рд╕рдорд╕реНрдпрд╛
рдПрдХ рд╕рд░реНрд╡реЗрдХреНрд╖рдг рдореЗрдВ рдпрд╣ рдЬрд╛рдВрдЪрд╛ рдЬрд╛рддрд╛ рд╣реИ рдХрд┐ рд╡реНрдпрд╛рдпрд╛рдо рдХрд░рдиреЗ рдХреА рдЖрджрддреЗрдВ (рдирд┐рдпрдорд┐рдд/рдЕрдирд┐рдпрдорд┐рдд) рдФрд░ рд╣реГрджрдп рд░реЛрдЧ (рд╣рд╛рдВ/рдирд╣реАрдВ) рдХреЗ рдмреАрдЪ рдХреЛрдИ рд╕рдВрдмрдВрдз рд╣реИ рдпрд╛ рдирд╣реАрдВред
рд╡реНрдпрд╛рдпрд╛рдо рдЖрджрдд | рд╣реГрджрдп рд░реЛрдЧ (рд╣рд╛рдВ) | рд╣реГрджрдп рд░реЛрдЧ (рдирд╣реАрдВ) | рдХреБрд▓ |
рдирд┐рдпрдорд┐рдд | 30 | 70 | 100 |
рдЕрдирд┐рдпрдорд┐рдд | 50 | 50 | 100 |
рдХреБрд▓ | 80 | 120 | 200 |
рдЪрд░рдг 1: рдЕрдкреЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐рдпрд╛рдБ рдирд┐рдХрд╛рд▓реЗрдВ
E=рдкрдВрдХреНрддрд┐ рдпреЛрдЧ├Чрд╕реНрддрдВрдн рдпреЛрдЧрдХреБрд▓ рдпреЛрдЧE = \frac{\text{рдкрдВрдХреНрддрд┐ рдпреЛрдЧ} \times \text{рд╕реНрддрдВрдн рдпреЛрдЧ}}{\text{рдХреБрд▓ рдпреЛрдЧ}}
рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рдирд┐рдпрдорд┐рдд & рд╣рд╛рдВ рдХреЗ рд▓рд┐рдП рдЕрдкреЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐:
E=100├Ч80200=40E = \frac{100 \times 80}{200} = 40
рдЗрд╕реА рддрд░рд╣ рдЕрдиреНрдп рд╢реНрд░реЗрдгрд┐рдпреЛрдВ рдХреЗ рд▓рд┐рдП рдЕрдкреЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐рдпрд╛рдБ рдирд┐рдХрд╛рд▓реА рдЬрд╛рддреА рд╣реИрдВред
рдЪрд░рдг 2: рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рд╕реВрддреНрд░ рд▓рд╛рдЧреВ рдХрд░реЗрдВ
╧З2=тИС(OтИТE)2E\chi^2 = \sum \frac{(O – E)^2}{E}
рдЧрдгрдирд╛ рдХрд░рдиреЗ рдХреЗ рдмрд╛рдж, рдорд╛рди ╧З2=8.34\chi^2 = 8.34 рдкреНрд░рд╛рдкреНрдд рд╣реЛрддрд╛ рд╣реИред
рдЪрд░рдг 3: рдорд╣рддреНрд╡рдкреВрд░реНрдг рдорд╛рди (Critical Value) рд╕реЗ рддреБрд▓рдирд╛ рдХрд░реЗрдВ
рдпрджрд┐ df = (рдкрдВрдХреНрддрд┐ – 1) ├Ч (рд╕реНрддрдВрдн – 1) = 1 рдФрд░ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдорд╛рди 3.84 рд╣реИ, рдФрд░ ╧З┬▓ = 8.34 > 3.84, рддреЛ рд╢реВрдиреНрдп рдкрд░рд┐рдХрд▓реНрдкрдирд╛ рдХреЛ рдЕрд╕реНрд╡реАрдХрд╛рд░ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ, рдЬрд┐рд╕рд╕реЗ рдирд┐рд╖реНрдХрд░реНрд╖ рдирд┐рдХрд▓рддрд╛ рд╣реИ рдХрд┐ рд╡реНрдпрд╛рдпрд╛рдо рдХрд░рдиреЗ рдХреА рдЖрджрддреЗрдВ рдФрд░ рд╣реГрджрдп рд░реЛрдЧ рдХреЗ рдмреАрдЪ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╕рдВрдмрдВрдз рд╣реИред
5. рдкрд░рд┐рдгрд╛рдореЛрдВ рдХреА рд╡реНрдпрд╛рдЦреНрдпрд╛
- рдпрджрд┐ ╧З┬▓ рдХрд╛ рдорд╛рди рдорд╣рддреНрд╡рдкреВрд░реНрдг рдорд╛рди рд╕реЗ рдЕрдзрд┐рдХ рд╣реИ, рддреЛ рд╢реВрдиреНрдп рдкрд░рд┐рдХрд▓реНрдкрдирд╛ рдХреЛ рдЕрд╕реНрд╡реАрдХрд╛рд░ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ тЖТ рджреЛрдиреЛрдВ рдЪрд░ рд╕рдВрдмрдВрдзрд┐рдд рд╣реИрдВред
- рдпрджрд┐ ╧З┬▓ рдХрд╛ рдорд╛рди рдорд╣рддреНрд╡рдкреВрд░реНрдг рдорд╛рди рд╕реЗ рдХрдо рд╣реИ, рддреЛ рд╢реВрдиреНрдп рдкрд░рд┐рдХрд▓реНрдкрдирд╛ рдЕрд╕реНрд╡реАрдХрд╛рд░ рдирд╣реАрдВ рдХреА рдЬрд╛рддреА тЖТ рджреЛрдиреЛрдВ рдЪрд░ рд╕реНрд╡рддрдВрддреНрд░ рд╣реИрдВред
6. рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреЗ рдЕрдиреБрдкреНрд░рдпреЛрдЧ
- рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди: рддрдирд╛рд╡ рдФрд░ рдореБрдХрд╛рдмрд▓рд╛ рдХрд░рдиреЗ рдХреА рд░рдгрдиреАрддрд┐рдпреЛрдВ рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдз рдХреА рдЬрд╛рдВрдЪред
- рд╢рд┐рдХреНрд╖рд╛: рд╡рд┐рднрд┐рдиреНрди рд╢рд┐рдХреНрд╖рдг рд╡рд┐рдзрд┐рдпреЛрдВ рдХреА рддреБрд▓рдирд╛ред
- рд╡рд┐рдкрдгрди: рдЙрдкрднреЛрдХреНрддрд╛ рдкрд╕рдВрдж рдФрд░ рдмреНрд░рд╛рдВрдб рдЪрдпрди рдХрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдгред
- рдЪрд┐рдХрд┐рддреНрд╕рд╛ рдЕрдиреБрд╕рдВрдзрд╛рди: рдЬреАрд╡рдирд╢реИрд▓реА рдХрд╛рд░рдХреЛрдВ рдФрд░ рдмреАрдорд╛рд░рд┐рдпреЛрдВ рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдз рдХреА рдЬрд╛рдБрдЪред
7. рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреА рд╕реАрдорд╛рдПрдБ
- рдЫреЛрдЯреЗ рдирдореВрдирд╛ рдЖрдХрд╛рд░ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреБрдХреНрдд рдирд╣реАрдВред
- рдХрд╛рд░рдг-рдкреНрд░рднрд╛рд╡ (Cause-Effect) рд╕рдВрдмрдВрдз рдирд╣реАрдВ рджрд░реНрд╢рд╛ рд╕рдХрддрд╛ред
- рдХреЗрд╡рд▓ рд╢реНрд░реЗрдгреАрдмрджреНрдз рдбреЗрдЯрд╛ рдкрд░ рд▓рд╛рдЧреВ рд╣реЛрддрд╛ рд╣реИред
рдирд┐рд╖реНрдХрд░реНрд╖
рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдПрдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рддрдХрдиреАрдХ рд╣реИ рдЬреЛ рдпрд╣ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХрд░рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддрд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рджреЛ рд╢реНрд░реЗрдгреАрдмрджреНрдз рдЪрд░ рд╕реНрд╡рддрдВрддреНрд░ рд╣реИрдВ рдпрд╛ рд╕рдВрдмрдВрдзрд┐рддред рдЗрд╕рдХрд╛ рд╕рд╣реА рдЙрдкрдпреЛрдЧ рдЕрдиреБрд╕рдВрдзрд╛рди рдирд┐рд╖реНрдХрд░реНрд╖реЛрдВ рдХреЛ рдЕрдзрд┐рдХ рд╡рд┐рд╢реНрд╡рд╕рдиреАрдп рдмрдирд╛рддрд╛ рд╣реИред
UNIT-4(4.1) Chi square: Concept.
Chi-Square Test: Concept, Types, and Applications
Introduction
The Chi-Square test is a non-parametric statistical test used to determine if there is a significant association between categorical variables. It is widely used in fields such as psychology, biology, social sciences, and business to analyze frequency data and test hypotheses.
The Chi-Square test is particularly useful when dealing with nominal (categorical) data, where variables are classified into different groups without any inherent order.
This article will cover:
- Concept of the Chi-Square test
- Types of Chi-Square tests
- Chi-Square Test for Goodness of Fit
- Chi-Square Test for Independence
- Assumptions of the Chi-Square test
- Chi-Square Test Calculation (Step-by-Step)
- Interpretation of Results
- Applications of the Chi-Square Test
- Limitations of the Chi-Square Test
1. Concept of the Chi-Square Test
What is the Chi-Square Test?
The Chi-Square test (╧З┬▓ test) is used to determine whether there is a statistically significant difference between the expected and observed frequencies in one or more categories.
It helps answer questions such as:
- “Is there a relationship between gender and voting preference?”
- “Do customer preferences for different brands differ significantly?”
The Chi-Square test is based on comparing observed data with expected data under the assumption that there is no relationship between the variables (null hypothesis).
Formula for the Chi-Square Test
The formula for the Chi-Square statistic is:
╧З2=тИС(OтИТE)2E\chi^2 = \sum \frac{(O – E)^2}{E}
Where:
- ╧З2\chi^2 = Chi-Square statistic
- OO = Observed frequency (actual data)
- EE = Expected frequency (theoretical data based on null hypothesis)
The larger the Chi-Square value, the greater the difference between observed and expected values, indicating a possible relationship between the variables.
2. Types of Chi-Square Tests
A. Chi-Square Test for Goodness of Fit
This test is used to determine if a sample data set fits a specific distribution. It compares observed frequencies with expected frequencies based on a given theoretical model.
Example:
A researcher wants to test whether the distribution of customers across three different brands (A, B, and C) is equal.
Brand | Observed Frequency (O) | Expected Frequency (E) |
A | 40 | 50 |
B | 60 | 50 |
C | 50 | 50 |
The researcher uses the Chi-Square test for goodness of fit to see if the differences in observed frequencies are statistically significant.
B. Chi-Square Test for Independence
This test determines whether two categorical variables are independent or related.
Example:
A researcher wants to test whether gender (Male/Female) is related to voting preference (Party X / Party Y).
Gender | Party X | Party Y |
Male | 30 | 20 |
Female | 25 | 25 |
The Chi-Square test for independence helps determine if gender influences voting preference.
3. Assumptions of the Chi-Square Test
Before using the Chi-Square test, certain assumptions must be met:
- Data should be categorical (e.g., gender, occupation, preferences).
- Observations should be independent (each data point represents a separate subject).
- Expected frequency should be at least 5 for each category.
- Sample size should be sufficiently large to ensure accurate results.
4. Chi-Square Test Calculation (Step-by-Step)
Let’s go through an example of the Chi-Square Test for Independence.
Example Problem
A survey is conducted to see if there is a relationship between exercise habits (Regular/Irregular) and Heart Disease (Yes/No) among 200 people.
Exercise Habit | Heart Disease (Yes) | Heart Disease (No) | Total |
Regular | 30 | 70 | 100 |
Irregular | 50 | 50 | 100 |
Total | 80 | 120 | 200 |
Step 1: Calculate Expected Frequencies
The expected frequency for each cell is calculated as:
E=Row Total├ЧColumn TotalGrand TotalE = \frac{\text{Row Total} \times \text{Column Total}}{\text{Grand Total}}
For Regular & Yes:
E=100├Ч80200=40E = \frac{100 \times 80}{200} = 40
For Regular & No:
E=100├Ч120200=60E = \frac{100 \times 120}{200} = 60
For Irregular & Yes:
E=100├Ч80200=40E = \frac{100 \times 80}{200} = 40
For Irregular & No:
E=100├Ч120200=60E = \frac{100 \times 120}{200} = 60
Step 2: Apply the Chi-Square Formula
╧З2=тИС(OтИТE)2E\chi^2 = \sum \frac{(O – E)^2}{E} ╧З2=(30тИТ40)240+(70тИТ60)260+(50тИТ40)240+(50тИТ60)260\chi^2 = \frac{(30-40)^2}{40} + \frac{(70-60)^2}{60} + \frac{(50-40)^2}{40} + \frac{(50-60)^2}{60} =(тИТ10)240+(10)260+(10)240+(тИТ10)260= \frac{(-10)^2}{40} + \frac{(10)^2}{60} + \frac{(10)^2}{40} + \frac{(-10)^2}{60} =10040+10060+10040+10060= \frac{100}{40} + \frac{100}{60} + \frac{100}{40} + \frac{100}{60} =2.5+1.67+2.5+1.67=8.34= 2.5 + 1.67 + 2.5 + 1.67 = 8.34
Step 3: Compare with the Critical Value
For df = (rows – 1) ├Ч (columns – 1) = (2-1) ├Ч (2-1) = 1, the critical value from the Chi-Square table at ╬▒ = 0.05 is 3.84.
Since ╧З┬▓ = 8.34 > 3.84, we reject the null hypothesis, meaning there is a significant relationship between exercise habits and heart disease.
5. Interpretation of Results
- If ╧З┬▓ is greater than the critical value, reject the null hypothesis тЖТ There is a significant relationship.
- If ╧З┬▓ is less than the critical value, fail to reject the null hypothesis тЖТ No significant relationship.
6. Applications of the Chi-Square Test
- Psychology: Examining the relationship between stress levels and coping mechanisms.
- Education: Analyzing student preferences for different teaching methods.
- Marketing: Studying consumer preferences for brands based on demographic groups.
- Medical Research: Investigating the link between lifestyle factors and diseases.
7. Limitations of the Chi-Square Test
- Cannot be used for small sample sizes (expected frequency < 5).
- Does not indicate cause-and-effect relationships.
- Only works for categorical data, not numerical data.
Conclusion
The Chi-Square test is a powerful statistical tool used to analyze relationships between categorical variables. By comparing observed and expected frequencies, it helps researchers determine whether variables are independent or related. However, its proper use requires meeting its assumptions and interpreting results correctly.
UNIT-4(4.2) Computation of Chi-Square: Equal Distribution Hypothesis and Independent Hypothesis.
рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ (Chi-Square) рдХреА рдЧрдгрдирд╛: рд╕рдорд╛рди рд╡рд┐рддрд░рдг рдкрд░рд┐рдХрд▓реНрдкрдирд╛ рдФрд░ рд╕реНрд╡рддрдВрддреНрд░ рдкрд░рд┐рдХрд▓реНрдкрдирд╛
рдкрд░рд┐рдЪрдп
рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ (╧З┬▓) рдкрд░реАрдХреНрд╖рдг рдПрдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдЧреИрд░-рдкреИрд░рд╛рдореАрдЯреНрд░рд┐рдХ (Non-Parametric) рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рдкрд░реАрдХреНрд╖рдг рд╣реИ, рдЬрд┐рд╕рдХрд╛ рдЙрдкрдпреЛрдЧ рдпрд╣ рдЬрд╛рдВрдЪрдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рджреЛ рд╢реНрд░реЗрдгреАрдмрджреНрдз (Categorical) рдЪрд░ рдХреЗ рдмреАрдЪ рдХреЛрдИ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╕рдВрдмрдВрдз рд╣реИред рдпрд╣ рдореБрдЦреНрдп рд░реВрдк рд╕реЗ рдЖрд╡реГрддреНрддрд┐ рдбреЗрдЯрд╛ (Frequency Data) рдХрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХрд░рдиреЗ рдФрд░ рдкрд░рд┐рдХрд▓реНрдкрдирд╛рдУрдВ рдХреА рдЬрд╛рдВрдЪ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреЗ рджреЛ рдореБрдЦреНрдп рдкреНрд░рдХрд╛рд░ рд╣реИрдВ:
- рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рд╕рдорд░реВрдкрддрд╛ рдкрд░реАрдХреНрд╖рдг (Equal Distribution Hypothesis рдпрд╛ Goodness-of-Fit Test) тАУ рдпрд╣ рдЬрд╛рдВрдЪрддрд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рдкреНрд░реЗрдХреНрд╖рд┐рдд рд╡рд┐рддрд░рдг (Observed Distribution) рдЕрдкреЗрдХреНрд╖рд┐рдд рд╡рд┐рддрд░рдг (Expected Distribution) рд╕реЗ рдореЗрд▓ рдЦрд╛рддрд╛ рд╣реИред
- рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рд╕реНрд╡рддрдВрддреНрд░рддрд╛ рдкрд░реАрдХреНрд╖рдг (Independent Hypothesis рдпрд╛ Test of Independence) тАУ рдпрд╣ рдЬрд╛рдВрдЪрддрд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рджреЛ рд╢реНрд░реЗрдгреАрдмрджреНрдз рдЪрд░ рдПрдХ-рджреВрд╕рд░реЗ рд╕реЗ рд╕реНрд╡рддрдВрддреНрд░ рд╣реИрдВ рдпрд╛ рдЙрдирдХреЗ рдмреАрдЪ рдХреЛрдИ рд╕рдВрдмрдВрдз рд╣реИред
рдЗрд╕ рд▓реЗрдЦ рдореЗрдВ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рд╡рд┐рд╖рдпреЛрдВ рдХреЛ рд╡рд┐рд╕реНрддрд╛рд░ рд╕реЗ рд╕рдордЭрд╛рдпрд╛ рдЬрд╛рдПрдЧрд╛:
- рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХрд╛ рд╕реВрддреНрд░ рдФрд░ рдЕрд╡рдзрд╛рд░рдгрд╛
- рд╕рдорд╛рди рд╡рд┐рддрд░рдг рдкрд░рд┐рдХрд▓реНрдкрдирд╛ (Equal Distribution Hypothesis) рдХреЗ рд▓рд┐рдП рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдХреА рдЧрдгрдирд╛
- рд╕реНрд╡рддрдВрддреНрд░ рдкрд░рд┐рдХрд▓реНрдкрдирд╛ (Independent Hypothesis) рдХреЗ рд▓рд┐рдП рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдХреА рдЧрдгрдирд╛
- рдкрд░рд┐рдгрд╛рдореЛрдВ рдХреА рд╡реНрдпрд╛рдЦреНрдпрд╛
- рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреЗ рдЕрдиреБрдкреНрд░рдпреЛрдЧ
- рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреА рд╕реАрдорд╛рдПрдБ
1. рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХрд╛ рд╕реВрддреНрд░ рдФрд░ рдЕрд╡рдзрд╛рд░рдгрд╛
рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдХрд╛ рдЧрдгрд┐рддреАрдп рд╕реВрддреНрд░
рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рдорд╛рди рдХреА рдЧрдгрдирд╛ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рд╕реВрддреНрд░ рд╕реЗ рдХреА рдЬрд╛рддреА рд╣реИ:
╧З2=тИС(OтИТE)2E\chi^2 = \sum \frac{(O – E)^2}{E}
рдЬрд╣рд╛рдБ:
- ╧З2\chi^2 = рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рдорд╛рди
- OO = рдкреНрд░реЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐ (Observed Frequency)
- EE = рдЕрдкреЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐ (Expected Frequency)
рдпрджрд┐ ╧З┬▓ рдХрд╛ рдорд╛рди рдЕрдзрд┐рдХ рд╣реЛрддрд╛ рд╣реИ, рддреЛ рдЗрд╕рдХрд╛ рдЕрд░реНрде рдпрд╣ рд╣реЛрддрд╛ рд╣реИ рдХрд┐ рдкреНрд░реЗрдХреНрд╖рд┐рдд рдФрд░ рдЕрдкреЗрдХреНрд╖рд┐рдд рдбреЗрдЯрд╛ рдХреЗ рдмреАрдЪ рдмрдбрд╝рд╛ рдЕрдВрддрд░ рд╣реИ, рдЬреЛ рдпрд╣ рджрд░реНрд╢рд╛рддрд╛ рд╣реИ рдХрд┐ рджреЛ рдЪрд░ рдПрдХ-рджреВрд╕рд░реЗ рд╕реЗ рдЬреБрдбрд╝реЗ рд╣реЛ рд╕рдХрддреЗ рд╣реИрдВред
2. рд╕рдорд╛рди рд╡рд┐рддрд░рдг рдкрд░рд┐рдХрд▓реНрдкрдирд╛ (Equal Distribution Hypothesis) рдХреЗ рд▓рд┐рдП рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдХреА рдЧрдгрдирд╛
рдЕрд╡рдзрд╛рд░рдгрд╛
рдЗрд╕ рдкрд░реАрдХреНрд╖рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдпрд╣ рдЬрд╛рдВрдЪрдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рдХрд┐рд╕реА рдбреЗрдЯрд╛ рдХрд╛ рд╡рд┐рддрд░рдг рдХрд┐рд╕реА рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ (Theoretical) рдпрд╛ рдЕрдиреБрдорд╛рдирд┐рдд рд╡рд┐рддрд░рдг рд╕реЗ рдореЗрд▓ рдЦрд╛рддрд╛ рд╣реИред
рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рдпрджрд┐ рдпрд╣ рдорд╛рдирд╛ рдЬрд╛рдП рдХрд┐ рддреАрди рдЕрд▓рдЧ-рдЕрд▓рдЧ рдмреНрд░рд╛рдВрдбреЛрдВ (A, B, рдФрд░ C) рдХреА рд╕рдорд╛рди рдорд╛рдВрдЧ рд╣реИ, рддреЛ рдЗрдирдХрд╛ рдмрд┐рдХреНрд░реА рд╡рд┐рддрд░рдг рднреА рд╕рдорд╛рди рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдПред
рдЙрджрд╛рд╣рд░рдг рд╕рдорд╕реНрдпрд╛
рдПрдХ рд╢реЛрдзрдХрд░реНрддрд╛ рдпрд╣ рдкрд░реАрдХреНрд╖рдг рдХрд░рдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рдЧреНрд░рд╛рд╣рдХ рддреАрди рдмреНрд░рд╛рдВрдбреЛрдВ (A, B, рдФрд░ C) рдХреЛ рд╕рдорд╛рди рд░реВрдк рд╕реЗ рдкрд╕рдВрдж рдХрд░рддреЗ рд╣реИрдВред 150 рдЧреНрд░рд╛рд╣рдХреЛрдВ рдХреЗ рд╕рд░реНрд╡реЗрдХреНрд╖рдг рдХреЗ рдмрд╛рдж рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдбреЗрдЯрд╛ рдкреНрд░рд╛рдкреНрдд рд╣реБрдЖ:
рдмреНрд░рд╛рдВрдб | рдкреНрд░реЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐ (O) | рдЕрдкреЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐ (E) |
A | 55 | 50 |
B | 45 | 50 |
C | 50 | 50 |
рдЪрд░рдг 1: рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рд╕реВрддреНрд░ рд▓рд╛рдЧреВ рдХрд░реЗрдВ
╧З2=тИС(OтИТE)2E\chi^2 = \sum \frac{(O – E)^2}{E} =(55тИТ50)250+(45тИТ50)250+(50тИТ50)250= \frac{(55-50)^2}{50} + \frac{(45-50)^2}{50} + \frac{(50-50)^2}{50} =2550+2550+050= \frac{25}{50} + \frac{25}{50} + \frac{0}{50} =0.5+0.5+0= 0.5 + 0.5 + 0 =1.0= 1.0
рдЪрд░рдг 2: рдбрд┐рдЧреНрд░реА рдСрдл рдлреНрд░реАрдбрдо (df) рдирд┐рдХрд╛рд▓реЗрдВ
df=(kтИТ1)=(3тИТ1)=2df = (k – 1) = (3 – 1) = 2
рдЬрд╣рд╛рдБ k = рд╢реНрд░реЗрдгрд┐рдпреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ред
рдЪрд░рдг 3: рдорд╣рддреНрд╡рдкреВрд░реНрдг рдорд╛рди (Critical Value) рд╕реЗ рддреБрд▓рдирд╛ рдХрд░реЗрдВ
df = 2 рдФрд░ ╬▒ = 0.05 рдкрд░, рдорд╣рддреНрд╡рдкреВрд░реНрдг рдорд╛рди = 5.99ред
рдХреНрдпреЛрдВрдХрд┐ 1.0 < 5.99, рд╣рдо рд╢реВрдиреНрдп рдкрд░рд┐рдХрд▓реНрдкрдирд╛ рдХреЛ рдЕрд╕реНрд╡реАрдХрд╛рд░ рдирд╣реАрдВ рдХрд░рддреЗ, рдЬрд┐рд╕рдХрд╛ рдЕрд░реНрде рд╣реИ рдХрд┐ рдмреНрд░рд╛рдВрдб рдХреА рдкрд╕рдВрдж рдореЗрдВ рдХреЛрдИ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдЕрдВрддрд░ рдирд╣реАрдВ рд╣реИред
3. рд╕реНрд╡рддрдВрддреНрд░ рдкрд░рд┐рдХрд▓реНрдкрдирд╛ (Independent Hypothesis) рдХреЗ рд▓рд┐рдП рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдХреА рдЧрдгрдирд╛
рдЕрд╡рдзрд╛рд░рдгрд╛
рдЗрд╕ рдкрд░реАрдХреНрд╖рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдпрд╣ рдЬрд╛рдВрдЪрдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рджреЛ рд╢реНрд░реЗрдгреАрдмрджреНрдз рдЪрд░ рд╕реНрд╡рддрдВрддреНрд░ рд╣реИрдВ рдпрд╛ рд╕рдВрдмрдВрдзрд┐рдд рд╣реИрдВред
рдЙрджрд╛рд╣рд░рдг: рдХреНрдпрд╛ рд▓рд┐рдВрдЧ (рдкреБрд░реБрд╖/рдорд╣рд┐рд▓рд╛) рдФрд░ рдорддрджрд╛рди рд╡рд░реАрдпрддрд╛ (рдкрд╛рд░реНрдЯреА X/рдкрд╛рд░реНрдЯреА Y) рдХреЗ рдмреАрдЪ рдХреЛрдИ рд╕рдВрдмрдВрдз рд╣реИ?
рдЙрджрд╛рд╣рд░рдг рд╕рдорд╕реНрдпрд╛
200 рдорддрджрд╛рддрд╛рдУрдВ рдкрд░ рдПрдХ рд╕рд░реНрд╡реЗрдХреНрд╖рдг рдХрд┐рдпрд╛ рдЧрдпрд╛ рдФрд░ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдбреЗрдЯрд╛ рдкреНрд░рд╛рдкреНрдд рд╣реБрдЖ:
рд▓рд┐рдВрдЧ | рдкрд╛рд░реНрдЯреА X | рдкрд╛рд░реНрдЯреА Y | рдХреБрд▓ |
рдкреБрд░реБрд╖ | 40 | 60 | 100 |
рдорд╣рд┐рд▓рд╛ | 50 | 50 | 100 |
рдХреБрд▓ | 90 | 110 | 200 |
рдЪрд░рдг 1: рдЕрдкреЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐рдпрд╛рдБ (Expected Frequency) рдирд┐рдХрд╛рд▓реЗрдВ
E=Row Total├ЧColumn TotalGrand TotalE = \frac{\text{Row Total} \times \text{Column Total}}{\text{Grand Total}}
рдЙрджрд╛рд╣рд░рдг: рдкреБрд░реБрд╖ рдФрд░ рдкрд╛рд░реНрдЯреА X рдХреЗ рд▓рд┐рдП рдЕрдкреЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐
E=100├Ч90200=45E = \frac{100 \times 90}{200} = 45
рдЗрд╕реА рддрд░рд╣, рдЕрдиреНрдп рдЕрдкреЗрдХреНрд╖рд┐рдд рдЖрд╡реГрддреНрддрд┐рдпрд╛рдБ рдирд┐рдХрд╛рд▓реА рдЬрд╛рддреА рд╣реИрдВред
рд▓рд┐рдВрдЧ | рдкрд╛рд░реНрдЯреА X (O) | рдкрд╛рд░реНрдЯреА X (E) | рдкрд╛рд░реНрдЯреА Y (O) | рдкрд╛рд░реНрдЯреА Y (E) |
рдкреБрд░реБрд╖ | 40 | 45 | 60 | 55 |
рдорд╣рд┐рд▓рд╛ | 50 | 45 | 50 | 55 |
рдЪрд░рдг 2: рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рд╕реВрддреНрд░ рд▓рд╛рдЧреВ рдХрд░реЗрдВ
╧З2=тИС(OтИТE)2E\chi^2 = \sum \frac{(O – E)^2}{E}
рдЧрдгрдирд╛ рдХрд░рдиреЗ рдХреЗ рдмрд╛рдж,
╧З2=2.02\chi^2 = 2.02
рдЪрд░рдг 3: рдбрд┐рдЧреНрд░реА рдСрдл рдлреНрд░реАрдбрдо (df) рдирд┐рдХрд╛рд▓реЗрдВ
df=(rowsтИТ1)├Ч(columnsтИТ1)=1df = (rows – 1) \times (columns – 1) = 1
рдорд╣рддреНрд╡рдкреВрд░реНрдг рдорд╛рди (Critical Value) = 3.84 (╬▒ = 0.05, df = 1)ред
рдЪреВрдВрдХрд┐ 2.02 < 3.84, рд╣рдо рд╢реВрдиреНрдп рдкрд░рд┐рдХрд▓реНрдкрдирд╛ рдХреЛ рдЕрд╕реНрд╡реАрдХрд╛рд░ рдирд╣реАрдВ рдХрд░ рд╕рдХрддреЗ, рдпрд╛рдиреА рд▓рд┐рдВрдЧ рдФрд░ рдорддрджрд╛рди рд╡рд░реАрдпрддрд╛ рд╕реНрд╡рддрдВрддреНрд░ рд╣реИрдВред
4. рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рдХреЗ рдЕрдиреБрдкреНрд░рдпреЛрдЧ
- рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди: рд╡реНрдпрдХреНрддрд┐рддреНрд╡ рдкреНрд░рдХрд╛рд░ рдФрд░ рддрдирд╛рд╡ рдкреНрд░рддрд┐рдХреНрд░рд┐рдпрд╛ рдХрд╛ рд╕рдВрдмрдВрдзред
- рд╢рд┐рдХреНрд╖рд╛: рдЕрд▓рдЧ-рдЕрд▓рдЧ рд╢рд┐рдХреНрд╖рдг рд╡рд┐рдзрд┐рдпрд╛рдБ рдФрд░ рдЫрд╛рддреНрд░реЛрдВ рдХрд╛ рдкреНрд░рджрд░реНрд╢рдиред
- рд╕реНрд╡рд╛рд╕реНрдереНрдп: рдЬреАрд╡рдирд╢реИрд▓реА рдФрд░ рдмреАрдорд╛рд░рд┐рдпреЛрдВ рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдзред
5. рдирд┐рд╖реНрдХрд░реНрд╖
рдХрд╛рдЗ-рд╕реНрдХреНрд╡рд╛рдпрд░ рдкрд░реАрдХреНрд╖рдг рд╕рдорд╛рди рд╡рд┐рддрд░рдг рдФрд░ рд╕реНрд╡рддрдВрддреНрд░рддрд╛ рдХреА рдкрд░рд┐рдХрд▓реНрдкрдирд╛ рдХреА рдЬрд╛рдБрдЪ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рдЙрдкрдХрд░рдг рд╣реИред рд╕рд╣реА рдЧрдгрдирд╛ рдФрд░ рд╡реНрдпрд╛рдЦреНрдпрд╛ рдЕрдиреБрд╕рдВрдзрд╛рди рдирд┐рд╖реНрдХрд░реНрд╖реЛрдВ рдХреЛ рдЕрдзрд┐рдХ рд╡рд┐рд╢реНрд╡рд╕рдиреАрдп рдмрдирд╛рддреА рд╣реИред
UNIT-4(4.2) Computation of Chi-Square: Equal Distribution Hypothesis and Independent Hypothesis.
Computation of Chi-Square: Equal Distribution Hypothesis and Independent Hypothesis
Introduction
The Chi-Square (╧З┬▓) test is a widely used non-parametric statistical test that helps determine whether there is a significant association between two categorical variables. It is particularly useful for analyzing frequency data and testing hypotheses in various research fields, such as psychology, social sciences, medicine, and business.
There are two main types of Chi-Square tests:
- Chi-Square Goodness-of-Fit Test (Equal Distribution Hypothesis) тАУ Determines if an observed distribution matches an expected distribution.
- Chi-Square Test for Independence (Independent Hypothesis) тАУ Determines if two categorical variables are related or independent.
This article will cover:
- Concept and formula of the Chi-Square test
- Computation of the Chi-Square test for the Equal Distribution Hypothesis
- Computation of the Chi-Square test for the Independent Hypothesis
- Interpretation of results
- Applications of the Chi-Square test
- Limitations of the Chi-Square test
1. Concept and Formula of the Chi-Square Test
Chi-Square Formula
The Chi-Square statistic is calculated using the formula:
╧З2=тИС(OтИТE)2E\chi^2 = \sum \frac{(O – E)^2}{E}
Where:
- ╧З2\chi^2 = Chi-Square statistic
- OO = Observed frequency (actual count)
- EE = Expected frequency (theoretical count based on the hypothesis)
A large Chi-Square value suggests that the observed data does not fit the expected data, indicating a significant relationship or deviation from the expected distribution.
2. Computation of Chi-Square for Equal Distribution Hypothesis (Goodness-of-Fit Test)
Concept
The Goodness-of-Fit test is used when we want to check whether an observed categorical data distribution follows a theoretically expected distribution.
For example, if we assume that customers choose three brands (A, B, and C) equally, the expected frequency should be the same for each brand.
Example Problem
A researcher wants to test if customers prefer three brands (A, B, and C) equally. A sample of 150 customers was surveyed, and their responses were recorded.
Brand | Observed Frequency (O) | Expected Frequency (E) |
A | 55 | 50 |
B | 45 | 50 |
C | 50 | 50 |
Step 1: Calculate the Chi-Square Statistic
Using the Chi-Square formula:
╧З2=тИС(OтИТE)2E\chi^2 = \sum \frac{(O – E)^2}{E} =(55тИТ50)250+(45тИТ50)250+(50тИТ50)250= \frac{(55-50)^2}{50} + \frac{(45-50)^2}{50} + \frac{(50-50)^2}{50} =(5)250+(тИТ5)250+(0)250= \frac{(5)^2}{50} + \frac{(-5)^2}{50} + \frac{(0)^2}{50} =2550+2550+0= \frac{25}{50} + \frac{25}{50} + 0 =0.5+0.5+0= 0.5 + 0.5 + 0 =1.0= 1.0
Step 2: Determine the Degrees of Freedom (df)
df=(kтИТ1)=(3тИТ1)=2df = (k – 1) = (3 – 1) = 2
where k is the number of categories.
Step 3: Compare with the Chi-Square Critical Value
From the Chi-Square table, at df = 2 and ╬▒ = 0.05, the critical value is 5.99.
Since 1.0 < 5.99, we fail to reject the null hypothesis. This means that there is no significant difference in brand preference, and the assumption of equal distribution is valid.
3. Computation of Chi-Square for Independent Hypothesis (Test of Independence)
Concept
The Chi-Square Test for Independence is used when we want to check whether two categorical variables are related or independent.
For example, we might want to check whether gender (Male/Female) is associated with voting preference (Party X/Party Y).
Example Problem
A political analyst surveys 200 voters to see if gender affects voting preference.
Gender | Party X | Party Y | Total |
Male | 40 | 60 | 100 |
Female | 50 | 50 | 100 |
Total | 90 | 110 | 200 |
Step 1: Calculate Expected Frequencies (E)
The expected frequency for each cell is calculated as:
E=Row Total├ЧColumn TotalGrand TotalE = \frac{\text{Row Total} \times \text{Column Total}}{\text{Grand Total}}
For Male & Party X:
E=100├Ч90200=45E = \frac{100 \times 90}{200} = 45
For Male & Party Y:
E=100├Ч110200=55E = \frac{100 \times 110}{200} = 55
For Female & Party X:
E=100├Ч90200=45E = \frac{100 \times 90}{200} = 45
For Female & Party Y:
E=100├Ч110200=55E = \frac{100 \times 110}{200} = 55
Gender | Party X (O) | Party X (E) | Party Y (O) | Party Y (E) |
Male | 40 | 45 | 60 | 55 |
Female | 50 | 45 | 50 | 55 |
Step 2: Compute the Chi-Square Statistic
╧З2=тИС(OтИТE)2E\chi^2 = \sum \frac{(O – E)^2}{E} =(40тИТ45)245+(60тИТ55)255+(50тИТ45)245+(50тИТ55)255= \frac{(40-45)^2}{45} + \frac{(60-55)^2}{55} + \frac{(50-45)^2}{45} + \frac{(50-55)^2}{55} =(тИТ5)245+(5)255+(5)245+(тИТ5)255= \frac{(-5)^2}{45} + \frac{(5)^2}{55} + \frac{(5)^2}{45} + \frac{(-5)^2}{55} =2545+2555+2545+2555= \frac{25}{45} + \frac{25}{55} + \frac{25}{45} + \frac{25}{55} =0.56+0.45+0.56+0.45= 0.56 + 0.45 + 0.56 + 0.45 =2.02= 2.02
Step 3: Determine the Degrees of Freedom (df)
df=(rowsтИТ1)├Ч(columnsтИТ1)=(2тИТ1)├Ч(2тИТ1)=1df = (rows – 1) \times (columns – 1) = (2 – 1) \times (2 – 1) = 1
Step 4: Compare with the Chi-Square Critical Value
From the Chi-Square table, at df = 1 and ╬▒ = 0.05, the critical value is 3.84.
Since 2.02 < 3.84, we fail to reject the null hypothesis, meaning gender and voting preference are independent.
4. Interpretation of Results
- If ╧З┬▓ > critical value, reject the null hypothesis тЖТ There is a relationship between variables.
- If ╧З┬▓ < critical value, fail to reject the null hypothesis тЖТ Variables are independent.
5. Applications of the Chi-Square Test
- Psychology: Relationship between stress and coping mechanisms.
- Marketing: Brand preference across age groups.
- Education: Student performance based on teaching methods.
- Healthcare: Disease prevalence based on lifestyle factors.
Conclusion
The Chi-Square test is a crucial statistical tool for analyzing categorical data. The Goodness-of-Fit test checks if an observed distribution matches an expected one, while the Test for Independence determines whether two categorical variables are related.