
UG-PSYCHOLOGY, SEMESTER-3, MJC-3, UNIT-2
UNIT-2 (2.1) Basic concept of Descriptive and Inferential statistics.
рд╡рд░реНрдгрдирд╛рддреНрдордХ рдФрд░ рдЕрдиреБрдорд╛рдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдХреА рдореВрд▓ рдЕрд╡рдзрд╛рд░рдгрд╛рдПрдБ
рдкрд░рд┐рдЪрдп
рд╕рд╛рдВрдЦреНрдпрд┐рдХреА (Statistics) рдЧрдгрд┐рдд рдХреА рдПрдХ рд╢рд╛рдЦрд╛ рд╣реИ, рдЬреЛ рдбреЗрдЯрд╛ рдХреЗ рд╕рдВрдЧреНрд░рд╣рдг, рд╡рд┐рд╢реНрд▓реЗрд╖рдг, рд╡реНрдпрд╛рдЦреНрдпрд╛ рдФрд░ рдкреНрд░рд╕реНрддреБрддрд┐ рд╕реЗ рд╕рдВрдмрдВрдзрд┐рдд рд╣реИред рдпрд╣ рд╡реНрдпрд╡рд╕рд╛рдп, рд╕реНрд╡рд╛рд╕реНрдереНрдп, рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди, рд╕рд╛рдорд╛рдЬрд┐рдХ рд╡рд┐рдЬреНрдЮрд╛рди рдФрд░ рдЗрдВрдЬреАрдирд┐рдпрд░рд┐рдВрдЧ рд╕рд╣рд┐рдд рд╡рд┐рднрд┐рдиреНрди рдХреНрд╖реЗрддреНрд░реЛрдВ рдореЗрдВ рдорд╣рддреНрд╡рдкреВрд░реНрдг рднреВрдорд┐рдХрд╛ рдирд┐рднрд╛рддреА рд╣реИред рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдХреЛ рдореБрдЦреНрдп рд░реВрдк рд╕реЗ рджреЛ рднрд╛рдЧреЛрдВ рдореЗрдВ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ:
- рд╡рд░реНрдгрдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА (Descriptive Statistics) тАУ рдпрд╣ рдбреЗрдЯрд╛ рдХреЛ рд╕рд╛рд░рд╛рдВрд╢рд┐рдд рдФрд░ рд╡реНрдпрд╡рд╕реНрдерд┐рдд рдХрд░рдиреЗ рдХрд╛ рдХрд╛рд░реНрдп рдХрд░рддреА рд╣реИред
- рдЕрдиреБрдорд╛рдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА (Inferential Statistics) тАУ рдпрд╣ рдПрдХ рдЫреЛрдЯреЗ рдирдореВрдиреЗ (Sample) рд╕реЗ рдкреВрд░реЗ рдЬрдирд╕рдВрдЦреНрдпрд╛ (Population) рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдирд┐рд╖реНрдХрд░реНрд╖ рдирд┐рдХрд╛рд▓рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддреА рд╣реИред
рджреЛрдиреЛрдВ рдкреНрд░рдХрд╛рд░ рдХреЗ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдбреЗрдЯрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдореЗрдВ рдЕрд▓рдЧ-рдЕрд▓рдЧ рдХрд╛рд░реНрдп рдХрд░рддреЗ рд╣реИрдВ, рд▓реЗрдХрд┐рди рд╡реЗ рдЖрдкрд╕ рдореЗрдВ рдЬреБрдбрд╝реЗ рд╣реБрдП рд╣реИрдВред рдЗрд╕ рдирд┐рдмрдВрдз рдореЗрдВ рдЗрдирдХреА рдореВрд▓ рдЕрд╡рдзрд╛рд░рдгрд╛рдУрдВ, рдЕрдВрддрд░, рддрдХрдиреАрдХреЛрдВ рдФрд░ рдЕрдиреБрдкреНрд░рдпреЛрдЧреЛрдВ рдХрд╛ рд╡рд┐рд╕реНрддрд╛рд░ рд╕реЗ рдЕрдзреНрдпрдпрди рдХрд┐рдпрд╛ рдЬрд╛рдПрдЧрд╛ред
1. рд╡рд░реНрдгрдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА (Descriptive Statistics)
рдкрд░рд┐рднрд╛рд╖рд╛
рд╡рд░реНрдгрдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рд╡реЗ рд╡рд┐рдзрд┐рдпрд╛рдБ рд╣реЛрддреА рд╣реИрдВ, рдЬреЛ рдХрд┐рд╕реА рдбреЗрдЯрд╛ рдХреЛ рд╕рд╛рд░рд╛рдВрд╢рд┐рдд (Summarize) рдФрд░ рд╡реНрдпрд╡рд╕реНрдерд┐рдд (Organize) рдХрд░рдХреЗ рдЙрд╕реЗ рд╕рдордЭрдиреЗ рдпреЛрдЧреНрдп рдмрдирд╛рддреА рд╣реИрдВред рдпрд╣ рдбреЗрдЯрд╛ рдХрд╛ рдХреЗрд╡рд▓ рд╡рд░реНрдгрди рдХрд░рддреА рд╣реИ рдФрд░ рдЙрд╕рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рдХреЛрдИ рдирд┐рд╖реНрдХрд░реНрд╖ рдпрд╛ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рдирд╣реАрдВ рд▓рдЧрд╛рддреАред
рдореБрдЦреНрдп рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдБ
- рдмрдбрд╝реЗ рдбреЗрдЯрд╛ рд╕реЗрдЯ рдХреЛ рд╕рд╛рд░рд╛рдВрд╢рд┐рдд рдХрд░рддреА рд╣реИ рддрд╛рд▓рд┐рдХрд╛рдУрдВ, рдЧреНрд░рд╛рдлрд╝ рдФрд░ рд╕рдВрдЦреНрдпрд╛рддреНрдордХ рдорд╛рдкреЛрдВ рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗред
- рдХреЛрдИ рдирд┐рд╖реНрдХрд░реНрд╖ рдпрд╛ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рдирд╣реАрдВ рд▓рдЧрд╛рддреА, рдХреЗрд╡рд▓ рдбреЗрдЯрд╛ рдХрд╛ рд╡рд░реНрдгрди рдХрд░рддреА рд╣реИред
- рдкреИрдЯрд░реНрди рдФрд░ рд╕рдВрдмрдВрдз рдЦреЛрдЬрдиреЗ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреЛрдЧ рдХреА рдЬрд╛рддреА рд╣реИред
рд╡рд░реНрдгрдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдХреЗ рдкреНрд░рдХрд╛рд░
1.1 рдХреЗрдВрджреНрд░реАрдп рдкреНрд░рд╡реГрддреНрддрд┐ рдХреЗ рдорд╛рдк (Measures of Central Tendency)
рдпреЗ рдорд╛рдк рдбреЗрдЯрд╛ рдХреЗ рдХреЗрдВрджреНрд░ рдХреЛ рджрд░реНрд╢рд╛рддреЗ рд╣реИрдВ:
- рдорд╛рдзреНрдп (Mean): рд╕рднреА рдореВрд▓реНрдпреЛрдВ рдХрд╛ рдпреЛрдЧ, рдХреБрд▓ рдореВрд▓реНрдпреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рд╕реЗ рд╡рд┐рднрд╛рдЬрд┐рддред
- рдЙрджрд╛рд╣рд░рдг: рдХрд┐рд╕реА рдХрдХреНрд╖рд╛ рдХреЗ рдЫрд╛рддреНрд░реЛрдВ рдХреА рдФрд╕рдд рдКрдБрдЪрд╛рдИред
- рдорд╛рдзреНрдпрд┐рдХрд╛ (Median): рдбреЗрдЯрд╛ рдХреЛ рдмрдврд╝рддреЗ рдХреНрд░рдо рдореЗрдВ рд╡реНрдпрд╡рд╕реНрдерд┐рдд рдХрд░рдиреЗ рдХреЗ рдмрд╛рдж рдордзреНрдп рдореЗрдВ рд╕реНрдерд┐рдд рдорд╛рдиред
- рдЙрджрд╛рд╣рд░рдг: рдПрдХ рд╕рдореВрд╣ рдХреА рдФрд╕рдд рдЖрдпред
- рдмрд╣реБрд▓рдХ (Mode): рд╕рдмрд╕реЗ рдЕрдзрд┐рдХ рдмрд╛рд░ рдЖрдиреЗ рд╡рд╛рд▓рд╛ рдорд╛рдиред
- рдЙрджрд╛рд╣рд░рдг: рдПрдХ рдкрд░реАрдХреНрд╖рд╛ рдореЗрдВ рд╕рдмрд╕реЗ рдЬреНрдпрд╛рджрд╛ рд╕реНрдХреЛрд░ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдЕрдВрдХред
1.2 рдкреНрд░рд╕рд╛рд░ рдХреЗ рдорд╛рдк (Measures of Dispersion)
рдпреЗ рдорд╛рдк рдпрд╣ рджрд░реНрд╢рд╛рддреЗ рд╣реИрдВ рдХрд┐ рдбреЗрдЯрд╛ рдХрд┐рддрдирд╛ рдлреИрд▓рд╛ рд╣реБрдЖ рд╣реИред
- рдкрд░рд╛рд╕ (Range): рд╕рдмрд╕реЗ рдмрдбрд╝рд╛ рдорд╛рди тАУ рд╕рдмрд╕реЗ рдЫреЛрдЯрд╛ рдорд╛рдиред
- рдЙрджрд╛рд╣рд░рдг: рдпрджрд┐ рдкрд░реАрдХреНрд╖рд╛ рдореЗрдВ рдЙрдЪреНрдЪрддрдо рдЕрдВрдХ 95 рдФрд░ рдиреНрдпреВрдирддрдо 55 рд╣реИрдВ, рддреЛ рдкрд░рд╛рд╕ 40 рд╣реЛрдЧрд╛ред
- рд╡рд┐рдЪрд▓рди (Variance): рдорд╛рдзреНрдп рд╕реЗ рдбреЗрдЯрд╛ рдХреА рднрд┐рдиреНрдирддрд╛ рдХреЛ рджрд░реНрд╢рд╛рддрд╛ рд╣реИред
- рдорд╛рдирдХ рд╡рд┐рдЪрд▓рди (Standard Deviation): рд╡рд┐рдЪрд▓рди рдХрд╛ рд╡рд░реНрдЧрдореВрд▓, рдбреЗрдЯрд╛ рдХреА рдлреИрд▓рд╛рд╡рдЯ рдХреЛ рдорд╛рдкрдиреЗ рдХреЗ рд▓рд┐рдПред
- рдЙрджрд╛рд╣рд░рдг: рдпрджрд┐ рджреЛ рдХрдХреНрд╖рд╛рдУрдВ рдореЗрдВ рдФрд╕рдд рдЕрдВрдХ рд╕рдорд╛рди рд╣реИрдВ, рд▓реЗрдХрд┐рди рдПрдХ рдореЗрдВ рдорд╛рдирдХ рд╡рд┐рдЪрд▓рди рдЕрдзрд┐рдХ рд╣реИ, рддреЛ рдЙрд╕ рдХрдХреНрд╖рд╛ рдХреЗ рдЕрдВрдХреЛрдВ рдореЗрдВ рдЕрдзрд┐рдХ рд╡рд┐рд╡рд┐рдзрддрд╛ рд╣реЛрдЧреАред
1.3 рдбреЗрдЯрд╛ рдХрд╛ рдЧреНрд░рд╛рдлрд╝рд┐рдХрд▓ рдкреНрд░рддрд┐рдирд┐рдзрд┐рддреНрд╡
рдбреЗрдЯрд╛ рдХреЛ рдЧреНрд░рд╛рдлрд╝ рдХреЗ рд░реВрдк рдореЗрдВ рдкреНрд░рд╕реНрддреБрдд рдХрд░рдиреЗ рд╕реЗ рдЙрд╕реЗ рд╕рдордЭрдирд╛ рдЖрд╕рд╛рди рд╣реЛ рдЬрд╛рддрд╛ рд╣реИред
- рд╣рд┐рд╕реНрдЯреЛрдЧреНрд░рд╛рдо (Histogram): рдбреЗрдЯрд╛ рдХреА рдЖрд╡реГрддреНрддрд┐ (Frequency) рдХреЛ рджрд░реНрд╢рд╛рддрд╛ рд╣реИред
- рдмрд╛рд░ рдЧреНрд░рд╛рдлрд╝ (Bar Graph): рд╡рд┐рднрд┐рдиреНрди рд╢реНрд░реЗрдгрд┐рдпреЛрдВ рдХреА рддреБрд▓рдирд╛ рдХрд░рддрд╛ рд╣реИред
- рдкрд╛рдИ рдЪрд╛рд░реНрдЯ (Pie Chart): рд╡рд┐рднрд┐рдиреНрди рд╢реНрд░реЗрдгрд┐рдпреЛрдВ рдХрд╛ рдЕрдиреБрдкрд╛рдд рджрд░реНрд╢рд╛рддрд╛ рд╣реИред
- рдмреЙрдХреНрд╕ рдкреНрд▓реЙрдЯ (Box Plot): рдорд╛рдзреНрдп, рдХреНрд╡рд╛рд░реНрдЯрд╛рдЗрд▓ рдФрд░ рдмрд╛рд╣реНрдп рдореВрд▓реНрдпреЛрдВ (Outliers) рдХреЛ рджрд┐рдЦрд╛рддрд╛ рд╣реИред
рд╡рд░реНрдгрдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдХреЗ рдЕрдиреБрдкреНрд░рдпреЛрдЧ
- рд╢рд┐рдХреНрд╖рд╛: рдЫрд╛рддреНрд░реЛрдВ рдХреЗ рдкрд░реАрдХреНрд╖рд╛ рдкрд░рд┐рдгрд╛рдореЛрдВ рдХрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдгред
- рд╡реНрдпрд╡рд╕рд╛рдп: рдЧреНрд░рд╛рд╣рдХреЛрдВ рдХреА рдкреНрд░рд╛рдердорд┐рдХрддрд╛рдУрдВ рдХреЛ рд╕рдордЭрдирд╛ред
- рд╕реНрд╡рд╛рд╕реНрдереНрдп: рдорд░реАрдЬреЛрдВ рдХреЗ рд╕реНрд╡рд╛рд╕реНрдереНрдп рд░рд┐рдХреЙрд░реНрдб рдХрд╛ рд╕рд╛рд░рд╛рдВрд╢ рдмрдирд╛рдирд╛ред
- рдЦреЗрд▓: рдЦрд┐рд▓рд╛рдбрд╝рд┐рдпреЛрдВ рдХреА рдкреНрд░рджрд░реНрд╢рди рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдХреА рддреБрд▓рдирд╛ рдХрд░рдирд╛ред
рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рдПрдХ рдХрдВрдкрдиреА рдЕрд▓рдЧ-рдЕрд▓рдЧ рд╢рд╣рд░реЛрдВ рдореЗрдВ рдорд╛рд╕рд┐рдХ рдмрд┐рдХреНрд░реА рдХреЗ рдФрд╕рдд рдХреА рдЧрдгрдирд╛ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╡рд░реНрдгрдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд╕рдХрддреА рд╣реИред
2. рдЕрдиреБрдорд╛рдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА (Inferential Statistics)
рдкрд░рд┐рднрд╛рд╖рд╛
рдЕрдиреБрдорд╛рдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рд╡рд╣ рд╡рд┐рдзрд┐рдпрд╛рдБ рд╣реЛрддреА рд╣реИрдВ, рдЬреЛ рдПрдХ рдЫреЛрдЯреЗ рдирдореВрдиреЗ (Sample) рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рдкреВрд░реА рдЬрдирд╕рдВрдЦреНрдпрд╛ (Population) рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдирд┐рд╖реНрдХрд░реНрд╖ рдирд┐рдХрд╛рд▓рддреА рд╣реИрдВред
рдореБрдЦреНрдп рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдБ
- рдирдореВрдиреЗ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рдЬрдирд╕рдВрдЦреНрдпрд╛ рдХрд╛ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рдХрд░рддреА рд╣реИред
- рд╕рдВрднрд╛рд╡реНрдпрддрд╛ рд╕рд┐рджреНрдзрд╛рдВрдд (Probability Theory) рдкрд░ рдЖрдзрд╛рд░рд┐рдд рд╣реЛрддреА рд╣реИред
- рдкрд░рд┐рдХрд▓реНрдкрдирд╛ рдкрд░реАрдХреНрд╖рдг (Hypothesis Testing) рдФрд░ рд╡рд┐рд╢реНрд╡рд╛рд╕ рдЕрдВрддрд░рд╛рд▓ (Confidence Intervals) рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреА рд╣реИред
рдЕрдиреБрдорд╛рдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдХреЗ рдкреНрд░рдХрд╛рд░
2.1 рдирдореВрдХрд░рдг рдФрд░ рдЬрдирд╕рдВрдЦреНрдпрд╛ (Sampling and Population)
- рдЬрдирд╕рдВрдЦреНрдпрд╛ (Population): рд╕рдВрдкреВрд░реНрдг рд╕рдореВрд╣ рдЬрд┐рд╕рдХрд╛ рдЕрдзреНрдпрдпрди рдХрд┐рдпрд╛ рдЬрд╛ рд░рд╣рд╛ рд╣реИред
- рдирдореВрдирд╛ (Sample): рдЬрдирд╕рдВрдЦреНрдпрд╛ рдХрд╛ рдПрдХ рдЫреЛрдЯрд╛ рднрд╛рдЧ, рдЬрд┐рд╕ рдкрд░ рдЕрдзреНрдпрдпрди рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
- рдпрд╛рджреГрдЪреНрдЫрд┐рдХ рдирдореВрдХрд░рдг (Random Sampling): рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░рддрд╛ рд╣реИ рдХрд┐ рдкреНрд░рддреНрдпреЗрдХ рд╡реНрдпрдХреНрддрд┐ рдХреЛ рдЪреБрдиреЗ рдЬрд╛рдиреЗ рдХрд╛ рд╕рдорд╛рди рдЕрд╡рд╕рд░ рдорд┐рд▓реЗред
2.2 рдкрд░рд┐рдХрд▓реНрдкрдирд╛ рдкрд░реАрдХреНрд╖рдг (Hypothesis Testing)
рдпрд╣ рдкрд░реАрдХреНрд╖рдг рдпрд╣ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХрд░рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддрд╛ рд╣реИ рдХрд┐ рдХреЛрдИ рдзрд╛рд░рдгрд╛ рд╕рд╣реА рд╣реИ рдпрд╛ рдирд╣реАрдВред
- рд╢реВрдиреНрдп рдкрд░рд┐рдХрд▓реНрдкрдирд╛ (HтВА): рдХрд╣рддреА рд╣реИ рдХрд┐ рдХреЛрдИ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдЕрдВрддрд░ рдпрд╛ рдкреНрд░рднрд╛рд╡ рдирд╣реАрдВ рд╣реИред
- рд╡реИрдХрд▓реНрдкрд┐рдХ рдкрд░рд┐рдХрд▓реНрдкрдирд╛ (HтВБ): рдХрд╣рддреА рд╣реИ рдХрд┐ рдХреЛрдИ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдЕрдВрддрд░ рдпрд╛ рдкреНрд░рднрд╛рд╡ рд╣реИред
рдЙрджрд╛рд╣рд░рдг:
рдпрджрд┐ рдПрдХ рдХрдВрдкрдиреА рджрд╛рд╡рд╛ рдХрд░рддреА рд╣реИ рдХрд┐ рдЙрд╕рдХрд╛ рдирдпрд╛ рдЖрд╣рд╛рд░ рдкреВрд░рдХ 1 рдорд╣реАрдиреЗ рдореЗрдВ 5 рдХрд┐рд▓реЛ рд╡рдЬрди рдХрдо рдХрд░рддрд╛ рд╣реИ, рддреЛ рдЗрд╕ рджрд╛рд╡реЗ рдХреА рд╡реИрдзрддрд╛ рдкрд░рд┐рдХрд▓реНрдкрдирд╛ рдкрд░реАрдХреНрд╖рдг рджреНрд╡рд╛рд░рд╛ рд╕рддреНрдпрд╛рдкрд┐рдд рдХреА рдЬрд╛ рд╕рдХрддреА рд╣реИред
2.3 рд╡рд┐рд╢реНрд╡рд╛рд╕ рдЕрдВрддрд░рд╛рд▓ (Confidence Interval)
рдпрд╣ рдЕрдиреБрдорд╛рди рд▓рдЧрд╛рддрд╛ рд╣реИ рдХрд┐ рдХрд┐рд╕реА рдЖрдмрд╛рджреА рдХрд╛ рдорд╛рдкрд┐рдд рдореВрд▓реНрдп рдХрд┐рд╕реА рд╕реАрдорд╛ рдХреЗ рднреАрддрд░ рдХрд┐рддрдирд╛ рд╕рдЯреАрдХ рд╣реИред
рдЙрджрд╛рд╣рд░рдг:
рдпрджрд┐ рдПрдХ рд╕рд░реНрд╡реЗрдХреНрд╖рдг рд╕реЗ рдкрддрд╛ рдЪрд▓рддрд╛ рд╣реИ рдХрд┐ 60% рд▓реЛрдЧ рдХрд┐рд╕реА рдиреЗрддрд╛ рдХрд╛ рд╕рдорд░реНрдерди рдХрд░рддреЗ рд╣реИрдВ рдФрд░ рд╡рд┐рд╢реНрд╡рд╛рд╕ рдЕрдВрддрд░рд╛рд▓ ┬▒3% рд╣реИ, рддреЛ рд╕рд╣реА рд╕рдорд░реНрдерди рд╕реНрддрд░ 57% рд╕реЗ 63% рдХреЗ рдмреАрдЪ рд╣реЛрдЧрд╛ред
2.4 рд╕рд╣рд╕рдВрдмрдВрдз рдФрд░ рдкреНрд░рддрд┐рдЧрдорди (Correlation and Regression)
- рд╕рд╣рд╕рдВрдмрдВрдз (Correlation): рджреЛ рдЪрд░реЛрдВ рдХреЗ рдмреАрдЪ рд╕рдВрдмрдВрдз рдХреЛ рдорд╛рдкрддрд╛ рд╣реИред
- рдкреНрд░рддрд┐рдЧрдорди (Regression): рдПрдХ рдЪрд░ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рджреВрд╕рд░реЗ рдХрд╛ рдЕрдиреБрдорд╛рди рд▓рдЧрд╛рддрд╛ рд╣реИред
рдЙрджрд╛рд╣рд░рдг:
рдПрдХ рдЕрдзреНрдпрдпрди рдореЗрдВ рдкрд╛рдпрд╛ рдЧрдпрд╛ рдХрд┐ рдЕрдзреНрдпрдпрди рдХреЗ рдШрдВрдЯреЗ рдФрд░ рдкрд░реАрдХреНрд╖рд╛ рд╕реНрдХреЛрд░ рдХреЗ рдмреАрдЪ рд╕рдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдз (r = 0.85) рд╣реИ, рдпрд╛рдиреА рдЕрдзрд┐рдХ рдЕрдзреНрдпрдпрди рдХрд░рдиреЗ рд╡рд╛рд▓реЗ рдЫрд╛рддреНрд░реЛрдВ рдХреЗ рдЕрдВрдХ рдЕрдзрд┐рдХ рд╣реЛрддреЗ рд╣реИрдВред
2.5 t-рдкрд░реАрдХреНрд╖рдг рдФрд░ ANOVA (Analysis of Variance)
- t-рдкрд░реАрдХреНрд╖рдг (t-Test): рджреЛ рд╕рдореВрд╣реЛрдВ рдХреА рдФрд╕рдд рддреБрд▓рдирд╛ рдХрд░рддрд╛ рд╣реИред
- ANOVA: рддреАрди рдпрд╛ рдЕрдзрд┐рдХ рд╕рдореВрд╣реЛрдВ рдХреА рдФрд╕рдд рддреБрд▓рдирд╛ рдХрд░рддрд╛ рд╣реИред
рдЙрджрд╛рд╣рд░рдг:
t-рдкрд░реАрдХреНрд╖рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдпрд╣ рдЬрд╛рдВрдЪрдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИ рдХрд┐ рдкреБрд░реБрд╖ рдФрд░ рдорд╣рд┐рд▓рд╛ рдХрд░реНрдордЪрд╛рд░рд┐рдпреЛрдВ рдХреЗ рд╡реЗрддрди рдореЗрдВ рдХреЛрдИ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдЕрдВрддрд░ рд╣реИ рдпрд╛ рдирд╣реАрдВред
рдЕрдиреБрдкреНрд░рдпреЛрдЧ
- рдЪрд┐рдХрд┐рддреНрд╕рд╛: рдХрд┐рд╕реА рдирдИ рджрд╡рд╛ рдХреА рдкреНрд░рднрд╛рд╡рд╢реАрд▓рддрд╛ рдЬрд╛рдВрдЪрдирд╛ред
- рдЕрд░реНрдерд╢рд╛рд╕реНрддреНрд░: рднрд╡рд┐рд╖реНрдп рдореЗрдВ рдореБрджреНрд░рд╛рд╕реНрдлреАрддрд┐ рджрд░ рдХреА рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгреА рдХрд░рдирд╛ред
- рд╡рд┐рдкрдгрди: рдЙрдкрднреЛрдХреНрддрд╛ рд╡реНрдпрд╡рд╣рд╛рд░ рдХрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХрд░рдирд╛ред
- рд░рд╛рдЬрдиреАрддрд┐: рдЪреБрдирд╛рд╡ рдкрд░рд┐рдгрд╛рдореЛрдВ рдХрд╛ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рд▓рдЧрд╛рдирд╛ред
3. рд╡рд░реНрдгрдирд╛рддреНрдордХ рдФрд░ рдЕрдиреБрдорд╛рдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдореЗрдВ рдЕрдВрддрд░
рд╡рд┐рд╢реЗрд╖рддрд╛ | рд╡рд░реНрдгрдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА | рдЕрдиреБрдорд╛рдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА |
рдЙрджреНрджреЗрд╢реНрдп | рдбреЗрдЯрд╛ рдХрд╛ рд╕рд╛рд░рд╛рдВрд╢ рджреЗрдирд╛ | рдирд┐рд╖реНрдХрд░реНрд╖ рдирд┐рдХрд╛рд▓рдирд╛ |
рдбреЗрдЯрд╛ рдЙрдкрдпреЛрдЧ | рдкреВрд░реЗ рдбреЗрдЯрд╛ рдХрд╛ рдЙрдкрдпреЛрдЧ | рдирдореВрдиреЗ рдкрд░ рдЖрдзрд╛рд░рд┐рдд |
рддрдХрдиреАрдХреЗрдВ | рдорд╛рдзреНрдп, рдорд╛рдзреНрдпрд┐рдХрд╛, рдмрд╣реБрд▓рдХ | рдкрд░рд┐рдХрд▓реНрдкрдирд╛ рдкрд░реАрдХреНрд╖рдг, рдкреНрд░рддрд┐рдЧрдорди |
рдирд┐рд╖реНрдХрд░реНрд╖
рд╡рд░реНрдгрдирд╛рддреНрдордХ рдФрд░ рдЕрдиреБрдорд╛рдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдбреЗрдЯрд╛ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХреЗ рджреЛ рдЖрд╡рд╢реНрдпрдХ рднрд╛рдЧ рд╣реИрдВред рд╡рд░реНрдгрдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдбреЗрдЯрд╛ рдХреЛ рд╕рд╛рд░рд╛рдВрд╢рд┐рдд рдХрд░рддреА рд╣реИ, рдЬрдмрдХрд┐ рдЕрдиреБрдорд╛рдирд╛рддреНрдордХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рдФрд░ рдирд┐рд╖реНрдХрд░реНрд╖ рдирд┐рдХрд╛рд▓рдиреЗ
рдореЗрдВ рдорджрдж рдХрд░рддреА рд╣реИред рджреЛрдиреЛрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рд╡рд┐рдЬреНрдЮрд╛рди, рд╡реНрдпрд╛рдкрд╛рд░, рдЪрд┐рдХрд┐рддреНрд╕рд╛ рдФрд░ рдЕрдиреНрдп рдХреНрд╖реЗрддреНрд░реЛрдВ рдореЗрдВ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ, рдЬрд┐рд╕рд╕реЗ рдбреЗрдЯрд╛-рд╕рдВрдЪрд╛рд▓рд┐рдд рдирд┐рд░реНрдгрдп рд▓реЗрдиреЗ рдореЗрдВ рд╕рд╣рд╛рдпрддрд╛ рдорд┐рд▓рддреА рд╣реИред
UNIT-2 (2.1) Basic concept of Descriptive and Inferential statistics.
Introduction
Statistics is a branch of mathematics that deals with collecting, analyzing, interpreting, and presenting data. It plays a crucial role in various fields, including business, healthcare, psychology, social sciences, and engineering. Broadly, statistics is divided into two major types:
- Descriptive Statistics тАУ It deals with summarizing and organizing data.
- Inferential Statistics тАУ It involves making predictions and generalizations from a sample to a population.
Both types serve different purposes but are interconnected in data analysis. This essay explores their fundamental concepts, differences, techniques, and applications.
1. Descriptive Statistics
Definition
Descriptive statistics refers to the methods used to summarize and organize data in a meaningful way. It provides simple summaries and graphical representations of data but does not allow for generalizations beyond the specific dataset.
Key Features
- Summarizes large data sets using tables, graphs, and numerical measures.
- No conclusions or predictions about the population, only describes the data.
- Used in raw data analysis to find patterns and relationships.
Types of Descriptive Statistics
Descriptive statistics can be divided into three main categories:
1.1 Measures of Central Tendency
These measures represent the center or typical value of a dataset.
- Mean (Arithmetic Average): Sum of all values divided by the total number of observations.
- Example: The average height of students in a class.
- Median: The middle value when data is arranged in ascending order.
- Example: The median income of a group of people.
- Mode: The most frequently occurring value in a dataset.
- Example: The most common exam score in a classroom.
1.2 Measures of Dispersion (Variability)
These measures show how much the data varies or spreads out.
- Range: The difference between the highest and lowest value.
- Example: If the highest test score is 95 and the lowest is 55, the range is 40.
- Variance: The average squared difference from the mean, showing how spread out the data is.
- Standard Deviation: The square root of variance, used to measure data dispersion.
- Example: If two groups have the same average score but different standard deviations, the group with a higher standard deviation has more variation.
1.3 Graphical Representation of Data
Visual representation makes data easier to understand.
- Histograms: Used for frequency distribution.
- Bar Graphs: Used for categorical data comparisons.
- Pie Charts: Show proportions of categories.
- Box Plots: Show median, quartiles, and outliers.
Applications of Descriptive Statistics
- Education: Analyzing student performance.
- Business: Understanding customer preferences.
- Healthcare: Summarizing patient health records.
- Sports: Comparing player statistics.
For example, a company may use descriptive statistics to determine the average monthly sales in different regions.
2. Inferential Statistics
Definition
Inferential statistics involves making predictions or inferences about a population based on a sample. It helps researchers determine the probability that their conclusions apply to a larger group.
Key Features
- Uses sample data to make predictions about a population.
- Involves probability theory to determine the reliability of results.
- Can be used for hypothesis testing and confidence intervals.
Types of Inferential Statistics
Inferential statistics primarily includes hypothesis testing and estimation techniques to draw conclusions.
2.1 Sampling and Population
- Population: The entire group being studied.
- Sample: A smaller subset of the population used for analysis.
- Random Sampling: A method to ensure every individual has an equal chance of selection.
For example, to estimate the average height of all university students, a researcher might measure a sample of 500 students.
2.2 Hypothesis Testing
Hypothesis testing determines whether an assumption (hypothesis) about a population is true.
- Null Hypothesis (HтВА): States there is no significant difference or effect.
- Alternative Hypothesis (HтВБ): Suggests a significant difference or effect exists.
Example:
A company claims that their new diet pill helps people lose 5 kg in a month. A study with 100 participants is conducted to test whether this claim is statistically significant.
2.3 Confidence Intervals
A confidence interval estimates the range in which a population parameter (e.g., mean) is likely to fall.
Example:
A survey finds that 60% of voters support a candidate, with a 95% confidence interval of ┬▒3%. This means the true support level is likely between 57% and 63%.
2.4 Correlation and Regression Analysis
- Correlation: Measures the relationship between two variables (e.g., height and weight).
- Regression: Predicts the value of one variable based on another.
Example:
A study finds a positive correlation (r = 0.85) between hours studied and exam scores, meaning students who study more tend to score higher.
2.5 t-Test and ANOVA (Analysis of Variance)
- t-Test: Compares the means of two groups.
- ANOVA: Compares the means of three or more groups.
Example:
A t-test could compare the average salary of male and female employees to determine if there is a significant difference.
Applications of Inferential Statistics
- Medicine: Determining if a new drug is effective.
- Economics: Predicting future inflation rates.
- Marketing: Analyzing customer behavior trends.
- Political Science: Predicting election results.
For instance, political analysts use inferential statistics to predict election outcomes based on pre-election surveys.
3. Differences Between Descriptive and Inferential Statistics
Feature | Descriptive Statistics | Inferential Statistics |
Purpose | Summarizes and describes data | Makes predictions and generalizations |
Data Usage | Uses the entire dataset | Uses a sample to infer about a population |
Techniques | Measures of central tendency, dispersion, graphs | Hypothesis testing, confidence intervals, regression |
Example | Average test score of students in one school | Predicting national student performance based on a sample |
For example, calculating the average salary of employees in a company is descriptive statistics, but using a sample to predict the national average salary is inferential statistics.
4. Importance of Descriptive and Inferential Statistics
Both descriptive and inferential statistics are essential for decision-making and research:
- In Science and Research: Helps in analyzing experiments and drawing conclusions.
- In Business and Marketing: Assists in understanding market trends and customer behavior.
- In Healthcare: Used for clinical trials and medical research.
- In Education: Helps evaluate student performance and teaching methods.
- In Government and Policy Making: Guides policy decisions and economic planning.
For example, the COVID-19 pandemic saw extensive use of descriptive statistics (tracking daily cases) and inferential statistics (predicting future infection rates).
Conclusion
Descriptive and inferential statistics are two fundamental branches of statistical analysis. Descriptive statistics helps summarize data, while inferential statistics allows us to make predictions and draw conclusions. Both are widely used in various fields, from research and medicine to business and social sciences. Understanding these concepts enables researchers and professionals to make informed, data-driven decisions.
By applying the right statistical methods, we can gain valuable insights from data, ultimately leading to better planning, innovation, and problem-solving in diverse fields.
UNIT-2 (2.2) Frequency distribution of data and Graphic presentation: Histogram, Polygon and Ogive.
рдбреЗрдЯрд╛ рдХрд╛ рдЖрд╡реГрддреНрддрд┐ рд╡рд┐рддрд░рдг рдФрд░ рдЙрд╕рдХрд╛ рдЧреНрд░рд╛рдлрд╝рд┐рдХ рдкреНрд░рд╕реНрддреБрддреАрдХрд░рдг: рд╣рд┐рд╕реНрдЯреЛрдЧреНрд░рд╛рдо, рдкреЙрд▓реАрдЧреЙрди рдФрд░ рдУрдЧрд┐рд╡
рдкрд░рд┐рдЪрдп
рд╕рд╛рдВрдЦреНрдпрд┐рдХреА рдореЗрдВ, рдбреЗрдЯрд╛ рдХреЛ рдЕрдХреНрд╕рд░ рдмрдбрд╝реА рдорд╛рддреНрд░рд╛ рдореЗрдВ рдПрдХрддреНрд░ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ, рдЬрд┐рд╕рд╕реЗ рдЗрд╕реЗ рд╕реАрдзреЗ рд╕рдордЭрдирд╛ рдФрд░ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХрд░рдирд╛ рдореБрд╢реНрдХрд┐рд▓ рд╣реЛ рд╕рдХрддрд╛ рд╣реИред рдЗрд╕рд▓рд┐рдП, рдбреЗрдЯрд╛ рдХреЛ рдЖрд╡реГрддреНрддрд┐ рд╡рд┐рддрд░рдг (Frequency Distribution) рдореЗрдВ рд╡реНрдпрд╡рд╕реНрдерд┐рдд рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдФрд░ рдЙрд╕реЗ рд╡рд┐рднрд┐рдиреНрди рдЧреНрд░рд╛рдлрд╝рд┐рдХ рд╡рд┐рдзрд┐рдпреЛрдВ (Graphical Methods) рдЬреИрд╕реЗ рд╣рд┐рд╕реНрдЯреЛрдЧреНрд░рд╛рдо (Histogram), рдЖрд╡реГрддреНрддрд┐ рдмрд╣реБрднреБрдЬ (Frequency Polygon), рдФрд░ рдУрдЧрд┐рд╡ (Ogive) рджреНрд╡рд╛рд░рд╛ рдкреНрд░рджрд░реНрд╢рд┐рдд рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
рдпреЗ рдЧреНрд░рд╛рдлрд╝ рдбреЗрдЯрд╛ рдХреА рдкреНрд░рд╡реГрддреНрддрд┐, рд╡рд┐рддрд░рдг рдФрд░ рдкреИрдЯрд░реНрди рдХреЛ рдЖрд╕рд╛рдиреА рд╕реЗ рд╕рдордЭрдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддреЗ рд╣реИрдВред рдЗрд╕ рдирд┐рдмрдВрдз рдореЗрдВ рд╣рдо рдЖрд╡реГрддреНрддрд┐ рд╡рд┐рддрд░рдг рдХреА рдЕрд╡рдзрд╛рд░рдгрд╛, рдЗрд╕рдХреЗ рдкреНрд░рдХрд╛рд░, рдирд┐рд░реНрдорд╛рдг рдХреА рд╡рд┐рдзрд┐рдпрд╛рдБ, рдФрд░ рдЗрд╕рдХреЗ рдЧреНрд░рд╛рдлрд╝рд┐рдХ рдкреНрд░рддрд┐рдирд┐рдзрд┐рддреНрд╡ рдХреЛ рд╡рд┐рд╕реНрддрд╛рд░ рд╕реЗ рд╕рдордЭреЗрдВрдЧреЗред
1. рдбреЗрдЯрд╛ рдХрд╛ рдЖрд╡реГрддреНрддрд┐ рд╡рд┐рддрд░рдг (Frequency Distribution of Data)
рдкрд░рд┐рднрд╛рд╖рд╛
рдЖрд╡реГрддреНрддрд┐ рд╡рд┐рддрд░рдг рдПрдХ рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рддрдХрдиреАрдХ рд╣реИ, рдЬрд┐рд╕рдореЗрдВ рдбреЗрдЯрд╛ рдХреЛ рдЕрд▓рдЧ-рдЕрд▓рдЧ рд╡рд░реНрдЧреЛрдВ (Classes) рдпрд╛ рд╕рдореВрд╣реЛрдВ (Groups) рдореЗрдВ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдФрд░ рд╣рд░ рд╡рд░реНрдЧ рдореЗрдВ рдЖрдиреЗ рд╡рд╛рд▓реЗ рдорд╛рдиреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ (Frequency) рдХреЛ рджрд░реНрдЬ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред рдпрд╣ рдмрдбрд╝реА рдорд╛рддреНрд░рд╛ рдореЗрдВ рдбреЗрдЯрд╛ рдХреЛ рд╕рдВрдХреНрд╖реЗрдк рдореЗрдВ рдкреНрд░рд╕реНрддреБрдд рдХрд░рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддрд╛ рд╣реИред
рдореБрдЦреНрдп рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдБ
- рдХрдЪреНрдЪреЗ (Raw) рдбреЗрдЯрд╛ рдХреЛ рдПрдХ рд╡реНрдпрд╡рд╕реНрдерд┐рдд рддрд╛рд▓рд┐рдХрд╛ рдореЗрдВ рдмрджрд▓рддрд╛ рд╣реИред
- рдпрд╣ рджрд┐рдЦрд╛рддрд╛ рд╣реИ рдХрд┐ рдбреЗрдЯрд╛ рдХреЗ рд╡рд┐рднрд┐рдиреНрди рдорд╛рди рдХрд┐рддрдиреА рдмрд╛рд░ рджреЛрд╣рд░рд╛рдП рдЧрдП рд╣реИрдВред
- рдбреЗрдЯрд╛ рдкреИрдЯрд░реНрди рдФрд░ рд░реБрдЭрд╛рдиреЛрдВ рдХреЛ рд╕рдордЭрдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддрд╛ рд╣реИред
- рд╡рд┐рднрд┐рдиреНрди рдЧреНрд░рд╛рдлрд╝рд┐рдХ рд╡рд┐рдзрд┐рдпреЛрдВ рджреНрд╡рд╛рд░рд╛ рдЗрд╕реЗ рдкреНрд░рджрд░реНрд╢рд┐рдд рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИред
рдЖрд╡реГрддреНрддрд┐ рд╡рд┐рддрд░рдг рдХреЗ рдкреНрд░рдХрд╛рд░
1.1 рдЕрд╕рдореВрд╣реАрдХреГрдд рдЖрд╡реГрддреНрддрд┐ рд╡рд┐рддрд░рдг (Ungrouped Frequency Distribution)
рдЬрдм рдбреЗрдЯрд╛ рдХреЗ рдорд╛рди рдХрдо рд╣реЛрддреЗ рд╣реИрдВ, рддреЛ рдЙрдиреНрд╣реЗрдВ рд╡реНрдпрдХреНрддрд┐рдЧрдд рд░реВрдк рд╕реЗ рд╕реВрдЪреАрдмрджреНрдз рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
рдЙрджрд╛рд╣рд░рдг:
10 рдЫрд╛рддреНрд░реЛрдВ рдХреЗ рдкрд░реАрдХреНрд╖рд╛ рдЕрдВрдХреЛрдВ рдХрд╛ рдбреЗрдЯрд╛:
{85, 90, 78, 85, 88, 92, 78, 85, 90, 88}
рдЗрд╕рдХрд╛ рдЖрд╡реГрддреНрддрд┐ рд╡рд┐рддрд░рдг рддрд╛рд▓рд┐рдХрд╛:
рдЕрдВрдХ (x) | рдЖрд╡реГрддреНрддрд┐ (f) |
78 | 2 |
85 | 3 |
88 | 2 |
90 | 2 |
92 | 1 |
1.2 рд╕рдореВрд╣реАрдХреГрдд рдЖрд╡реГрддреНрддрд┐ рд╡рд┐рддрд░рдг (Grouped Frequency Distribution)
рдЬрдм рдбреЗрдЯрд╛ рдмрдбрд╝рд╛ рд╣реЛрддрд╛ рд╣реИ, рддреЛ рдЗрд╕реЗ рдХреБрдЫ рд╡рд░реНрдЧреЛрдВ (Class Intervals) рдореЗрдВ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
рдЙрджрд╛рд╣рд░рдг:
рдЕрдЧрд░ рдХрд┐рд╕реА рдХрдХреНрд╖рд╛ рдореЗрдВ рдЫрд╛рддреНрд░реЛрдВ рдХреЗ рдЕрдВрдХ 40 рд╕реЗ 100 рдХреЗ рдмреАрдЪ рд╣реИрдВ, рддреЛ рдЙрдиреНрд╣реЗрдВ 10 рдХреЗ рдЕрдВрддрд░рд╛рд▓ (Class Width) рдореЗрдВ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИред
рд╡рд░реНрдЧ рдЕрдВрддрд░рд╛рд▓ (Class Interval) | рдЖрд╡реГрддреНрддрд┐ (f) |
40 – 49 | 3 |
50 – 59 | 5 |
60 – 69 | 8 |
70 – 79 | 10 |
80 – 89 | 7 |
90 – 99 | 4 |
рдЖрд╡реГрддреНрддрд┐ рд╡рд┐рддрд░рдг рддрд╛рд▓рд┐рдХрд╛ рдмрдирд╛рдиреЗ рдХреА рдкреНрд░рдХреНрд░рд┐рдпрд╛
- рдбреЗрдЯрд╛ рдПрдХрддреНрд░ рдХрд░рдирд╛ тАУ рдЕрдзреНрдпрдпрди рдХреЗ рд▓рд┐рдП рдЖрд╡рд╢реНрдпрдХ рдбреЗрдЯрд╛ рдкреНрд░рд╛рдкреНрдд рдХрд░реЗрдВред
- рд╕реАрдорд╛ (Range) рдЬреНрдЮрд╛рдд рдХрд░реЗрдВ тАУ рдЕрдзрд┐рдХрддрдо рдФрд░ рдиреНрдпреВрдирддрдо рдорд╛рдиреЛрдВ рдХреЗ рдмреАрдЪ рдХрд╛ рдЕрдВрддрд░ рдирд┐рдХрд╛рд▓реЗрдВред
- рд╡рд░реНрдЧреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рддрдп рдХрд░реЗрдВ тАУ рдЖрдорддреМрд░ рдкрд░ 5 рд╕реЗ 10 рд╡рд░реНрдЧреЛрдВ рдХрд╛ рдЪрдпрди рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
- рд╡рд░реНрдЧ рдЪреМрдбрд╝рд╛рдИ рддрдп рдХрд░реЗрдВ тАУ рд╕реАрдорд╛ рдХреЛ рд╡рд░реНрдЧреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рд╕реЗ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд░реЗрдВред
- рд╡рд░реНрдЧ рдЕрдВрддрд░рд╛рд▓ рдмрдирд╛рдПрдБ тАУ рдкреНрд░рддреНрдпреЗрдХ рд╡рд░реНрдЧ рдХреЛ рдПрдХ рдирд┐рд╢реНрдЪрд┐рдд рд╢реНрд░реЗрдгреА рдореЗрдВ рд░рдЦреЗрдВред
- рдкреНрд░рддреНрдпреЗрдХ рд╡рд░реНрдЧ рдХреА рдЖрд╡реГрддреНрддрд┐ рдЧрд┐рдиреЗрдВ тАУ рдпрд╣ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХрд░реЗрдВ рдХрд┐ рдкреНрд░рддреНрдпреЗрдХ рд╡рд░реНрдЧ рдореЗрдВ рдХрд┐рддрдиреЗ рдбреЗрдЯрд╛ рдЕрдВрдХ рдЖрддреЗ рд╣реИрдВред
2. рдбреЗрдЯрд╛ рдХрд╛ рдЧреНрд░рд╛рдлрд╝рд┐рдХ рдкреНрд░рд╕реНрддреБрддреАрдХрд░рдг (Graphical Presentation of Frequency Distribution)
2.1 рд╣рд┐рд╕реНрдЯреЛрдЧреНрд░рд╛рдо (Histogram)
рдкрд░рд┐рднрд╛рд╖рд╛
рд╣рд┐рд╕реНрдЯреЛрдЧреНрд░рд╛рдо рдПрдХ рдкреНрд░рдХрд╛рд░ рдХрд╛ рдмрд╛рд░ рдЧреНрд░рд╛рдлрд╝ (Bar Graph) рд╣реИ, рдЬреЛ рдХрд┐рд╕реА рдбреЗрдЯрд╛ рдХреЗ рдЖрд╡реГрддреНрддрд┐ рд╡рд┐рддрд░рдг рдХреЛ рджрд░реНрд╢рд╛рддрд╛ рд╣реИред рдЗрд╕рдореЗрдВ рдмрд╛рд░реНрд╕ (Bars) рдЬреБрдбрд╝реЗ рд╣реБрдП рд╣реЛрддреЗ рд╣реИрдВ, рдЬрд┐рд╕рд╕реЗ рдпрд╣ рджрд░реНрд╢рд╛рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдХрд┐ рдбреЗрдЯрд╛ рд╕рддрдд (Continuous) рд╣реИред
рдореБрдЦреНрдп рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдБ
- x-рдЕрдХреНрд╖ (Horizontal Axis) рдкрд░ рд╡рд░реНрдЧ рдЕрдВрддрд░рд╛рд▓ рд╣реЛрддреЗ рд╣реИрдВред
- y-рдЕрдХреНрд╖ (Vertical Axis) рдкрд░ рдЖрд╡реГрддреНрддрд┐ рд╣реЛрддреА рд╣реИред
- рдмрд╛рд░реНрд╕ рдХреЗ рдмреАрдЪ рдХреЛрдИ рдЕрдВрддрд░ (Gap) рдирд╣реАрдВ рд╣реЛрддрд╛ред
рд╣рд┐рд╕реНрдЯреЛрдЧреНрд░рд╛рдо рдмрдирд╛рдиреЗ рдХреА рд╡рд┐рдзрд┐
- x-рдЕрдХреНрд╖ рдкрд░ рд╡рд░реНрдЧ рдЕрдВрддрд░рд╛рд▓ рдЪрд┐рд╣реНрдирд┐рдд рдХрд░реЗрдВред
- y-рдЕрдХреНрд╖ рдкрд░ рдкреНрд░рддреНрдпреЗрдХ рд╡рд░реНрдЧ рдХреА рдЖрд╡реГрддреНрддрд┐ рдХреЛ рджрд░реНрд╢рд╛рдПрдБред
- рдкреНрд░рддреНрдпреЗрдХ рд╡рд░реНрдЧ рдХреЗ рд▓рд┐рдП рдЖрдпрдд (Rectangles) рдмрдирд╛рдПрдБ, рдЬрд┐рдирдХреА рдКрдБрдЪрд╛рдИ рдЖрд╡реГрддреНрддрд┐ рдХреЗ рдмрд░рд╛рдмрд░ рд╣реЛред
рд╣рд┐рд╕реНрдЯреЛрдЧреНрд░рд╛рдо рдХреЗ рдЙрдкрдпреЛрдЧ
- рдпрд╣ рдбреЗрдЯрд╛ рд╡рд┐рддрд░рдг рдХреЛ рджрд░реНрд╢рд╛рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддрд╛ рд╣реИред
- рдпрд╣ рд╕рд╛рдорд╛рдиреНрдп (Normal), рдЕрд╕рд╛рдорд╛рдиреНрдп (Skewed) рдпрд╛ рджреНрд╡рд┐рдХ рдкрд░реНрд╡рддреАрдп (Bimodal) рд╡рд┐рддрд░рдг рдХреЛ рджрд┐рдЦрд╛рддрд╛ рд╣реИред
- рдпрд╣ рд╡реНрдпрд╡рд╕рд╛рдп, рд╡рд┐рдЬреНрдЮрд╛рди рдФрд░ рдЕрдиреБрд╕рдВрдзрд╛рди рдореЗрдВ рд╡реНрдпрд╛рдкрдХ рд░реВрдк рд╕реЗ рдкреНрд░рдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
2.2 рдЖрд╡реГрддреНрддрд┐ рдмрд╣реБрднреБрдЬ (Frequency Polygon)
рдкрд░рд┐рднрд╛рд╖рд╛
рдЖрд╡реГрддреНрддрд┐ рдмрд╣реБрднреБрдЬ (Frequency Polygon) рдПрдХ рд░реЗрдЦрд╛ рдЧреНрд░рд╛рдлрд╝ (Line Graph) рд╣реЛрддрд╛ рд╣реИ, рдЬреЛ рд╡рд░реНрдЧ рдЕрдВрддрд░рд╛рд▓реЛрдВ рдХреЗ рдордзреНрдп рдмрд┐рдВрджреБрдУрдВ (Midpoints) рдХреЛ рдЖрд╡реГрддреНрддрд┐ рдХреЗ рдЕрдиреБрд╕рд╛рд░ рдЬреЛрдбрд╝рдХрд░ рдмрдирд╛рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
рдореБрдЦреНрдп рд╡рд┐рд╢реЗрд╖рддрд╛рдПрдБ
- x-рдЕрдХреНрд╖ рдкрд░ рд╡рд░реНрдЧ рдордзреНрдпрдмрд┐рдВрджреБ рд╣реЛрддреЗ рд╣реИрдВред
- y-рдЕрдХреНрд╖ рдкрд░ рдЖрд╡реГрддреНрддрд┐рдпрд╛рдБ рд╣реЛрддреА рд╣реИрдВред
- рдмрд┐рдВрджреБрдУрдВ рдХреЛ рд░реЗрдЦрд╛рдУрдВ рджреНрд╡рд╛рд░рд╛ рдЬреЛрдбрд╝рд╛ рдЬрд╛рддрд╛ рд╣реИред
рдЖрд╡реГрддреНрддрд┐ рдмрд╣реБрднреБрдЬ рдмрдирд╛рдиреЗ рдХреА рд╡рд┐рдзрд┐
- рдкреНрд░рддреНрдпреЗрдХ рд╡рд░реНрдЧ рдХрд╛ рдордзреНрдпрдмрд┐рдВрджреБ (Midpoint) рдирд┐рдХрд╛рд▓реЗрдВ: рдордзреНрдпрдмрд┐рдВрджреБ=рдирд┐рдореНрди┬ард╕реАрдорд╛+рдЙрдЪреНрдЪ┬ард╕реАрдорд╛2\text{рдордзреНрдпрдмрд┐рдВрджреБ} = \frac{\text{рдирд┐рдореНрди рд╕реАрдорд╛} + \text{рдЙрдЪреНрдЪ рд╕реАрдорд╛}}{2}
- рдкреНрд░рддреНрдпреЗрдХ рдордзреНрдпрдмрд┐рдВрджреБ рдХреЗ рд▓рд┐рдП рдЖрд╡реГрддреНрддрд┐ рдмрд┐рдВрджреБ (Points) рдмрдирд╛рдПрдБред
- рдмрд┐рдВрджреБрдУрдВ рдХреЛ рд░реЗрдЦрд╛ рджреНрд╡рд╛рд░рд╛ рдЬреЛрдбрд╝реЗрдВред
- рдмрд╣реБрднреБрдЬ рдХреЛ рджреЛрдиреЛрдВ рд╕рд┐рд░реЛрдВ рдкрд░ x-рдЕрдХреНрд╖ рд╕реЗ рдорд┐рд▓рд╛рдПрдБред
рдЖрд╡реГрддреНрддрд┐ рдмрд╣реБрднреБрдЬ рдХреЗ рдЙрдкрдпреЛрдЧ
- рдпрд╣ рдбреЗрдЯрд╛ рд╡рд┐рддрд░рдг рдХреЛ рд╕реНрдкрд╖реНрдЯ рд░реВрдк рд╕реЗ рджрд░реНрд╢рд╛рддрд╛ рд╣реИред
- рдпрд╣ рд╡рд┐рднрд┐рдиреНрди рдбреЗрдЯрд╛ рд╕рдореВрд╣реЛрдВ рдХреА рддреБрд▓рдирд╛ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреЛрдЧреА рд╣реЛрддрд╛ рд╣реИред
- рдпрд╣ рд╕рдордп-рд╢реНрд░реГрдВрдЦрд▓рд╛ (Time-Series) рдбреЗрдЯрд╛ рдореЗрдВ рдмрджрд▓рд╛рд╡ рдХреЛ рджрд┐рдЦрд╛рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддрд╛ рд╣реИред
2.3 рдУрдЧрд┐рд╡ (Ogive рдпрд╛ Cumulative Frequency Curve)
рдкрд░рд┐рднрд╛рд╖рд╛
рдУрдЧрд┐рд╡ (Ogive) рдПрдХ рд╡рдХреНрд░ (Curve) рд╣реЛрддрд╛ рд╣реИ, рдЬреЛ рд╕рдВрдЪрдпреА рдЖрд╡реГрддреНрддрд┐рдпреЛрдВ (Cumulative Frequencies) рдХреЛ рдкреНрд░рджрд░реНрд╢рд┐рдд рдХрд░рддрд╛ рд╣реИред
рдУрдЧрд┐рд╡ рдХреЗ рдкреНрд░рдХрд╛рд░
- Less than Ogive: рдЗрд╕рдореЗрдВ рдЙрди рдореВрд▓реНрдпреЛрдВ рдХреА рдХреБрд▓ рд╕рдВрдЦреНрдпрд╛ рд╣реЛрддреА рд╣реИ рдЬреЛ рдХрд┐рд╕реА рд╡рд░реНрдЧ рд╕реАрдорд╛ рд╕реЗ рдХрдо рд╣реЛрддреЗ рд╣реИрдВред
- More than Ogive: рдЗрд╕рдореЗрдВ рдЙрди рдореВрд▓реНрдпреЛрдВ рдХреА рдХреБрд▓ рд╕рдВрдЦреНрдпрд╛ рд╣реЛрддреА рд╣реИ рдЬреЛ рдХрд┐рд╕реА рд╡рд░реНрдЧ рд╕реАрдорд╛ рд╕реЗ рдЕрдзрд┐рдХ рд╣реЛрддреЗ рд╣реИрдВред
рдУрдЧрд┐рд╡ рдмрдирд╛рдиреЗ рдХреА рд╡рд┐рдзрд┐
- рд╕рдВрдЪрдпреА рдЖрд╡реГрддреНрддрд┐ рддрд╛рд▓рд┐рдХрд╛ рдмрдирд╛рдПрдБред
- рд╡рд░реНрдЧ рд╕реАрдорд╛рдУрдВ рдХреЗ рдЦрд┐рд▓рд╛рдл рд╕рдВрдЪрдпреА рдЖрд╡реГрддреНрддрд┐рдпреЛрдВ рдХреЛ рдкреНрд▓реЙрдЯ рдХрд░реЗрдВред
- рдПрдХ рдЪрд┐рдХрдиреА рд╡рдХреНрд░ (Smooth Curve) рдмрдирд╛рдПрдБред
рдУрдЧрд┐рд╡ рдХреЗ рдЙрдкрдпреЛрдЧ
- рдпрд╣ рдорд╛рдзреНрдпрд┐рдХрд╛ (Median) рдФрд░ рдкреНрд░рддрд┐рд╢рддрдХ (Percentiles) рдХреЛ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХрд░рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддрд╛ рд╣реИред
- рдпрд╣ рдбреЗрдЯрд╛ рд╕рдВрдЪрдп (Cumulative Growth) рдХреЛ рджрд┐рдЦрд╛рддрд╛ рд╣реИред
рдирд┐рд╖реНрдХрд░реНрд╖
рдЖрд╡реГрддреНрддрд┐ рд╡рд┐рддрд░рдг рдбреЗрдЯрд╛ рдХреЛ рд╡реНрдпрд╡рд╕реНрдерд┐рдд рдХрд░рдиреЗ рдХрд╛ рдПрдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рддрд░реАрдХрд╛ рд╣реИ, рдЬрд┐рд╕рд╕реЗ рдбреЗрдЯрд╛ рдХреЛ рдЖрд╕рд╛рдиреА рд╕реЗ рд╕рдордЭрд╛ рдФрд░ рд╡рд┐рд╢реНрд▓реЗрд╖рдг рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИред рд╣рд┐рд╕реНрдЯреЛрдЧреНрд░рд╛рдо, рдЖрд╡реГрддреНрддрд┐ рдмрд╣реБрднреБрдЬ рдФрд░ рдУрдЧрд┐рд╡ рдЬреИрд╕реЗ рдЧреНрд░рд╛рдлрд╝рд┐рдХ рдЙрдкрдХрд░рдг рдбреЗрдЯрд╛ рд╡рд┐рддрд░рдг рдХреЗ рдкреИрдЯрд░реНрди рдХреЛ рд╕реНрдкрд╖реНрдЯ рд░реВрдк рд╕реЗ рдкреНрд░рджрд░реНрд╢рд┐рдд рдХрд░рддреЗ рд╣реИрдВред рдЗрди рддрдХрдиреАрдХреЛрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рд╡рд┐рднрд┐рдиреНрди рдХреНрд╖реЗрддреНрд░реЛрдВ рдЬреИрд╕реЗ рд╢рд┐рдХреНрд╖рд╛, рд╡реНрдпрд╛рдкрд╛рд░, рдЪрд┐рдХрд┐рддреНрд╕рд╛, рдФрд░ рдЕрдиреБрд╕рдВрдзрд╛рди рдореЗрдВ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рддрд╛рдХрд┐ рдирд┐рд░реНрдгрдп рд▓реЗрдиреЗ рдореЗрдВ рд╕рд╣рд╛рдпрддрд╛ рдорд┐рд▓ рд╕рдХреЗред
UNIT-2 (2.2) Frequency distribution of data and Graphic presentation: Histogram, Polygon and Ogive.
Introduction
In statistics, data is often collected in large quantities, making it difficult to analyze or interpret in its raw form. To make sense of data, statisticians organize it into a structured form known as a frequency distribution and represent it visually using different graphs, including histograms, frequency polygons, and ogives. These graphical representations help in understanding patterns, trends, and distributions of data effectively.
This essay explores the concept of frequency distribution, its types, methods of construction, and its graphical representations, specifically histogram, frequency polygon, and ogive.
1. Frequency Distribution of Data
Definition
A frequency distribution is a systematic way of arranging data into classes or groups along with their corresponding frequencies (the number of times a particular value or group of values appears). It helps in summarizing large datasets for easier analysis.
Key Features
- Organizes raw data into a structured format.
- Displays the frequency (count) of values in each group.
- Helps identify trends and patterns in data.
- Useful for statistical analysis and graphical representation.
Types of Frequency Distribution
- Ungrouped Frequency Distribution
- Used when data values are few and can be listed individually.
- Example: Test scores of 10 students тАУ {85, 90, 78, 85, 88, 92, 78, 85, 90, 88}.
- Frequency table:
Score (x) | Frequency (f) |
78 | 2 |
85 | 3 |
88 | 2 |
90 | 2 |
92 | 1 |
- Grouped Frequency Distribution
- Used for large datasets by dividing data into class intervals.
- Example: Student test scores ranging from 40 to 100, grouped in class intervals of 10.
Class Interval | Frequency (f) |
40 – 49 | 3 |
50 – 59 | 5 |
60 – 69 | 8 |
70 – 79 | 10 |
80 – 89 | 7 |
90 – 99 | 4 |
Steps to Construct a Frequency Distribution Table
- Collect the data тАУ Gather the dataset to be analyzed.
- Determine the range тАУ Find the difference between the highest and lowest values.
- Select the number of class intervals тАУ Typically between 5 and 10 for readability.
- Determine class width тАУ Divide the range by the number of intervals.
- Create class intervals тАУ Ensure they are mutually exclusive and exhaustive.
- Count the frequency тАУ Record how many values fall into each interval.
2. Graphical Presentation of Frequency Distribution
Graphical representation makes it easier to visualize data patterns. The three primary graphs for frequency distributions are histograms, frequency polygons, and ogives.
2.1 Histogram
Definition
A histogram is a bar graph that represents the frequency distribution of a dataset. Unlike bar charts, histograms have adjacent bars, showing that the data is continuous.
Features of a Histogram
- The x-axis (horizontal axis) represents the class intervals.
- The y-axis (vertical axis) represents the frequency of occurrences.
- Bars are adjacent, indicating continuous data.
Steps to Construct a Histogram
- Draw x-axis and label it with class intervals.
- Draw y-axis and label it with frequencies.
- Draw rectangular bars for each class interval, where the height represents the frequency.
- Ensure there are no gaps between bars.
Example
Class Interval | Frequency (f) |
40 – 49 | 3 |
50 – 59 | 5 |
60 – 69 | 8 |
70 – 79 | 10 |
80 – 89 | 7 |
90 – 99 | 4 |
In the histogram, the bars for each class interval would have the following heights: 3, 5, 8, 10, 7, and 4.
Uses of Histogram
- Helps in understanding the distribution shape (normal, skewed, bimodal, etc.).
- Useful in statistical analysis for large datasets.
- Commonly used in quality control and research studies.
2.2 Frequency Polygon
Definition
A frequency polygon is a line graph that connects the midpoints of the tops of histogram bars, providing a smoother representation of data distribution.
Features of a Frequency Polygon
- The x-axis represents class midpoints.
- The y-axis represents frequencies.
- A continuous line is drawn through plotted points.
Steps to Construct a Frequency Polygon
- Find the midpoints of each class interval: Midpoint=Lower┬аBound+Upper┬аBound2\text{Midpoint} = \frac{\text{Lower Bound} + \text{Upper Bound}}{2}
- Plot the midpoints against the frequencies.
- Connect the points using straight lines.
- Extend the polygon to the x-axis at both ends for closure.
Example Calculation for Midpoints
Class Interval | Midpoint | Frequency (f) |
40 – 49 | 44.5 | 3 |
50 – 59 | 54.5 | 5 |
60 – 69 | 64.5 | 8 |
70 – 79 | 74.5 | 10 |
80 – 89 | 84.5 | 7 |
90 – 99 | 94.5 | 4 |
Uses of Frequency Polygon
- Shows overall trends in data distribution.
- Easier to compare multiple distributions on the same graph.
- Useful in understanding fluctuations over intervals.
2.3 Ogive (Cumulative Frequency Curve)
Definition
An ogive is a graph that represents cumulative frequencies, showing how data accumulates over intervals. There are two types:
- Less than ogive: Plots cumulative frequencies of values less than class limits.
- More than ogive: Plots cumulative frequencies of values greater than class limits.
Features of an Ogive
- The x-axis represents class boundaries.
- The y-axis represents cumulative frequencies.
- A smooth curve is drawn through the plotted points.
Steps to Construct an Ogive
- Create a cumulative frequency table:
Class Interval | Frequency (f) | Cumulative Frequency (Less than) |
40 – 49 | 3 | 3 |
50 – 59 | 5 | 3 + 5 = 8 |
60 – 69 | 8 | 8 + 8 = 16 |
70 – 79 | 10 | 16 + 10 = 26 |
80 – 89 | 7 | 26 + 7 = 33 |
90 – 99 | 4 | 33 + 4 = 37 |
- Plot cumulative frequencies against the class boundaries.
- Draw a smooth curve through the points.
Uses of Ogive
- Helps in determining median and percentiles.
- Useful in comparing distributions.
- Shows cumulative trends effectively.
Conclusion
Frequency distributions and their graphical representationsтАФhistograms, frequency polygons, and ogivesтАФare essential tools in statistics. They provide insights into data distribution, trends, and patterns, making it easier to interpret and analyze large datasets. These methods are widely used in research, business, healthcare, and other fields to make data-driven decisions. Understanding how to construct and interpret these graphs is fundamental for statistical analysis and real-world applications.
UNIT-2(2.3) Measures of Central tendency: Calculation of Mean, Median and Mode.
рдХреЗрдиреНрджреНрд░реАрдп рдкреНрд░рд╡реГрддреНрддрд┐ рдХреЗ рдорд╛рдк: рдорд╛рдзреНрдп, рдорд╛рдзреНрдпрд┐рдХрд╛ рдФрд░ рдмрд╣реБрд▓рдХ рдХреА рдЧрдгрдирд╛
рдкрд░рд┐рдЪрдп
рд╕рд╛рдВрдЦреНрдпрд┐рдХреА (Statistics) рдореЗрдВ, рдХреЗрдиреНрджреНрд░реАрдп рдкреНрд░рд╡реГрддреНрддрд┐ рдХреЗ рдорд╛рдк (Measures of Central Tendency) рдХрд╛ рдЙрдкрдпреЛрдЧ рдбреЗрдЯрд╛ рдХреЗ рдХреЗрдВрджреНрд░реАрдп рдпрд╛ рд╕рд╛рдорд╛рдиреНрдп рдорд╛рди рдХреЛ рд╕рдордЭрдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред рддреАрди рдкреНрд░рдореБрдЦ рдХреЗрдиреНрджреНрд░реАрдп рдкреНрд░рд╡реГрддреНрддрд┐ рдХреЗ рдорд╛рдк рд╣реЛрддреЗ рд╣реИрдВ:
- рдорд╛рдзреНрдп (Mean) тАУ рд╕рднреА рдорд╛рдиреЛрдВ рдХреЗ рдпреЛрдЧ рдХреЛ рдХреБрд▓ рдорд╛рдиреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рд╕реЗ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд░рдХреЗ рдкреНрд░рд╛рдкреНрдд рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
- рдорд╛рдзреНрдпрд┐рдХрд╛ (Median) тАУ рдЬрдм рдбреЗрдЯрд╛ рдХреЛ рдХреНрд░рдордмрджреНрдз рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ, рддреЛ рдпрд╣ рдордзреНрдп рдорд╛рди рд╣реЛрддрд╛ рд╣реИред
- рдмрд╣реБрд▓рдХ (Mode) тАУ рдбреЗрдЯрд╛ рдореЗрдВ рд╕рдмрд╕реЗ рдЕрдзрд┐рдХ рдмрд╛рд░ рдЖрдиреЗ рд╡рд╛рд▓рд╛ рдорд╛рдиред
рдпреЗ рддреАрдиреЛрдВ рдорд╛рдк рдбреЗрдЯрд╛ рдХреЗ рд╡рд┐рддрд░рдг рдХреЛ рдЕрд▓рдЧ-рдЕрд▓рдЧ рддрд░реАрдХреЛрдВ рд╕реЗ рд╡реНрдпрд╛рдЦреНрдпрд╛ рдХрд░рдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддреЗ рд╣реИрдВред рдЗрд╕ рдирд┐рдмрдВрдз рдореЗрдВ рд╣рдо рдорд╛рдзреНрдп, рдорд╛рдзреНрдпрд┐рдХрд╛ рдФрд░ рдмрд╣реБрд▓рдХ рдХреА рдкрд░рд┐рднрд╛рд╖рд╛, рд╕реВрддреНрд░ рдФрд░ рдЙрдирдХреА рдЧрдгрдирд╛ рдХреЛ рд╡рд┐рд╕реНрддреГрдд рд░реВрдк рд╕реЗ рд╕рдордЭреЗрдВрдЧреЗред
1. рдорд╛рдзреНрдп (Mean)
рдкрд░рд┐рднрд╛рд╖рд╛
рдорд╛рдзреНрдп рдХреЛ рдЖрдорддреМрд░ рдкрд░ рдФрд╕рдд (Average) рдХрд╣рд╛ рдЬрд╛рддрд╛ рд╣реИред рдпрд╣ рд╕рднреА рдбреЗрдЯрд╛ рдорд╛рдиреЛрдВ рдХреЗ рдпреЛрдЧ рдХреЛ рдХреБрд▓ рдорд╛рдиреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рд╕реЗ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд░рдХреЗ рдкреНрд░рд╛рдкреНрдд рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
рдорд╛рдзреНрдп рдХреЗ рд╕реВрддреНрд░
(рдХ) рдЕрд╕рдореВрд╣реАрдХреГрдд рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рдорд╛рдзреНрдп
рдорд╛рдзреНрдп(X╦Й)=тИСXN\text{рдорд╛рдзреНрдп} (\bar{X}) = \frac{\sum X}{N}
рдЬрд╣рд╛рдБ,
- тИСX\sum X = рд╕рднреА рдорд╛рдиреЛрдВ рдХрд╛ рдпреЛрдЧ
- NN = рдХреБрд▓ рдорд╛рдиреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛
(рдЦ) рд╕рдореВрд╣реАрдХреГрдд рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рдорд╛рдзреНрдп
рдорд╛рдзреНрдп(X╦Й)=тИСfXтИСf\text{рдорд╛рдзреНрдп} (\bar{X}) = \frac{\sum fX}{\sum f}
рдЬрд╣рд╛рдБ,
- ff = рдкреНрд░рддреНрдпреЗрдХ рд╡рд░реНрдЧ рдХреА рдЖрд╡реГрддреНрддрд┐
- XX = рдкреНрд░рддреНрдпреЗрдХ рд╡рд░реНрдЧ рдХрд╛ рдордзреНрдп рдмрд┐рдВрджреБ
- тИСfX\sum fX = рд╕рднреА рд╡рд░реНрдЧреЛрдВ рдХреЗ рдордзреНрдп рдмрд┐рдВрджреБ рдФрд░ рдЙрдирдХреА рдЖрд╡реГрддреНрддрд┐рдпреЛрдВ рдХреЗ рдЧреБрдгрдирдлрд▓ рдХрд╛ рдпреЛрдЧ
- тИСf\sum f = рдХреБрд▓ рдЖрд╡реГрддреНрддрд┐
рдЙрджрд╛рд╣рд░рдг 1: рдЕрд╕рдореВрд╣реАрдХреГрдд рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рдорд╛рдзреНрдп
рдорд╛рди рд▓реАрдЬрд┐рдП 5 рдЫрд╛рддреНрд░реЛрдВ рдХреЗ рдЕрдВрдХ рдЗрд╕ рдкреНрд░рдХрд╛рд░ рд╣реИрдВ: 40, 50, 60, 70, 80
рдорд╛рдзреНрдп=(40+50+60+70+80)5=3005=60\text{рдорд╛рдзреНрдп} = \frac{(40 + 50 + 60 + 70 + 80)}{5} = \frac{300}{5} = 60
рдЙрджрд╛рд╣рд░рдг 2: рд╕рдореВрд╣реАрдХреГрдд рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рдорд╛рдзреНрдп
рдиреАрдЪреЗ рджрд┐рдП рдЧрдП рдбреЗрдЯрд╛ рдХреЛ рджреЗрдЦреЗрдВ:
рд╡рд░реНрдЧ рдЕрдВрддрд░рд╛рд▓ (Class Interval) | рдЖрд╡реГрддреНрддрд┐ (f) | рдордзреНрдп рдмрд┐рдВрджреБ (X) | fX |
10 – 20 | 3 | 15 | 45 |
20 – 30 | 5 | 25 | 125 |
30 – 40 | 7 | 35 | 245 |
40 – 50 | 10 | 45 | 450 |
50 – 60 | 5 | 55 | 275 |
рдпреЛрдЧ (Total) | 30 | 1140 |
рдорд╛рдзреНрдп=114030=38\text{рдорд╛рдзреНрдп} = \frac{1140}{30} = 38
рдЗрд╕ рдкреНрд░рдХрд╛рд░, рдЗрд╕ рдбреЗрдЯрд╛ рдХрд╛ рдорд╛рдзреНрдп 38 рд╣реИред
2. рдорд╛рдзреНрдпрд┐рдХрд╛ (Median)
рдкрд░рд┐рднрд╛рд╖рд╛
рдорд╛рдзреНрдпрд┐рдХрд╛ рдПрдХ рдРрд╕рд╛ рдорд╛рди рд╣реИ рдЬреЛ рдбреЗрдЯрд╛ рдХреЛ рджреЛ рд╕рдорд╛рди рднрд╛рдЧреЛрдВ рдореЗрдВ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд░рддрд╛ рд╣реИред
рдорд╛рдзреНрдпрд┐рдХрд╛ рдЬреНрдЮрд╛рдд рдХрд░рдиреЗ рдХреА рдкреНрд░рдХреНрд░рд┐рдпрд╛
- рдбреЗрдЯрд╛ рдХреЛ рдЖрд░реЛрд╣реА рдХреНрд░рдо (Ascending Order) рдореЗрдВ рд╡реНрдпрд╡рд╕реНрдерд┐рдд рдХрд░реЗрдВред
- рдорд╛рдзреНрдпрд┐рдХрд╛ рдХрд╛ рд╕реНрдерд╛рди рдирд┐рдХрд╛рд▓реЗрдВ: рдорд╛рдзреНрдпрд┐рдХрд╛┬ард╕реНрдерд╛рди=N+12\text{рдорд╛рдзреНрдпрд┐рдХрд╛ рд╕реНрдерд╛рди} = \frac{N+1}{2} рдЬрд╣рд╛рдБ NN рдХреБрд▓ рдорд╛рдиреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рд╣реИред
- рдпрджрд┐ NN рд╡рд┐рд╖рдо рд╣реИ, рддреЛ рдорд╛рдзреНрдпрд┐рдХрд╛ рд╕реАрдзрд╛ рдордзреНрдп рдорд╛рди рд╣реЛрдЧрд╛ред
- рдпрджрд┐ NN рд╕рдо рд╣реИ, рддреЛ рдорд╛рдзреНрдпрд┐рдХрд╛ рджреЛ рдордзреНрдп рдорд╛рдиреЛрдВ рдХрд╛ рдФрд╕рдд рд╣реЛрдЧрд╛ред
рд╕рдореВрд╣реАрдХреГрдд рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рдорд╛рдзреНрдпрд┐рдХрд╛ рдХрд╛ рд╕реВрддреНрд░
рдорд╛рдзреНрдпрд┐рдХрд╛=L+(N2тИТCFf)├Чh\text{рдорд╛рдзреНрдпрд┐рдХрд╛} = L + \left( \frac{\frac{N}{2} – CF}{f} \right) \times h
рдЬрд╣рд╛рдБ:
- LL = рдорд╛рдзреНрдпрд┐рдХрд╛ рд╡рд░реНрдЧ рдХреА рдирд┐рдореНрди рд╕реАрдорд╛
- NN = рдХреБрд▓ рдЖрд╡реГрддреНрддрд┐
- CFCF = рдорд╛рдзреНрдпрд┐рдХрд╛ рд╡рд░реНрдЧ рдХреЗ рдкрд╣рд▓реЗ рдХреА рд╕рдВрдЪрдпреА рдЖрд╡реГрддреНрддрд┐
- ff = рдорд╛рдзреНрдпрд┐рдХрд╛ рд╡рд░реНрдЧ рдХреА рдЖрд╡реГрддреНрддрд┐
- hh = рд╡рд░реНрдЧ рдЪреМрдбрд╝рд╛рдИ
рдЙрджрд╛рд╣рд░рдг 1: рдЕрд╕рдореВрд╣реАрдХреГрдд рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рдорд╛рдзреНрдпрд┐рдХрд╛
рдорд╛рди рд▓реАрдЬрд┐рдП, рдбреЗрдЯрд╛ рдЗрд╕ рдкреНрд░рдХрд╛рд░ рд╣реИ: 25, 30, 35, 40, 45, 50, 55
рдпрд╣рд╛рдБ N=7N = 7 (рд╡рд┐рд╖рдо рд╕рдВрдЦреНрдпрд╛), рдЗрд╕рд▓рд┐рдП:
рдорд╛рдзреНрдпрд┐рдХрд╛ рд╕реНрдерд╛рди=7+12=4\text{рдорд╛рдзреНрдпрд┐рдХрд╛ рд╕реНрдерд╛рди} = \frac{7+1}{2} = 4
рдЗрд╕рд▓рд┐рдП, 4рд╡рд╛рдБ рдорд╛рди = 40, рдЕрддрдГ рдорд╛рдзреНрдпрд┐рдХрд╛ = 40ред
рдпрджрд┐ рдбреЗрдЯрд╛ рд╣реЛрддрд╛: 25, 30, 35, 40, 45, 50 (рд╕рдо рд╕рдВрдЦреНрдпрд╛ N=6N = 6),
рдорд╛рдзреНрдпрд┐рдХрд╛=(35+40)2=37.5\text{рдорд╛рдзреНрдпрд┐рдХрд╛} = \frac{(35 + 40)}{2} = 37.5
3. рдмрд╣реБрд▓рдХ (Mode)
рдкрд░рд┐рднрд╛рд╖рд╛
рдмрд╣реБрд▓рдХ рд╡рд╣ рдорд╛рди рд╣реЛрддрд╛ рд╣реИ рдЬреЛ рдбреЗрдЯрд╛ рдореЗрдВ рд╕рдмрд╕реЗ рдЕрдзрд┐рдХ рдмрд╛рд░ рдЖрддрд╛ рд╣реИред
рдмрд╣реБрд▓рдХ рдЬреНрдЮрд╛рдд рдХрд░рдиреЗ рдХреА рдкреНрд░рдХреНрд░рд┐рдпрд╛
- рдЕрд╕рдореВрд╣реАрдХреГрдд рдбреЗрдЯрд╛ рдореЗрдВ рд╕рдмрд╕реЗ рдЕрдзрд┐рдХ рдмрд╛рд░ рдЖрдиреЗ рд╡рд╛рд▓рд╛ рдорд╛рди рдЦреЛрдЬреЗрдВред
- рд╕рдореВрд╣реАрдХреГрдд рдбреЗрдЯрд╛ рдореЗрдВ рд╕рдмрд╕реЗ рдЕрдзрд┐рдХ рдЖрд╡реГрддреНрддрд┐ рд╡рд╛рд▓реЗ рд╡рд░реНрдЧ (Modal Class) рдХреА рдкрд╣рдЪрд╛рди рдХрд░реЗрдВред
- рдирд┐рдореНрди рд╕реВрддреНрд░ рдХрд╛ рдкреНрд░рдпреЛрдЧ рдХрд░реЗрдВ:
рдмрд╣реБрд▓рдХ=L+(f1тИТf0(2f1тИТf0тИТf2))├Чh\text{рдмрд╣реБрд▓рдХ} = L + \left( \frac{f_1 – f_0}{(2f_1 – f_0 – f_2)} \right) \times h
рдЬрд╣рд╛рдБ:
- LL = рдмрд╣реБрд▓рдХ рд╡рд░реНрдЧ рдХреА рдирд┐рдореНрди рд╕реАрдорд╛
- f1f_1 = рдмрд╣реБрд▓рдХ рд╡рд░реНрдЧ рдХреА рдЖрд╡реГрддреНрддрд┐
- f0f_0 = рдмрд╣реБрд▓рдХ рд╡рд░реНрдЧ рд╕реЗ рдкрд╣рд▓реЗ рдХреА рдЖрд╡реГрддреНрддрд┐
- f2f_2 = рдмрд╣реБрд▓рдХ рд╡рд░реНрдЧ рдХреЗ рдмрд╛рдж рдХреА рдЖрд╡реГрддреНрддрд┐
- hh = рд╡рд░реНрдЧ рдЪреМрдбрд╝рд╛рдИ
рдЙрджрд╛рд╣рд░рдг 1: рдЕрд╕рдореВрд╣реАрдХреГрдд рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рдмрд╣реБрд▓рдХ
рдпрджрд┐ рдбреЗрдЯрд╛ рдЗрд╕ рдкреНрд░рдХрд╛рд░ рд╣реИ: 2, 3, 3, 5, 6, 3, 8, 9, 3
рддреЛ рд╕рдмрд╕реЗ рдЕрдзрд┐рдХ рдмрд╛рд░ 3 рдЖрддрд╛ рд╣реИ, рдЕрддрдГ рдмрд╣реБрд▓рдХ = 3ред
рдЙрджрд╛рд╣рд░рдг 2: рд╕рдореВрд╣реАрдХреГрдд рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рдмрд╣реБрд▓рдХ
рд╡рд░реНрдЧ рдЕрдВрддрд░рд╛рд▓ | рдЖрд╡реГрддреНрддрд┐ (f) |
10 – 20 | 3 |
20 – 30 | 7 |
30 – 40 | 12 |
40 – 50 | 8 |
50 – 60 | 5 |
рдмрд╣реБрд▓рдХ=30+(12тИТ7(2├Ч12тИТ7тИТ8))├Ч10\text{рдмрд╣реБрд▓рдХ} = 30 + \left( \frac{12 – 7}{(2 \times 12 – 7 – 8)} \right) \times 10 =30+5.56=35.56= 30 + 5.56 = 35.56
рдЕрддрдГ рдмрд╣реБрд▓рдХ = 35.56ред
рдирд┐рд╖реНрдХрд░реНрд╖
рдорд╛рдзреНрдп, рдорд╛рдзреНрдпрд┐рдХрд╛ рдФрд░ рдмрд╣реБрд▓рдХ рдбреЗрдЯрд╛ рдХрд╛ рдХреЗрдВрджреНрд░реАрдп рдорд╛рди рдЬреНрдЮрд╛рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╕рд╛рдВрдЦреНрдпрд┐рдХреАрдп рдорд╛рдк рд╣реИрдВред рдорд╛рдзреНрдп рдФрд╕рдд рдХреЛ рджрд░реНрд╢рд╛рддрд╛ рд╣реИ, рдорд╛рдзреНрдпрд┐рдХрд╛ рдордзреНрдп рдорд╛рди рдХреЛ рдмрддрд╛рддрд╛ рд╣реИ, рдФрд░ рдмрд╣реБрд▓рдХ рд╕рдмрд╕реЗ рдЕрдзрд┐рдХ рдмрд╛рд░ рдЖрдиреЗ рд╡рд╛рд▓реЗ рдорд╛рди рдХреЛ рдЗрдВрдЧрд┐рдд рдХрд░рддрд╛ рд╣реИред рдпреЗ рдЙрдкрд╛рдп рдЕрдиреБрд╕рдВрдзрд╛рди, рд╡реНрдпрд╛рдкрд╛рд░, рдЕрд░реНрдерд╢рд╛рд╕реНрддреНрд░, рдФрд░ рд╡рд┐рдЬреНрдЮрд╛рди рдореЗрдВ рдирд┐рд░реНрдгрдп рд▓реЗрдиреЗ рдХреЗ рд▓рд┐рдП рдЖрд╡рд╢реНрдпрдХ рд╣реЛрддреЗ рд╣реИрдВред
UNIT-2(2.3) Measures of Central tendency: Calculation of Mean, Median and Mode.
Introduction
In statistics, measures of central tendency are used to describe the central or typical value of a dataset. The three most commonly used measures are:
- Mean (Average) тАУ The sum of all values divided by the number of values.
- Median тАУ The middle value when data is arranged in order.
- Mode тАУ The most frequently occurring value(s) in the dataset.
Each measure provides a different perspective on data distribution and is useful in different scenarios. In this essay, we will explore the definitions, formulas, and step-by-step calculations of mean, median, and mode for both ungrouped and grouped data with examples.
1. Mean (Arithmetic Mean)
Definition
The mean is the sum of all observations divided by the total number of observations. It is the most commonly used measure of central tendency.
Formula for Mean
(a) Mean for Ungrouped Data
Mean(X╦Й)=тИСXN\text{Mean} (\bar{X}) = \frac{\sum X}{N}
where:
- тИСX\sum X = Sum of all values
- NN = Total number of values
(b) Mean for Grouped Data
Mean(X╦Й)=тИСfXтИСf\text{Mean} (\bar{X}) = \frac{\sum fX}{\sum f}
where:
- ff = Frequency of each class
- XX = Midpoint of each class interval
- тИСfX\sum fX = Sum of the product of midpoints and frequencies
- тИСf\sum f = Total frequency
Example 1: Mean for Ungrouped Data
Consider the marks of 5 students: 40, 50, 60, 70, 80
Mean=(40+50+60+70+80)5=3005=60\text{Mean} = \frac{(40 + 50 + 60 + 70 + 80)}{5} = \frac{300}{5} = 60
Example 2: Mean for Grouped Data
Consider the following grouped frequency distribution:
Class Interval | Frequency (f) | Midpoint (X) | fX |
10 – 20 | 3 | 15 | 45 |
20 – 30 | 5 | 25 | 125 |
30 – 40 | 7 | 35 | 245 |
40 – 50 | 10 | 45 | 450 |
50 – 60 | 5 | 55 | 275 |
Total | 30 | 1140 |
Mean=114030=38\text{Mean} = \frac{1140}{30} = 38
Thus, the mean of this dataset is 38.
2. Median
Definition
The median is the middle value of an ordered dataset. It divides the data into two equal halves.
Steps to Find the Median
- Arrange the data in ascending order.
- Find the position of the median using the formula: Median┬аPosition=N+12\text{Median Position} = \frac{N+1}{2} where NN is the total number of values.
- If NN is odd, the median is the middle value.
- If NN is even, the median is the average of the two middle values.
Formula for Median in Grouped Data
Median=L+(N2тИТCFf)├Чh\text{Median} = L + \left( \frac{\frac{N}{2} – CF}{f} \right) \times h
where:
- LL = Lower boundary of the median class
- NN = Total frequency
- CFCF = Cumulative frequency before the median class
- ff = Frequency of the median class
- hh = Class width
Example 1: Median for Ungrouped Data
Consider the dataset: 25, 30, 35, 40, 45, 50, 55
Total values: N=7N = 7 (odd), so the median is:
Median Position=7+12=4\text{Median Position} = \frac{7+1}{2} = 4
Thus, the 4th value is 40, so median = 40.
If the dataset were: 25, 30, 35, 40, 45, 50 (even N=6N = 6),
Median=(35+40)2=37.5\text{Median} = \frac{(35 + 40)}{2} = 37.5
Example 2: Median for Grouped Data
Consider the dataset:
Class Interval | Frequency (f) | Cumulative Frequency (CF) |
10 – 20 | 3 | 3 |
20 – 30 | 5 | 8 |
30 – 40 | 7 | 15 |
40 – 50 | 10 | 25 |
50 – 60 | 5 | 30 |
Total N=30N = 30, so N/2=15N/2 = 15. The median class is 30 – 40 (where CF reaches 15).
Median=30+(15тИТ87)├Ч10\text{Median} = 30 + \left( \frac{15 – 8}{7} \right) \times 10 =30+(77)├Ч10=30+10=40= 30 + \left( \frac{7}{7} \right) \times 10 = 30 + 10 = 40
Thus, the median = 40.
3. Mode
Definition
The mode is the value that appears most frequently in a dataset. It is useful for categorical, discrete, and continuous data.
Steps to Find the Mode
- Identify the most frequently occurring value in ungrouped data.
- In grouped data, find the modal class (class with the highest frequency).
- Use the formula for grouped data:
Mode=L+(f1тИТf0(2f1тИТf0тИТf2))├Чh\text{Mode} = L + \left( \frac{f_1 – f_0}{(2f_1 – f_0 – f_2)} \right) \times h
where:
- LL = Lower boundary of the modal class
- f1f_1 = Frequency of the modal class
- f0f_0 = Frequency of the class before the modal class
- f2f_2 = Frequency of the class after the modal class
- hh = Class width
Example 1: Mode for Ungrouped Data
Given the data: 2, 3, 3, 5, 6, 3, 8, 9, 3
Since 3 appears the most times, the mode = 3.
Example 2: Mode for Grouped Data
Class Interval | Frequency (f) |
10 – 20 | 3 |
20 – 30 | 7 |
30 – 40 | 12 |
40 – 50 | 8 |
50 – 60 | 5 |
Using the formula:
Mode=30+(12тИТ7(2├Ч12тИТ7тИТ8))├Ч10\text{Mode} = 30 + \left( \frac{12 – 7}{(2 \times 12 – 7 – 8)} \right) \times 10 =30+(5(24тИТ15))├Ч10= 30 + \left( \frac{5}{(24 – 15)} \right) \times 10 =30+(59)├Ч10= 30 + \left( \frac{5}{9} \right) \times 10 =30+5.56=35.56= 30 + 5.56 = 35.56
Thus, mode = 35.56.
Conclusion
The three measures of central tendencyтАФmean, median, and modeтАФprovide different insights into a dataset. The mean is most affected by extreme values, while the median is more robust, and the mode is useful for identifying common values. These measures are widely used in research, economics, psychology, and business analytics for data analysis and decision-making. Understanding how to calculate and interpret them is essential for statistical studies.
UNIT-2(2.4) Measures of Variability: Calculation of Range, QD, AD, SD.
рдкреНрд░рд╕рд░рдг рдХреЗ рдорд╛рдк: рд╕реАрдорд╛ (Range), рдЪрддреБрд░реНрдердХ рд╡рд┐рдЪрд▓рди (QD), рдорд╛рдзреНрдп рдкрд░рд╛рд╕ рд╡рд┐рдЪрд▓рди (AD), рдФрд░ рдорд╛рдирдХ рд╡рд┐рдЪрд▓рди (SD) рдХреА рдЧрдгрдирд╛
рдкрд░рд┐рдЪрдп
рд╕рд╛рдВрдЦреНрдпрд┐рдХреА (Statistics) рдореЗрдВ, рдкреНрд░рд╕рд░рдг (Variability) рдпрд╣ рджрд░реНрд╢рд╛рддрд╛ рд╣реИ рдХрд┐ рдХрд┐рд╕реА рдбреЗрдЯрд╛ рд╕реЗрдЯ рдХреЗ рдорд╛рди рдХрд┐рддрдиреЗ рдлреИрд▓реЗ рд╣реБрдП рдпрд╛ рдПрдХ-рджреВрд╕рд░реЗ рд╕реЗ рдХрд┐рддрдиреЗ рднрд┐рдиреНрди рд╣реИрдВред рдЬрдмрдХрд┐ рдХреЗрдиреНрджреНрд░реАрдп рдкреНрд░рд╡реГрддреНрддрд┐ рдХреЗ рдорд╛рдк (Measures of Central Tendency) (рдЬреИрд╕реЗ рдорд╛рдзреНрдп, рдорд╛рдзреНрдпрд┐рдХрд╛ рдФрд░ рдмрд╣реБрд▓рдХ) рдбреЗрдЯрд╛ рдХреЗ рдХреЗрдВрджреНрд░реАрдп рдорд╛рди рдХреЛ рд╡реНрдпрдХреНрдд рдХрд░рддреЗ рд╣реИрдВ, рдкреНрд░рд╕рд░рдг рдХреЗ рдорд╛рдк рдбреЗрдЯрд╛ рдХреА рд╡рд┐рд╡рд┐рдзрддрд╛ рдпрд╛ рдлреИрд▓рд╛рд╡ рдХреЛ рджрд░реНрд╢рд╛рддреЗ рд╣реИрдВред
рдкреНрд░рд╕рд░рдг рдХреЗ рдЪрд╛рд░ рдкреНрд░рдореБрдЦ рдорд╛рдк рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рд╣реИрдВ:
- рд╕реАрдорд╛ (Range) тАУ рдЕрдзрд┐рдХрддрдо рдФрд░ рдиреНрдпреВрдирддрдо рдорд╛рди рдХреЗ рдмреАрдЪ рдХрд╛ рдЕрдВрддрд░ред
- рдЪрддреБрд░реНрдердХ рд╡рд┐рдЪрд▓рди (Quartile Deviation – QD) тАУ рдордзреНрдп 50% рдбреЗрдЯрд╛ рдХреА рдкреНрд░рд╕рд░рдг рд╕реАрдорд╛ред
- рдорд╛рдзреНрдп рдкрд░рд╛рд╕ рд╡рд┐рдЪрд▓рди (Mean Absolute Deviation – AD) тАУ рдкреНрд░рддреНрдпреЗрдХ рдбреЗрдЯрд╛ рдмрд┐рдВрджреБ рдФрд░ рдорд╛рдзреНрдп рдХреЗ рдмреАрдЪ рдФрд╕рдд рд╡рд┐рдЪрд▓рдиред
- рдорд╛рдирдХ рд╡рд┐рдЪрд▓рди (Standard Deviation – SD) тАУ рдбреЗрдЯрд╛ рдХреЗ рдорд╛рдзреНрдп рд╕реЗ рдФрд╕рдд рджреВрд░реА рдХрд╛ рдПрдХ рд╕рдЯреАрдХ рдорд╛рдкред
рдЗрд╕ рд▓реЗрдЦ рдореЗрдВ, рд╣рдо рдЗрди рдЪрд╛рд░реЛрдВ рдорд╛рдкреЛрдВ рдХреА рдкрд░рд┐рднрд╛рд╖рд╛, рд╕реВрддреНрд░ рдФрд░ рдЧрдгрдирд╛ рдХреЛ рд╡рд┐рд╕реНрддрд╛рд░ рд╕реЗ рд╕рдордЭреЗрдВрдЧреЗред
1. рд╕реАрдорд╛ (Range)
рдкрд░рд┐рднрд╛рд╖рд╛
рд╕реАрдорд╛ (Range) рдкреНрд░рд╕рд░рдг рдХрд╛ рд╕рдмрд╕реЗ рд╕рд░рд▓ рдорд╛рдк рд╣реИред рдпрд╣ рдбреЗрдЯрд╛ рд╕реЗрдЯ рдореЗрдВ рдЕрдзрд┐рдХрддрдо рдФрд░ рдиреНрдпреВрдирддрдо рдорд╛рди рдХреЗ рдмреАрдЪ рдХреЗ рдЕрдВрддрд░ рдХреЛ рджрд░реНрд╢рд╛рддрд╛ рд╣реИред
рд╕реАрдорд╛ рдХрд╛ рд╕реВрддреНрд░
рд╕реАрдорд╛=рдЕрдзрд┐рдХрддрдо рдорд╛рдитИТрдиреНрдпреВрдирддрдо рдорд╛рди\text{рд╕реАрдорд╛} = \text{рдЕрдзрд┐рдХрддрдо рдорд╛рди} – \text{рдиреНрдпреВрдирддрдо рдорд╛рди}
рдЙрджрд╛рд╣рд░рдг 1: рдЕрд╕рдореВрд╣реАрдХреГрдд рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рд╕реАрдорд╛
рдорд╛рди рд▓реАрдЬрд┐рдП рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдбреЗрдЯрд╛ рд╣реИ: 5, 12, 20, 25, 30
рд╕реАрдорд╛=30тИТ5=25\text{рд╕реАрдорд╛} = 30 – 5 = 25
рдЙрджрд╛рд╣рд░рдг 2: рд╕рдореВрд╣реАрдХреГрдд рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рд╕реАрдорд╛
рдиреАрдЪреЗ рджрд┐рдпрд╛ рдЧрдпрд╛ рдбреЗрдЯрд╛ рджреЗрдЦреЗрдВ:
рд╡рд░реНрдЧ рдЕрдВрддрд░рд╛рд▓ | рдЖрд╡реГрддреНрддрд┐ (f) |
10 – 20 | 5 |
20 – 30 | 10 |
30 – 40 | 7 |
40 – 50 | 8 |
50 – 60 | 5 |
рд╕реАрдорд╛=60тИТ10=50\text{рд╕реАрдорд╛} = 60 – 10 = 50
рд╕реАрдорд╛ рдХреА рд╕реАрдорд╛рдПрдБ
- рдпрд╣ рдХреЗрд╡рд▓ рджреЛ рдЪрд░рдо рдорд╛рдиреЛрдВ рдкрд░ рдирд┐рд░реНрднрд░ рдХрд░рддрд╛ рд╣реИ, рдЬрд┐рд╕рд╕реЗ рдпрд╣ рдЖрдЙрдЯрд▓рд╛рдпрд░реНрд╕ (рдЪрд░рдо рдорд╛рдиреЛрдВ) рд╕реЗ рдкреНрд░рднрд╛рд╡рд┐рдд рд╣реЛрддрд╛ рд╣реИред
- рдпрд╣ рдбреЗрдЯрд╛ рдХреЗ рд╡рд┐рддрд░рдг рдХреА рдкреВрд░реА рдЬрд╛рдирдХрд╛рд░реА рдирд╣реАрдВ рджреЗрддрд╛ред
2. рдЪрддреБрд░реНрдердХ рд╡рд┐рдЪрд▓рди (Quartile Deviation – QD)
рдкрд░рд┐рднрд╛рд╖рд╛
рдЪрддреБрд░реНрдердХ рд╡рд┐рдЪрд▓рди (QD) рдпрд╣ рджрд░реНрд╢рд╛рддрд╛ рд╣реИ рдХрд┐ рдбреЗрдЯрд╛ рдХреЗ рдордзреНрдп 50% рдорд╛рди рдХрд┐рддрдиреЗ рдлреИрд▓реЗ рд╣реБрдП рд╣реИрдВред рдпрд╣ рддреАрд╕рд░реЗ рдЪрддреБрд░реНрдердХ (QтВГ) рдФрд░ рдкрд╣рд▓реЗ рдЪрддреБрд░реНрдердХ (QтВБ) рдХреЗ рдмреАрдЪ рдХрд╛ рдЕрдВрддрд░ рд╣реЛрддрд╛ рд╣реИ, рдЬрд┐рд╕реЗ рдЕрд░реНрджреНрдз-рдЪрддреБрд░реНрдердХ рдкрд░рд╛рд╕ (Semi-Interquartile Range) рднреА рдХрд╣рд╛ рдЬрд╛рддрд╛ рд╣реИред
рдЪрддреБрд░реНрдердХ рд╡рд┐рдЪрд▓рди рдХрд╛ рд╕реВрддреНрд░
QD=Q3тИТQ12\text{QD} = \frac{Q_3 – Q_1}{2}
рдЬрд╣рд╛рдБ:
- QтВБ (рдкреНрд░рдердо рдЪрддреБрд░реНрдердХ) = рд╡рд╣ рдорд╛рди рдЬрд┐рд╕рдХреЗ рдиреАрдЪреЗ 25% рдбреЗрдЯрд╛ рд╕реНрдерд┐рдд рд╣реЛрддрд╛ рд╣реИред
- QтВГ (рддреГрддреАрдп рдЪрддреБрд░реНрдердХ) = рд╡рд╣ рдорд╛рди рдЬрд┐рд╕рдХреЗ рдиреАрдЪреЗ 75% рдбреЗрдЯрд╛ рд╕реНрдерд┐рдд рд╣реЛрддрд╛ рд╣реИред
рдЙрджрд╛рд╣рд░рдг: рдЕрд╕рдореВрд╣реАрдХреГрдд рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП QD
рдорд╛рди рд▓реАрдЬрд┐рдП рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдбреЗрдЯрд╛ рд╣реИ: 10, 15, 20, 25, 30, 35, 40, 45, 50
- QтВБ рд╕реНрдерд╛рди = (N+1)4=(9+1)4=2.5\frac{(N+1)}{4} = \frac{(9+1)}{4} = 2.5
- QтВБ = 15 + 0.5 \times (20 – 15) = 17.5
- QтВГ рд╕реНрдерд╛рди = 3├Ч(N+1)4=3├Ч104=7.53 \times \frac{(N+1)}{4} = 3 \times \frac{10}{4} = 7.5
- QтВГ = 40 + 0.5 \times (45 – 40) = 42.5
QD=42.5тИТ17.52=252=12.5\text{QD} = \frac{42.5 – 17.5}{2} = \frac{25}{2} = 12.5
3. рдорд╛рдзреНрдп рдкрд░рд╛рд╕ рд╡рд┐рдЪрд▓рди (Mean Absolute Deviation – AD)
рдкрд░рд┐рднрд╛рд╖рд╛
рдорд╛рдзреНрдп рдкрд░рд╛рд╕ рд╡рд┐рдЪрд▓рди (AD) рдкреНрд░рддреНрдпреЗрдХ рдбреЗрдЯрд╛ рдмрд┐рдВрджреБ рдФрд░ рдорд╛рдзреНрдп (X╦Й\bar{X}) рдХреЗ рдмреАрдЪ рдФрд╕рдд рд╡рд┐рдЪрд▓рди рдХреЛ рдорд╛рдкрддрд╛ рд╣реИред
рдорд╛рдзреНрдп рдкрд░рд╛рд╕ рд╡рд┐рдЪрд▓рди рдХрд╛ рд╕реВрддреНрд░
AD=тИСтИгXтИТX╦ЙтИгN\text{AD} = \frac{\sum |X – \bar{X}|}{N}
рдЙрджрд╛рд╣рд░рдг: AD рдХреА рдЧрдгрдирд╛
рдбреЗрдЯрд╛: 5, 10, 15, 20, 25
- рдорд╛рдзреНрдп (X╦Й\bar{X}) рдирд┐рдХрд╛рд▓реЗрдВ:
X╦Й=5+10+15+20+255=15\bar{X} = \frac{5 + 10 + 15 + 20 + 25}{5} = 15
- рдкреНрд░рддреНрдпреЗрдХ рдорд╛рди рдХрд╛ рдорд╛рдзреНрдп рд╕реЗ рд╡рд┐рдЪрд▓рди рд▓реЗрдВ:
| X | тИгXтИТX╦ЙтИг|X – \bar{X}| | |—-|——————| | 5 | тИг5тИТ15тИг=10|5 – 15| = 10 | | 10 | тИг10тИТ15тИг=5|10 – 15| = 5 | | 15 | тИг15тИТ15тИг=0|15 – 15| = 0 | | 20 | тИг20тИТ15тИг=5|20 – 15| = 5 | | 25 | тИг25тИТ15тИг=10|25 – 15| = 10 |
- AD рдирд┐рдХрд╛рд▓реЗрдВ:
AD=(10+5+0+5+10)5=305=6\text{AD} = \frac{(10 + 5 + 0 + 5 + 10)}{5} = \frac{30}{5} = 6
4. рдорд╛рдирдХ рд╡рд┐рдЪрд▓рди (Standard Deviation – SD)
рдкрд░рд┐рднрд╛рд╖рд╛
рдорд╛рдирдХ рд╡рд┐рдЪрд▓рди (SD) рдбреЗрдЯрд╛ рдХреЗ рдорд╛рдзреНрдп рд╕реЗ рдФрд╕рдд рд╡рд┐рдЪрд▓рди рдХреЛ рджрд░реНрд╢рд╛рддрд╛ рд╣реИ рдФрд░ рдкреНрд░рд╕рд░рдг рдХрд╛ рд╕рдмрд╕реЗ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдорд╛рдк рд╣реИред
рдорд╛рдирдХ рд╡рд┐рдЪрд▓рди рдХрд╛ рд╕реВрддреНрд░
╧Г=тИС(XтИТX╦Й)2N\sigma = \sqrt{\frac{\sum (X – \bar{X})^2}{N}}
рдЙрджрд╛рд╣рд░рдг: SD рдХреА рдЧрдгрдирд╛
X | XтИТX╦ЙX – \bar{X} | (XтИТX╦Й)2(X – \bar{X})^2 |
5 | -10 | 100 |
10 | -5 | 25 |
15 | 0 | 0 |
20 | 5 | 25 |
25 | 10 | 100 |
╧Г2=(100+25+0+25+100)5=50\sigma^2 = \frac{(100 + 25 + 0 + 25 + 100)}{5} = 50 ╧Г=50тЙИ7.07\sigma = \sqrt{50} \approx 7.07
рдирд┐рд╖реНрдХрд░реНрд╖
рдкреНрд░рд╕рд░рдг рдХреЗ рдпреЗ рдорд╛рдк (Range, QD, AD, рдФрд░ SD) рдбреЗрдЯрд╛ рдХреЗ рдлреИрд▓рд╛рд╡ рдХреЛ рд╕рдордЭрдиреЗ рдореЗрдВ рдорджрдж рдХрд░рддреЗ рд╣реИрдВред
- рд╕реАрдорд╛ рд╕рд░рд▓ рд╣реИ, рд▓реЗрдХрд┐рди рдЪрд░рдо рдорд╛рдиреЛрдВ рд╕реЗ рдкреНрд░рднрд╛рд╡рд┐рдд рд╣реЛрддреА рд╣реИред
- рдЪрддреБрд░реНрдердХ рд╡рд┐рдЪрд▓рди рдордзреНрдп 50% рдбреЗрдЯрд╛ рдХреА рд╡рд┐рд╡рд┐рдзрддрд╛ рджрд┐рдЦрд╛рддрд╛ рд╣реИред
- рдорд╛рдзреНрдп рдкрд░рд╛рд╕ рд╡рд┐рдЪрд▓рди рдбреЗрдЯрд╛ рдХреА рд╡рд╛рд╕реНрддрд╡рд┐рдХ рджреВрд░реА рдХреЛ рджрд░реНрд╢рд╛рддрд╛ рд╣реИред
- рдорд╛рдирдХ рд╡рд┐рдЪрд▓рди рд╕рдмрд╕реЗ рд╕рдЯреАрдХ рдФрд░ рд╡реНрдпрд╛рдкрдХ рд░реВрдк рд╕реЗ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рдиреЗ рд╡рд╛рд▓рд╛ рдорд╛рдк рд╣реИред
рдпреЗ рдорд╛рдк рдЕрд░реНрдерд╢рд╛рд╕реНрддреНрд░, рд╡реНрдпрд╡рд╕рд╛рдп рдФрд░ рдЕрдиреБрд╕рдВрдзрд╛рди рдореЗрдВ рдорд╣рддреНрд╡рдкреВрд░реНрдг рднреВрдорд┐рдХрд╛ рдирд┐рднрд╛рддреЗ рд╣реИрдВред
UNIT-2(2.4) Measures of Variability: Calculation of Range, QD, AD, SD.
Introduction
In statistics, variability refers to the extent to which data points in a dataset differ from each other. While measures of central tendency (mean, median, and mode) provide information about the central value of a dataset, measures of variability describe how spread out or dispersed the data is.
The most commonly used measures of variability are:
- Range тАУ The difference between the maximum and minimum values.
- Quartile Deviation (QD) тАУ The spread of the middle 50% of the data.
- Mean Absolute Deviation (AD) тАУ The average of the absolute differences between each data point and the mean.
- Standard Deviation (SD) тАУ The most widely used measure, which tells us how much data deviates from the mean.
In this essay, we will discuss the meaning, formulas, and calculations of each measure with examples.
1. Range
Definition
The range is the simplest measure of variability. It is calculated as the difference between the highest and lowest values in a dataset.
Formula for Range
Range=Maximum ValueтИТMinimum Value\text{Range} = \text{Maximum Value} – \text{Minimum Value}
Example 1: Range for Ungrouped Data
Consider the dataset: 5, 12, 20, 25, 30
Range=30тИТ5=25\text{Range} = 30 – 5 = 25
Example 2: Range for Grouped Data
Consider the following grouped frequency distribution:
Class Interval | Frequency |
10 – 20 | 5 |
20 – 30 | 10 |
30 – 40 | 7 |
40 – 50 | 8 |
50 – 60 | 5 |
Range=60тИТ10=50\text{Range} = 60 – 10 = 50
Limitations of Range
- Affected by extreme values (outliers).
- Ignores the distribution of data between the maximum and minimum values.
2. Quartile Deviation (QD) or Semi-Interquartile Range
Definition
Quartile Deviation (QD) measures the spread of the middle 50% of the dataset. It is half the difference between the third quartile (QтВГ) and the first quartile (QтВБ).
Formula for Quartile Deviation
Quartile Deviation(QD)=Q3тИТQ12\text{Quartile Deviation} (QD) = \frac{Q_3 – Q_1}{2}
where:
- QтВБ (First Quartile) = The value below which 25% of the data lies.
- QтВГ (Third Quartile) = The value below which 75% of the data lies.
Example: QD for Ungrouped Data
Consider the dataset: 10, 15, 20, 25, 30, 35, 40, 45, 50
- QтВБ position = (N+1)4=(9+1)4=2.5\frac{(N+1)}{4} = \frac{(9+1)}{4} = 2.5
- QтВБ = (2nd value) + 0.5 ├Ч (3rd value – 2nd value)
- QтВБ = 15 + 0.5 ├Ч (20 – 15) = 17.5
- QтВГ position = 3├Ч(N+1)4=3├Ч104=7.53 \times \frac{(N+1)}{4} = 3 \times \frac{10}{4} = 7.5
- QтВГ = (7th value) + 0.5 ├Ч (8th value – 7th value)
- QтВГ = 40 + 0.5 ├Ч (45 – 40) = 42.5
QD=42.5тИТ17.52=252=12.5\text{QD} = \frac{42.5 – 17.5}{2} = \frac{25}{2} = 12.5
3. Mean Absolute Deviation (AD)
Definition
Mean Absolute Deviation (AD) is the average of the absolute differences between each data point and the mean. It is a measure of how much data varies from the mean.
Formula for Mean Absolute Deviation
For a dataset with values X1,X2,…,XNX_1, X_2, …, X_N:
AD=тИСтИгXтИТX╦ЙтИгN\text{AD} = \frac{\sum |X – \bar{X}|}{N}
where:
- X╦Й\bar{X} = Mean
- NN = Total number of observations
Example: AD Calculation
Consider the dataset: 5, 10, 15, 20, 25
- Calculate the mean:
X╦Й=5+10+15+20+255=15\bar{X} = \frac{5 + 10 + 15 + 20 + 25}{5} = 15
- Find absolute deviations from the mean:
| X | тИгXтИТX╦ЙтИг|X – \bar{X}| | |—-|——————| | 5 | тИг5тИТ15тИг=10|5 – 15| = 10 | | 10 | тИг10тИТ15тИг=5|10 – 15| = 5 | | 15 | тИг15тИТ15тИг=0|15 – 15| = 0 | | 20 | тИг20тИТ15тИг=5|20 – 15| = 5 | | 25 | тИг25тИТ15тИг=10|25 – 15| = 10 |
- Calculate AD:
AD=(10+5+0+5+10)5=305=6\text{AD} = \frac{(10 + 5 + 0 + 5 + 10)}{5} = \frac{30}{5} = 6
4. Standard Deviation (SD)
Definition
Standard Deviation (SD) measures the average deviation of values from the mean, considering squared differences.
Formula for Standard Deviation
For ungrouped data:
SD(╧Г)=тИС(XтИТX╦Й)2N\text{SD} (\sigma) = \sqrt{\frac{\sum (X – \bar{X})^2}{N}}
For grouped data:
SD(╧Г)=тИСf(XтИТX╦Й)2тИСf\text{SD} (\sigma) = \sqrt{\frac{\sum f(X – \bar{X})^2}{\sum f}}
Example: SD Calculation
Consider the dataset: 5, 10, 15, 20, 25
- Find the mean: X╦Й=15\bar{X} = 15
- Find squared deviations from the mean:
X | XтИТX╦ЙX – \bar{X} | (XтИТX╦Й)2(X – \bar{X})^2 |
5 | -10 | 100 |
10 | -5 | 25 |
15 | 0 | 0 |
20 | 5 | 25 |
25 | 10 | 100 |
- Calculate variance:
╧Г2=(100+25+0+25+100)5=2505=50\sigma^2 = \frac{(100 + 25 + 0 + 25 + 100)}{5} = \frac{250}{5} = 50
- Calculate SD:
╧Г=50тЙИ7.07\sigma = \sqrt{50} \approx 7.07
Conclusion
Measures of variability (Range, QD, AD, and SD) are essential to understand the spread of data.
- Range is simple but affected by outliers.
- Quartile Deviation focuses on the middle 50% of data.
- Mean Absolute Deviation gives a straightforward measure of dispersion.
- Standard Deviation is the most reliable measure, widely used in statistics and research.
Understanding these measures helps in making better decisions, especially in fields like economics, psychology, and business analytics.