అవుట్లియర్ ఫార్ములా | స్టెప్ బై స్టెప్ లెక్కింపు అవుట్లియర్ (ఉదాహరణతో)
ఇచ్చిన పంపిణీ సమితి వెలుపల ఉన్న డేటాను లెక్కించడానికి అవుట్లియర్ ఫార్ములా ఒక గ్రాఫికల్ సాధనాన్ని అందిస్తుంది, ఇది వేరియబుల్లను బట్టి లోపలి లేదా బయటి వైపు ఉండవచ్చు.
అవుట్లియర్ ఫార్ములా అంటే ఏమిటి?
ఇచ్చిన నమూనా లేదా ఇచ్చిన పరిశీలన లేదా మొత్తం నమూనా వెలుపల ఉండే పంపిణీలో డేటా పాయింట్. మొదటి క్వార్టైల్ క్రింద లేదా మూడవ క్వార్టైల్ పైన 1.5 ఐక్యూఆర్ కంటే ఎక్కువ ఉంటే డేటా పాయింట్ అవుట్లియర్గా పరిగణించబడుతుందని సాధారణంగా ఉపయోగించే నియమం.
భిన్నంగా చెప్పాలంటే, తక్కువ అవుట్లెర్స్ Q1-1.5 IQRand కంటే తక్కువగా ఉంటాయి మరియు అధిక అవుట్లెర్స్ Q3 + 1.5IQR
IQR, Q1 మరియు Q3 తో సహా మధ్యస్థ, క్వార్టైల్స్ను లెక్కించాలి.
అవుట్లియర్ ఫార్ములా క్రింది విధంగా సూచించబడుతుంది,
Q1 = ¼ (n + 1) వ పదం యొక్క ఫార్ములాQ3 = ¾ (n + 1) వ పదం యొక్క ఫార్ములాQ2 = Q3 - Q1 కొరకు ఫార్ములా
స్టెప్ బై స్టెప్ లెక్కింపు అవుట్లియర్
అవుట్లియర్ను లెక్కించడానికి క్రింది దశలను అనుసరించాలి.
- దశ 1: మొదట క్వార్టిల్స్ అంటే Q1, Q2 మరియు ఇంటర్క్వార్టైల్ లెక్కించండి
- దశ 2: ఇప్పుడు Q2 * 1.5 విలువను లెక్కించండి
- దశ 3: ఇప్పుడు స్టెప్ 2 లో లెక్కించిన విలువ నుండి క్యూ 1 విలువను తీసివేయండి
- దశ 4: ఇక్కడ దశ 2 లో లెక్కించిన విలువతో Q3 ని జోడించండి
- దశ 5: దశ 3 మరియు దశ 4 లో లెక్కించిన విలువల పరిధిని సృష్టించండి
- దశ 6: డేటాను ఆరోహణ క్రమంలో అమర్చండి
- దశ 7: దశ 5 లో సృష్టించబడిన పరిధి కంటే దిగువ లేదా అంతకంటే ఎక్కువ విలువలు ఉన్నాయా అని తనిఖీ చేయండి
ఉదాహరణ
కింది సంఖ్యల డేటా సమితిని పరిగణించండి: 10, 2, 4, 7, 8, 5, 11, 3, 12. మీరు అన్ని అవుట్లియర్లను లెక్కించాలి.
పరిష్కారం:
మొదట, మనకు Q2 గా ఉండే మధ్యస్థాన్ని కనుగొనడానికి ఆరోహణ క్రమంలో డేటాను ఏర్పాటు చేయాలి.
2, 3, 4, 5, 7, 8, 10, 11, 12
ఇప్పుడు పరిశీలనల సంఖ్య 9 బేసి అయినందున, మధ్యస్థం 5 వ స్థానంలో ఉంటుంది, ఇది 7 మరియు అదే ఈ ఉదాహరణకి Q2 అవుతుంది.
కాబట్టి, Q1 యొక్క గణన క్రింది విధంగా ఉంటుంది -
Q1 = (9 + 1)
= ¼ (10)
Q1 ఉంటుంది -
Q1 = 2.5 పదం
Q1 ఇక్కడ 3 & 4 ఉన్న పరిశీలనల యొక్క 2 వ మరియు 3 వ స్థానం యొక్క సగటు మరియు అదే సగటు (3 + 4) / 2 = 3.5
కాబట్టి, Q3 యొక్క గణన క్రింది విధంగా ఉంటుంది -
Q3 = (9 + 1)
= ¾ (10)
Q3 ఉంటుంది -
Q3 = 7.5 పదం
Q3 ఇక్కడ 10 & 11 ఉన్న పరిశీలనల యొక్క 7 వ మరియు 8 వ స్థానం యొక్క సగటు మరియు అదే సగటు (10 + 11) / 2 = 10.5
ఇప్పుడు, తక్కువ అవుట్లెర్స్ Q1-1.5IQR కంటే తక్కువగా ఉంటాయి మరియు అధిక అవుట్లెర్స్ Q3 + 1.5IQR ని కలిగి ఉంటాయి
కాబట్టి, విలువలు 3.5 - (1.5 * 7) = -7 మరియు అధిక పరిధి 10.5 + (1.5 * 7) = 110.25.
110.25 మరియు -7 కన్నా ఎక్కువ లేదా అంతకంటే తక్కువ ఉన్న పరిశీలనలు లేనందున, ఈ నమూనాలో మాకు li ట్లెర్స్ లేరు.
ఎక్సెల్ లో అవుట్లియర్ ఫార్ములా యొక్క ఉదాహరణ (ఎక్సెల్ మూసతో)
మీరు ఈ అవుట్లియర్ ఫార్ములా ఎక్సెల్ మూసను ఇక్కడ డౌన్లోడ్ చేసుకోవచ్చు - అవుట్లియర్ ఫార్ములా ఎక్సెల్ మూస
క్రియేటివ్ కోచింగ్ తరగతులు టాప్ 25% లో ఉన్న విద్యార్థులకు బహుమతి ఇవ్వడాన్ని పరిశీలిస్తున్నాయి. డేటా 25 మంది విద్యార్థుల కోసం. అవుట్లియర్ ఉందో లేదో తెలుసుకోవడానికి అవుట్లియర్ సమీకరణాన్ని ఉపయోగించాలా?
పరిష్కారం:
అవుట్లియర్ను లెక్కించడానికి క్రింద డేటా ఇవ్వబడింది
ఇక్కడ పరిశీలనల సంఖ్య 25 మరియు మా మొదటి దశ ముడి డేటా పైన ఆరోహణ క్రమంలో మార్చబడుతుంది.
మధ్యస్థంగా ఉంటుంది -
మధ్యస్థ విలువ = ½ (n + 1)
= ½ = ½ (26)
= 13 వ పదం
Q2 లేదా మధ్యస్థం 68.00
ఇది జనాభాలో 50%.
Q1 ఉంటుంది -
Q1 = ¼ (n + 1) వ పదం
= ¼ (25+1)
= ¼ (26)
= 6.5 వ పదం ఇది 7 వ పదానికి సమానం
క్యూ 1 56.00, ఇది దిగువ 25%
Q3 ఉంటుంది -
చివరగా, Q3 = ¾ (n + 1) వ పదం
= ¾ (26)
= 19.50 పదం
ఇక్కడ సగటు తీసుకోవలసిన అవసరం ఉంది, ఇది 19 మరియు 20 పదాలను 77 మరియు 77 మరియు అదే సగటు (77 + 77) / 2 = 77.00
క్యూ 3 77, ఇది టాప్ 25%
తక్కువ పరిధి
ఇప్పుడు, తక్కువ అవుట్లెర్స్ Q1-1.5IQR కంటే తక్కువగా ఉంటాయి మరియు అధిక అవుట్లెర్స్ Q3 + 1.5IQR ని కలిగి ఉంటాయి
అధిక శ్రేణి -
కాబట్టి, విలువలు 56 - (1.5 * 68) = -46 మరియు అధిక పరిధి 77 + (1.5 * 68) = 179.
అవుట్లెర్స్ లేరు.
Lev చిత్యం మరియు ఉపయోగాలు
Value ట్లియర్స్ ఫార్ములా తెలుసుకోవడం చాలా ముఖ్యం ఎందుకంటే అలాంటి విలువతో వక్రీకరించే డేటా ఉండవచ్చు. 2, 4, 6, 101 పరిశీలనల యొక్క ఉదాహరణను తీసుకోండి మరియు ఇప్పుడు ఎవరైనా ఈ విలువలను సగటున తీసుకుంటే అది 28.25 అవుతుంది, కానీ 75% పరిశీలనలు 7 కంటే తక్కువగా ఉంటాయి మరియు అందువల్ల ఈ నమూనా యొక్క పరిశీలనలకు సంబంధించి తప్పు నిర్ణయం అవుతుంది.
101 స్పష్టంగా రూపురేఖలు కనబడుతుందని ఇక్కడ గమనించవచ్చు మరియు ఇది తీసివేయబడితే సగటు 4 అవుతుంది, అవి 4 పరిధిలో ఉన్న విలువలు లేదా పరిశీలనల గురించి చెబుతాయి. అందువల్ల ఈ గణనను నివారించడం చాలా ముఖ్యం డేటా యొక్క ఏదైనా దుర్వినియోగం ప్రముఖ సమాచారం. ప్రపంచవ్యాప్తంగా గణాంకవేత్తలు ఏదైనా పరిశోధన చేస్తున్నప్పుడు వీటిని విస్తృతంగా ఉపయోగిస్తున్నారు.