అవుట్‌లియర్ ఫార్ములా | స్టెప్ బై స్టెప్ లెక్కింపు అవుట్‌లియర్ (ఉదాహరణతో)

ఇచ్చిన పంపిణీ సమితి వెలుపల ఉన్న డేటాను లెక్కించడానికి అవుట్‌లియర్ ఫార్ములా ఒక గ్రాఫికల్ సాధనాన్ని అందిస్తుంది, ఇది వేరియబుల్‌లను బట్టి లోపలి లేదా బయటి వైపు ఉండవచ్చు.

అవుట్‌లియర్ ఫార్ములా అంటే ఏమిటి?

ఇచ్చిన నమూనా లేదా ఇచ్చిన పరిశీలన లేదా మొత్తం నమూనా వెలుపల ఉండే పంపిణీలో డేటా పాయింట్. మొదటి క్వార్టైల్ క్రింద లేదా మూడవ క్వార్టైల్ పైన 1.5 ఐక్యూఆర్ కంటే ఎక్కువ ఉంటే డేటా పాయింట్ అవుట్‌లియర్‌గా పరిగణించబడుతుందని సాధారణంగా ఉపయోగించే నియమం.

భిన్నంగా చెప్పాలంటే, తక్కువ అవుట్‌లెర్స్ Q1-1.5 IQRand కంటే తక్కువగా ఉంటాయి మరియు అధిక అవుట్‌లెర్స్ Q3 + 1.5IQR

IQR, Q1 మరియు Q3 తో సహా మధ్యస్థ, క్వార్టైల్స్‌ను లెక్కించాలి.

అవుట్‌లియర్ ఫార్ములా క్రింది విధంగా సూచించబడుతుంది,

Q1 = ¼ (n + 1) వ పదం యొక్క ఫార్ములాQ3 = ¾ (n + 1) వ పదం యొక్క ఫార్ములాQ2 = Q3 - Q1 కొరకు ఫార్ములా

స్టెప్ బై స్టెప్ లెక్కింపు అవుట్‌లియర్

అవుట్‌లియర్‌ను లెక్కించడానికి క్రింది దశలను అనుసరించాలి.

  • దశ 1: మొదట క్వార్టిల్స్ అంటే Q1, Q2 మరియు ఇంటర్‌క్వార్టైల్ లెక్కించండి
  • దశ 2: ఇప్పుడు Q2 * 1.5 విలువను లెక్కించండి
  • దశ 3: ఇప్పుడు స్టెప్ 2 లో లెక్కించిన విలువ నుండి క్యూ 1 విలువను తీసివేయండి
  • దశ 4: ఇక్కడ దశ 2 లో లెక్కించిన విలువతో Q3 ని జోడించండి
  • దశ 5: దశ 3 మరియు దశ 4 లో లెక్కించిన విలువల పరిధిని సృష్టించండి
  • దశ 6: డేటాను ఆరోహణ క్రమంలో అమర్చండి
  • దశ 7: దశ 5 లో సృష్టించబడిన పరిధి కంటే దిగువ లేదా అంతకంటే ఎక్కువ విలువలు ఉన్నాయా అని తనిఖీ చేయండి

ఉదాహరణ

కింది సంఖ్యల డేటా సమితిని పరిగణించండి: 10, 2, 4, 7, 8, 5, 11, 3, 12. మీరు అన్ని అవుట్‌లియర్‌లను లెక్కించాలి.

పరిష్కారం:

మొదట, మనకు Q2 గా ఉండే మధ్యస్థాన్ని కనుగొనడానికి ఆరోహణ క్రమంలో డేటాను ఏర్పాటు చేయాలి.

2, 3, 4, 5, 7, 8, 10, 11, 12

ఇప్పుడు పరిశీలనల సంఖ్య 9 బేసి అయినందున, మధ్యస్థం 5 వ స్థానంలో ఉంటుంది, ఇది 7 మరియు అదే ఈ ఉదాహరణకి Q2 అవుతుంది.

కాబట్టి, Q1 యొక్క గణన క్రింది విధంగా ఉంటుంది -

Q1 = (9 + 1)

= ¼ (10)

Q1 ఉంటుంది -

Q1 = 2.5 పదం

Q1 ఇక్కడ 3 & 4 ఉన్న పరిశీలనల యొక్క 2 వ మరియు 3 వ స్థానం యొక్క సగటు మరియు అదే సగటు (3 + 4) / 2 = 3.5

కాబట్టి, Q3 యొక్క గణన క్రింది విధంగా ఉంటుంది -

Q3 = (9 + 1)

= ¾ (10)

Q3 ఉంటుంది -

Q3 = 7.5 పదం

Q3 ఇక్కడ 10 & 11 ఉన్న పరిశీలనల యొక్క 7 వ మరియు 8 వ స్థానం యొక్క సగటు మరియు అదే సగటు (10 + 11) / 2 = 10.5

ఇప్పుడు, తక్కువ అవుట్‌లెర్స్ Q1-1.5IQR కంటే తక్కువగా ఉంటాయి మరియు అధిక అవుట్‌లెర్స్ Q3 + 1.5IQR ని కలిగి ఉంటాయి

కాబట్టి, విలువలు 3.5 - (1.5 * 7) = -7 మరియు అధిక పరిధి 10.5 + (1.5 * 7) = 110.25.

110.25 మరియు -7 కన్నా ఎక్కువ లేదా అంతకంటే తక్కువ ఉన్న పరిశీలనలు లేనందున, ఈ నమూనాలో మాకు li ట్‌లెర్స్ లేరు.

ఎక్సెల్ లో అవుట్‌లియర్ ఫార్ములా యొక్క ఉదాహరణ (ఎక్సెల్ మూసతో)

మీరు ఈ అవుట్‌లియర్ ఫార్ములా ఎక్సెల్ మూసను ఇక్కడ డౌన్‌లోడ్ చేసుకోవచ్చు - అవుట్‌లియర్ ఫార్ములా ఎక్సెల్ మూస

క్రియేటివ్ కోచింగ్ తరగతులు టాప్ 25% లో ఉన్న విద్యార్థులకు బహుమతి ఇవ్వడాన్ని పరిశీలిస్తున్నాయి. డేటా 25 మంది విద్యార్థుల కోసం. అవుట్‌లియర్ ఉందో లేదో తెలుసుకోవడానికి అవుట్‌లియర్ సమీకరణాన్ని ఉపయోగించాలా?

పరిష్కారం:

అవుట్‌లియర్‌ను లెక్కించడానికి క్రింద డేటా ఇవ్వబడింది

ఇక్కడ పరిశీలనల సంఖ్య 25 మరియు మా మొదటి దశ ముడి డేటా పైన ఆరోహణ క్రమంలో మార్చబడుతుంది.

మధ్యస్థంగా ఉంటుంది -

మధ్యస్థ విలువ = ½ (n + 1)

= ½ = ½ (26)

= 13 వ పదం

Q2 లేదా మధ్యస్థం 68.00

ఇది జనాభాలో 50%.

Q1 ఉంటుంది -

Q1 = ¼ (n + 1) వ పదం

= ¼ (25+1)

= ¼ (26)

= 6.5 వ పదం ఇది 7 వ పదానికి సమానం

క్యూ 1 56.00, ఇది దిగువ 25%

Q3 ఉంటుంది -

చివరగా, Q3 = ¾ (n + 1) వ పదం

= ¾ (26)

= 19.50 పదం

ఇక్కడ సగటు తీసుకోవలసిన అవసరం ఉంది, ఇది 19 మరియు 20 పదాలను 77 మరియు 77 మరియు అదే సగటు (77 + 77) / 2 = 77.00

 క్యూ 3 77, ఇది టాప్ 25%

తక్కువ పరిధి

ఇప్పుడు, తక్కువ అవుట్‌లెర్స్ Q1-1.5IQR కంటే తక్కువగా ఉంటాయి మరియు అధిక అవుట్‌లెర్స్ Q3 + 1.5IQR ని కలిగి ఉంటాయి

అధిక శ్రేణి -

కాబట్టి, విలువలు 56 - (1.5 * 68) = -46 మరియు అధిక పరిధి 77 + (1.5 * 68) = 179.

అవుట్‌లెర్స్ లేరు.

Lev చిత్యం మరియు ఉపయోగాలు

Value ట్‌లియర్స్ ఫార్ములా తెలుసుకోవడం చాలా ముఖ్యం ఎందుకంటే అలాంటి విలువతో వక్రీకరించే డేటా ఉండవచ్చు. 2, 4, 6, 101 పరిశీలనల యొక్క ఉదాహరణను తీసుకోండి మరియు ఇప్పుడు ఎవరైనా ఈ విలువలను సగటున తీసుకుంటే అది 28.25 అవుతుంది, కానీ 75% పరిశీలనలు 7 కంటే తక్కువగా ఉంటాయి మరియు అందువల్ల ఈ నమూనా యొక్క పరిశీలనలకు సంబంధించి తప్పు నిర్ణయం అవుతుంది.

101 స్పష్టంగా రూపురేఖలు కనబడుతుందని ఇక్కడ గమనించవచ్చు మరియు ఇది తీసివేయబడితే సగటు 4 అవుతుంది, అవి 4 పరిధిలో ఉన్న విలువలు లేదా పరిశీలనల గురించి చెబుతాయి. అందువల్ల ఈ గణనను నివారించడం చాలా ముఖ్యం డేటా యొక్క ఏదైనా దుర్వినియోగం ప్రముఖ సమాచారం. ప్రపంచవ్యాప్తంగా గణాంకవేత్తలు ఏదైనా పరిశోధన చేస్తున్నప్పుడు వీటిని విస్తృతంగా ఉపయోగిస్తున్నారు.