Jinsi ya kugundua wauzaji wa nje: Hatua 10 (na Picha)

Orodha ya maudhui:

Jinsi ya kugundua wauzaji wa nje: Hatua 10 (na Picha)
Jinsi ya kugundua wauzaji wa nje: Hatua 10 (na Picha)

Video: Jinsi ya kugundua wauzaji wa nje: Hatua 10 (na Picha)

Video: Jinsi ya kugundua wauzaji wa nje: Hatua 10 (na Picha)
Video: GAMONDI ATOA DAKIKA 5 ZA KUCHEZEA MPIRA/SKUDU NA AZIZ KI WAKIWASHA. 2024, Mei
Anonim

Katika takwimu, nje au "nje" ni datum ambayo hupotoka mbali sana na datu nyingine yoyote ndani ya sampuli au seti ya datum (seti ya datum inaitwa data). Mara nyingi, anayeuza nje katika seti ya datum anaweza kuwa onyo kwa mtaalam wa takwimu wa makosa ya kawaida au ya majaribio katika vipimo vilivyochukuliwa, ambavyo vinaweza kusababisha mtakwimu kuondoa mtoaji kutoka kwa seti ya datum. Ikiwa mtaalam wa takwimu ataondoa wauzaji kutoka kwa seti, hitimisho linalopatikana kutoka kwa utafiti linaweza kuwa tofauti sana. Kwa hivyo, kujua jinsi ya kuhesabu na kuchambua wauzaji ni muhimu sana kuhakikisha uelewa sahihi wa seti ya takwimu.

Hatua

Fanya mahesabu ya wauzaji hatua ya 1
Fanya mahesabu ya wauzaji hatua ya 1

Hatua ya 1. Jifunze jinsi ya kutambua datums zinazoweza kutokea nje

Kabla ya kuamua ikiwa kuondoa datums za nje kutoka kwa seti hiyo au la, kwa kweli lazima tugundue ni damu zipi zinazoweza kuwa nje. Kwa ujumla, mtangazaji nje ni datum ambayo hupotoka mbali sana na datum zingine kwenye seti moja - kwa maneno mengine, nje ni "nje" ya datum zingine. Kawaida ni rahisi kugundua wauzaji nje kwenye jedwali la data au (haswa) grafu. Ikiwa seti moja ya datu imeelezewa kwa muonekano na grafu, datum ya nje itaonekana kuwa "mbali sana" kutoka kwa damu zingine. Ikiwa, kwa mfano, datum nyingi katika seti ya datum zinaunda laini moja kwa moja, datum ya nje haitatafsiriwa kuwa inaunda mstari huo.

Wacha tuangalie seti ya datums inayowakilisha hali ya joto ya vitu 12 tofauti kwenye chumba. Ikiwa vitu 11 vina joto la karibu 70 Fahrenheit (21 digrii Celsius), lakini kitu cha 12, oveni, kina joto la 300 Fahrenheit (digrii 150 Celsius), inaweza kuonekana mara moja kuwa joto la oveni lina uwezekano wa kuwa nje

Mahesabu ya Uuzaji Hatua ya 2
Mahesabu ya Uuzaji Hatua ya 2

Hatua ya 2. Panga datum kwenye seti ya nambari kutoka chini hadi juu

Hatua ya kwanza ya kuhesabu wauzaji nje katika seti ya datum ni kupata wastani (thamani ya kati) ya seti hiyo ya datum. Kazi hii inakuwa rahisi sana ikiwa datum katika seti ya datum imepangwa kutoka ndogo hadi kubwa. Kwa hivyo, kabla ya kuendelea, panga datum katika seti moja kama hizo.

Wacha tuendelee na mfano hapo juu. Hii ni seti yetu ya datums inayowakilisha hali ya joto ya vitu kadhaa kwenye chumba: {71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}. Ikiwa tunapanga datum kutoka kwa chini kabisa hadi juu, utaratibu wa datum huwa: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}

Hesabu Vifurushi hatua 3
Hesabu Vifurushi hatua 3

Hatua ya 3. Hesabu wastani wa seti ya datum

Wastani wa seti ya datu ni datu ambapo nusu nyingine ya datu iko juu ya hiyo damu na nusu iliyobaki iko chini yake-kimsingi, datum hiyo ni datum ambayo iko "katikati" ya seti ya datum. Ikiwa idadi ya datum kwenye seti ya datum ni isiyo ya kawaida, ni rahisi kupata-wastani ni datum ambayo ina nambari sawa hapo juu na chini yake. Walakini, ikiwa idadi ya datum kwenye seti ya datum ni sawa, basi, kwa sababu hakuna datum moja inayofaa katikati, datum 2 katikati zimepimwa kupata wastani. Ikumbukwe kwamba, wakati wa kuhesabu wauzaji nje, wastani hupewa Q2-ni inayobadilika kwa sababu Q2 iko kati ya Q1 na Q3, quartile ya chini na ya juu, ambayo tutajadili baadaye.

  • Sio kuchanganyikiwa na seti ya datum ambapo idadi ya datum ni sawa-wastani wa datum 2 katikati mara nyingi itarudisha nambari ambayo haipo kwenye datum yenyewe-hii ni sawa. Walakini, ikiwa datum 2 katikati ni nambari sawa, wastani, kwa kweli, pia itakuwa nambari ile ile, ambayo pia ni sawa.
  • Katika mfano hapo juu, tuna datums 12. Datum 2 kati ni datums 6 na 7-70 na 71 mtawaliwa. Kwa hivyo, wastani wa seti ya datum ni wastani wa nambari hizi 2: ((70 + 71) / 2), = 70.5.
Mahesabu ya Uuzaji Hatua ya 4
Mahesabu ya Uuzaji Hatua ya 4

Hatua ya 4. Mahesabu ya quartile ya chini

Thamani hii, ambayo tunatoa Q1 inayobadilika, ni datum ambayo inawakilisha asilimia 25 (au robo) ya datum. Kwa maneno mengine, ni datum ambayo inachambua datum zilizo chini ya wastani. Ikiwa idadi ya datum chini ya wastani ni sawa, lazima tena wastani wastani 2 katikati ili upate Q1, kama vile unavyoweza kupata median yenyewe.

Katika mfano wetu, kuna datums 6 ambazo ziko juu ya wastani, na datum 6 ambazo ziko chini ya wastani. Hii inamaanisha kuwa, kupata quartile ya chini, tutahitaji wastani wa datums 2 katikati ya datums 6 chini ya wastani. Damu 3 na 4 ya datum 6 chini ya wastani wote ni 70. Kwa hivyo, wastani ni ((70 + 70) / 2), = 70. 70 inakuwa Q1 yetu.

Mahesabu ya Wauzaji Hatua ya 5
Mahesabu ya Wauzaji Hatua ya 5

Hatua ya 5. Mahesabu ya quartile ya juu

Thamani hii, ambayo tunatoa Q3 inayobadilika, ni datum ambayo kuna asilimia 25 ya datum kwenye seti ya datum. Kupata Q3 ni sawa na kutafuta Q1, isipokuwa kwamba, katika kesi hii, tunaangalia datums juu ya wastani, sio chini ya wastani.

Kuendelea na mfano wetu hapo juu, datum 2 katikati ya datum 6 juu ya wastani ni 71 na 72. Wastani wa hizi datum 2 ni ((71 + 72) / 2), = 71, 5. 71, 5 kuwa Q3 yetu.

Hesabu Vifurushi Hatua ya 6
Hesabu Vifurushi Hatua ya 6

Hatua ya 6. Pata umbali wa interquartile

Sasa kwa kuwa tumepata Q1 na Q3, tunahitaji kuhesabu umbali kati ya anuwai hizi mbili. Umbali kutoka Q1 hadi Q3 unapatikana kwa kutoa Q1 kutoka Q3. Maadili unayopata kwa umbali wa interquartile ni muhimu sana kwa kufafanua mipaka ya datum zisizo za nje katika seti yako ya datum.

  • Katika mfano wetu, maadili yetu ya Q1 na Q3 ni 70 na 71, 5. Ili kupata umbali wa interquartile, tunaondoa Q3 - Q1 = 71.5 - 70 = 1, 5.
  • Ikumbukwe kwamba hii ni kweli hata kama Q1, Q3, au zote ni nambari hasi. Kwa mfano, ikiwa thamani yetu ya Q1 ilikuwa -70, umbali wetu sahihi wa interquartile itakuwa 71.5 - (-70) = 141, 5.
Hesabu wauzaji Hatua ya 7
Hesabu wauzaji Hatua ya 7

Hatua ya 7. Pata "uzio wa ndani" katika seti ya datum

Wauzaji hupatikana kwa kuangalia ikiwa datum iko ndani ya mipaka ya nambari inayoitwa "uzio wa ndani" na "uzio wa nje". Datum inayoanguka nje ya uzio wa ndani wa seti hiyo inajulikana kama "muuzaji mdogo", wakati datum inayoanguka nje ya uzio wa nje inajulikana kama "muuzaji mkubwa". Ili kupata uzio wa ndani kwenye seti yako ya datum, kwanza ongeza umbali wa interquartile kwa 1, 5. Kisha, ongeza matokeo kwa Q3 na pia uiondoe kutoka Q1. Thamani mbili unazopata ni mipaka ya uzio wa ndani ya seti yako ya datum.

  • Katika mfano wetu, umbali wa interquartile ni (71.5 - 70), au 1.5. Zidisha 1.5 kwa 1.5 ambayo inasababisha 2.25. Tunaongeza nambari hii kwa Q3 na tunatoa Q1 kwa nambari hii kupata mipaka ya uzio wa ndani kama ifuatavyo:

    • 71, 5 + 2, 25 = 73, 75
    • 70 - 2, 25 = 67, 75
    • Kwa hivyo, mipaka ya uzio wetu wa ndani ni 67, 75 na 73, 75.
  • Katika seti yetu ya datum, joto la oveni tu, 300 Fahrenheit - liko nje ya mipaka hii na kwa hivyo datum hii ni ya nje kidogo. Walakini, bado hatujahesabu ikiwa joto hili ni kubwa zaidi, kwa hivyo usiruke kwa hitimisho hadi tuwe tumefanya mahesabu yetu.

    Mahesabu ya Uuzaji Hatua ya 7 Bullet2
    Mahesabu ya Uuzaji Hatua ya 7 Bullet2
Hesabu Vifurushi Hatua ya 8
Hesabu Vifurushi Hatua ya 8

Hatua ya 8. Pata "uzio wa nje" kwenye seti ya datum

Hii imefanywa kwa njia ile ile ya kutafuta uzio wa ndani, isipokuwa kwamba umbali wa interquartile huzidishwa na 3 badala ya 1.5. Matokeo yake huongezwa kwa Q3 na kutolewa kutoka Q1 kupata mipaka ya juu na chini ya uzio wa nje.

  • Katika mfano wetu, kuzidisha umbali wa interquartile na 3 inatoa (1, 5 x 3), au 4, 5. Tunapata mipaka ya uzio wa nje kwa njia ile ile kama hapo awali:

    • 71, 5 + 4, 5 = 76
    • 70 - 4, 5 = 65, 5
    • Mipaka ya uzio wa nje ni 65.5 na 76.
  • Datums ambazo ziko nje ya mpaka wa uzio wa nje hujulikana kama wauzaji wakuu. Katika mfano huu, joto la oveni, 300 Fahrenheit, iko wazi nje ya uzio wa nje, kwa hivyo datum hii "dhahiri" ni kubwa zaidi.

    Mahesabu ya Uuzaji Hatua ya 8 Bullet2
    Mahesabu ya Uuzaji Hatua ya 8 Bullet2
Hesabu wauzaji Hatua ya 9
Hesabu wauzaji Hatua ya 9

Hatua ya 9. Tumia uamuzi wa ubora kuamua ikiwa "kutupilia mbali" datum ya nje au la

Kutumia njia iliyoelezewa hapo juu, inaweza kuamua ikiwa datum ni datum ndogo, datum kubwa, au sio nje kabisa. Walakini, usifanye makosa-kupata datum kama ya nje inaashiria tu kwamba datum kama "mgombea" aondolewe kutoka kwa seti hiyo, sio kama datum ambayo "inapaswa" kutupwa. "Sababu" ambayo husababisha datum ya nje kutoka kwa datum nyingine katika seti ya datum ni muhimu sana katika kuamua ikiwa kuiondoa au la. Kwa ujumla, mtangazaji anayesababishwa na makosa katika upimaji, kurekodi, au upangaji wa majaribio, kwa mfano-anaweza kutupwa. Kwa upande mwingine, wafanyabiashara wa nje ambao hawajasababishwa na makosa na ambayo yanaonyesha habari mpya au mielekeo ambayo haikutabiriwa hapo awali kawaida "hawajatupwa".

  • Kigezo kingine cha kuzingatia ni ikiwa mtoaji ana athari kubwa kwa maana ya seti ya datum, i.e. ikiwa muuzaji anaichanganya au anaifanya ionekane si sawa. Hii ni muhimu kuzingatia ikiwa una nia ya kupata hitimisho kutoka kwa wastani wa seti yako ya data.
  • Wacha tujifunze mfano wetu. Katika mfano huu, kwa kuwa inaonekana "haiwezekani" kwamba oveni ilifikia 300 Fahrenheit kupitia nguvu za asili zisizotabirika, tunaweza kuhitimisha kwa hakika kuwa oveni iliachwa kwa bahati mbaya, na kusababisha datum isiyo ya kawaida ya joto la juu. Pia, ikiwa hatutaondoa wauzaji wa nje, datum yetu inamaanisha ni (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73 + 300) / 12 = 89.67 Fahrenheit (nyuzi 32 Celsius), wakati wastani ikiwa tunaondoa wauzaji ni (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73) / 11 = 70.55 Fahrenheit (21 digrii Celsius).

    Kwa kuwa bidhaa hizi zilisababishwa na makosa ya kibinadamu na kwa sababu haingekuwa sawa kusema kwamba joto la kawaida la chumba hufikia karibu 90 Fahrenheit (digrii 32 za Celsius), sisi ni bora kuchagua "kutupa" wauzaji wetu

Hesabu wauzaji Hatua ya 10
Hesabu wauzaji Hatua ya 10

Hatua ya 10. Jua umuhimu (wakati mwingine) wa kutunza wauzaji

Ingawa wauzaji wengine wanapaswa kuondolewa kutoka kwa seti kwa sababu husababisha makosa na / au hufanya matokeo kuwa sahihi au yenye makosa, baadhi ya wauzaji wanapaswa kudumishwa. Ikiwa, kwa mfano, mtangazaji anaonekana kupatikana kwa asili (ambayo sio matokeo ya kosa) na / au hutoa mtazamo mpya juu ya jambo linalojifunza, mtangazaji haipaswi kuondolewa kwenye seti ya datum. Utafiti wa kisayansi kawaida ni hali nyeti sana linapokuja suala la wauzaji wa nje - kuondoa visivyo sahihi kunaweza kumaanisha kutupa habari ambayo inaonyesha mwenendo mpya au ugunduzi.

Kwa mfano, wacha tuseme tunabuni dawa mpya ili kuongeza saizi ya samaki kwenye bwawa la samaki. Tutatumia seti yetu ya zamani ya datums (kwa gramu) baada ya kupewa dawa tofauti ya majaribio kutoka kuzaliwa. Kwa maneno mengine, dawa ya kwanza husababisha samaki mmoja kupima gramu 71, dawa ya pili husababisha samaki mwingine awe na gramu 70, na kadhalika. Katika kesi hii, 300 bado "bado" ni kubwa zaidi, lakini hatupaswi kutupa datum hii kwa sababu, tukidhani kwamba ilipatikana bila kosa, inawakilisha mafanikio katika utafiti. Dawa inayoweza kutengeneza samaki ina uzito wa gramu 300 inafanya kazi vizuri kuliko dawa zingine zote, kwa hivyo datum hii ndio "muhimu zaidi" katika seti yetu ya datum, sio "muhimu sana"

Ilipendekeza: