Obsahuje súhrn čísel 5 odľahlé hodnoty?
Obsahuje súhrn čísel 5 odľahlé hodnoty?
Anonim

The Zhrnutie piatich čísel je metóda na zhrnutie distribúcie údajov. The päť čísel sú minimum, hodnota prvého kvartilu (Q1), medián, hodnota tretieho kvartilu (Q3) a maximum. Toto je veľmi odlišné od ostatných údajov. Je to odľahlé a musí sa odstrániť.

Čo sa týka tohto, z čoho pozostáva súhrn 5 čísel?

Päť- súhrny čísel A päť - zhrnutie čísla je obzvlášť užitočný pri deskriptívnych analýzach alebo počas predbežného skúmania veľkého súboru údajov. A zhrnutie pozostáva z päť hodnôt: najextrémnejšie hodnoty v súbore údajov (maximálne a minimálne hodnoty), dolný a horný kvartil a medián.

Tiež, ako zistíte, či je nové pozorovanie odľahlé? Niektoré z najpopulárnejších metód detekcie odľahlých hodnôt sú:

  1. Z-skóre alebo analýza extrémnych hodnôt (parametrická)
  2. Pravdepodobnostné a štatistické modelovanie (parametrické)
  3. Modely lineárnej regresie (PCA, LMS)
  4. Modely založené na blízkosti (neparametrické)
  5. Modely informačnej teórie.

Ako interpretujete medzikvartilový rozsah?

Interpretácia výsledkov: Kvartily a medzikvartilové rozpätie

  1. Percentily sú užitočné na vyjadrenie relatívneho postavenia jednotlivca v skupine.
  2. Medián je 50. percentil.
  3. Kvartily rozdeľujú údaje do štyroch skupín, z ktorých každá obsahuje rovnaký počet hodnôt.
  4. Rozdiel medzi 75. a 25. percentilom sa nazýva medzikvartilový rozsah.

Čo je pravidlo 1,5 IQR?

Použitie medzikvartilu Pravidlo nájsť odľahlé hodnoty Vynásobte medzikvartilový rozsah ( IQR ) od 1.5 (konštanta používaná na rozpoznanie odľahlých hodnôt). Pridať 1.5 X ( IQR ) do tretieho kvartilu. Akékoľvek číslo väčšie ako toto je podozrivá odľahlá hodnota. Odčítať 1.5 X ( IQR ) z prvého kvartilu. Akékoľvek číslo menšie ako toto je podozrivá odľahlá hodnota.

Odporúča: