Diferență între media, mediană și modul: media vs mediană vs mod

Anonim

Valorile medii, mediane și ale modului sunt măsurătorile principale ale tendinței centrale folosite în statisticile descriptive. Ele sunt complet diferite una de cealaltă, iar cazurile în care sunt utilizate pentru a rezuma datele sunt de asemenea diferite. Media

Media aritmetică este suma valorilor datelor împărțită la numărul de date, i. e.

Dacă datele provin dintr-un spațiu eșantion, se numește un eșantion mediu (

), care este o statistică descriptivă a eșantionului. Deși este cea mai frecvent folosită măsură descriptivă pentru un eșantion, nu este o statistică robustă. Este foarte sensibil la distorsiuni și oscilații.

De exemplu, ia în considerare venitul mediu al cetățenilor unui anumit oraș. Întrucât toate valorile datelor sunt însumate și apoi împărțite, venitul unei persoane extrem de bogate afectează în mod semnificativ media. Prin urmare, valorile medii nu reprezintă o reprezentare bună a datelor întotdeauna.

De asemenea, în cazul unui semnal alternativ, curentul care trece printr-un element variază periodic de la direcția pozitivă la direcția negativă și invers. Dacă luăm curentul mediu care trece prin element într-o singură perioadă, acesta va da 0, ceea ce înseamnă că nu a trecut nici un curent prin element, ceea ce, evident, nu este adevărat. Prin urmare, și în acest caz, media aritmetică nu este o măsură bună.

Media aritmetică este un indicator bun atunci când datele sunt distribuite uniform. Pentru o distribuție normală, media este egală cu modul și mediana. Ea are, de asemenea, cele mai mici reziduuri atunci când se ia în considerare eroarea medie rădăcină pătrată; prin urmare, cea mai bună măsură descriptivă atunci când este necesară reprezentarea unui set de date printr-un singur număr.

Median

Valorile punctului mediu de date după aranjarea tuturor valorilor datelor în ordine ascendentă sunt definite ca mediană a setului de date. Medianul este al doilea trimestru, al cincilea decil și al 50-lea percentil.

• Dacă numărul de observații (punctele de date) este ciudat, atunci valoarea mediană este observarea exactă în mijlocul listei ordonate.

• Dacă numărul de observații (punctele de date) este egal, atunci mediana este media celor două observații de mijloc din lista ordonată.

Mediana împarte observarea în două grupuri; i. e. un grup (50%) de valori mai mari și un grup (50%) de valori inferioare mediei. Medii sunt folosiți în mod specific în distribuții înclinate și reprezintă date destul de bune decât media aritmetică.

Modul

Modul este cel mai mare număr dintr-un set de observații.Modul unui set de date se calculează prin găsirea frecvenței fiecărui element din set.

• Dacă nici o valoare nu apare mai mult de o dată, atunci setul de date nu are niciun mod.

• În caz contrar, orice valoare care apare cu cea mai mare frecvență este un mod al setului de date.

Mai mult de 1 mod poate exista într-un set; prin urmare, modulul nu este o statistică unică a unui set de date. Într-o distribuție uniformă, există un mod. Modul de distribuție a probabilității discrete este punctul în care funcția de masă a probabilității atinge punctul său cel mai înalt. Realizând interpretările de mai sus, putem spune că

maximele globale sunt moduri. Luați în considerare aplicarea tuturor celor trei măsuri la următorul set de date.

DATE: {1, 1, 2, 3, 5, 5, 5, 5, 6, 8, 8, 9, 9, 9, 9, 15, 15, 15}

Media = (1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14 = 15 (15) 15) / 25 = 8. 12

Median = 9 (al 13-lea element)

Mod 9 = frecvența 9 = și Mod?

• Media aritmetică este suma valorilor (observațiilor) împărțită la numărul de observații. Nu este o statistică solidă și depinde în mare măsură de natura normală de distribuție în cadrul distribuției luate în considerare. O singură depășire poate provoca o schimbare semnificativă a valorii medii, dând valori relativ înșelătoare. Conceptul poate fi extins la media geometrică, media armonică, medie ponderată și așa mai departe.

• Mediana este valorile medii ale setului de observații și este relativ mai puțin afectată de valori extreme. Aceasta poate oferi o estimare bună ca statistică sumară în cazuri foarte înclinate.

• Modul este cea mai comună valoare de observare din setul de date. Dacă distribuția este înclinată pozitiv, modul se află lăsat la mediană și, dacă este negativ înclinat, modul se află în dreptul median.

• În cazul înclinării pozitive, media este corectă la mediană; dacă media negativă este în stânga mediană.

• În distribuția normală, toate cele trei, medie, mod și median sunt egale.