
Σε μια διανομή δεδομένων, οι δείκτες διασποράς παίζουν πολύ σημαντικό ρόλο. Αυτές οι μετρήσεις συμπληρώνουν αυτές της λεγόμενης κεντρικής θέσης χαρακτηρίζοντας τη μεταβλητότητα των δεδομένων.
Ο δείκτες διασποράς συμπληρώνουν εκείνα της κεντρικής τάσης. Είναι επίσης απαραίτητα σε μια διανομή δεδομένων. Αυτό συμβαίνει γιατί χαρακτηρίζουν τη μεταβλητότητά του. Η συνάφειά τους στη στατιστική κατάρτιση τονίστηκε από τους Wild και Pfannkuch (1999).
Η αντίληψη της μεταβλητότητας των δεδομένων είναι ένα από τα βασικά συστατικά της στατιστικής σκέψης καθώς μας παρέχει πληροφορίες για τη διασπορά των δεδομένων σε σχέση με έναν μέσο όρο.
Η ερμηνεία του μέσου όρου
Ο αριθμητικός μέσος όρος χρησιμοποιείται ευρέως στην πράξη, αλλά συχνά μπορεί να παρερμηνευθεί. Αυτό συμβαίνει όταν οι τιμές των μεταβλητών είναι πολύ αραιές. Σε αυτές τις περιπτώσεις είναι απαραίτητο να συνοδεύονται οι μέσοι δείκτες διασποράς (2).
Οι δείκτες διασποράς έχουν τρία σημαντικά στοιχεία που σχετίζονται με την τυχαία μεταβλητότητα (2):
- Η αντίληψη της πανταχού παρουσίας του στον κόσμο γύρω μας.
- Ο διαγωνισμός για την εξήγησή του.
- Η ικανότητα ποσοτικοποίησής του (που συνεπάγεται κατανόηση και γνώση της εφαρμογής της έννοιας της διασποράς).

Σε τι χρησιμεύουν οι δείκτες διασποράς;
Όταν είναι απαραίτητη η γενίκευση των δεδομένων ενός δείγματος ενός πληθυσμού Οι δείκτες διασποράς είναι πολύ σημαντικοί καθώς επηρεάζουν άμεσα το σφάλμα με το οποίο εργαζόμαστε . Όσο περισσότερη διασπορά συλλέξουμε σε ένα δείγμα τόσο μεγαλύτερο είναι το μέγεθος που χρειαζόμαστε για να δουλέψουμε με το ίδιο σφάλμα.
Από την άλλη, αυτοί οι δείκτες μας βοηθούν να προσδιορίσουμε εάν τα δεδομένα μας απέχουν πολύ από την κεντρική τιμή. Μας λένε εάν αυτή η κεντρική τιμή είναι επαρκής για να αντιπροσωπεύσει τον πληθυσμό της μελέτης. Αυτό είναι πολύ χρήσιμο για τη σύγκριση διανομών και κατανοώ κινδύνους στη διαδικασία λήψης αποφάσεων (1).
Αυτοί οι λόγοι είναι πολύ χρήσιμοι για τη σύγκριση των διανομών και την κατανόηση των κινδύνων στη λήψη αποφάσεων. Όσο μεγαλύτερη είναι η διασπορά, τόσο λιγότερο αντιπροσωπευτική είναι η κεντρική τιμή .
Τα πιο χρησιμοποιημένα είναι:
- Σειρά.
- Στατιστική απόκλιση .
- Διακύμανση.
- Τυπική ή τυπική απόκλιση.
- Συντελεστής διακύμανσης.
Συναρτήσεις δεικτών διασποράς
Σειρά
Η χρήση της κατάταξης είναι για πρωταρχική σύγκριση. Με αυτόν τον τρόπο λαμβάνει υπόψη μόνο τις δύο ακραίες παρατηρήσεις . Γι' αυτό συνιστάται μόνο για μικρά δείγματα (1). Ορίζεται ως η διαφορά μεταξύ της τελευταίας τιμής της μεταβλητής και της πρώτης (3).

Στατιστική απόκλιση
Η μέση απόκλιση δείχνει πού θα συγκεντρώνονταν τα δεδομένα εάν όλοι ήταν στην ίδια απόσταση από τον αριθμητικό μέσο όρο (1). Θεωρούμε ότι η απόκλιση μιας τιμής μεταβλητής είναι η διαφορά στην απόλυτη τιμή μεταξύ αυτής της μεταβλητής τιμής και του αριθμητικού μέσου όρου της σειράς. Ως εκ τούτου, θεωρείται ως ο αριθμητικός μέσος όρος των αποκλίσεων (3).
Διακύμανση
Η διακύμανση είναι μια αλγεβρική συνάρτηση όλων των τιμών κατάλληλο για στατιστικές εργασίες συμπερασμάτων (1). Μπορεί να οριστεί ως τετραγωνική απόκλιση (3).
Τυπική ή τυπική απόκλιση
Για δείγματα που λαμβάνονται από τον ίδιο πληθυσμό, η τυπική απόκλιση είναι μία από τις πιο χρησιμοποιούμενες (1). Είναι η τετραγωνική ρίζα της διακύμανσης (3).
Συντελεστής διακύμανσης
Είναι ένα μέτρο που χρησιμοποιείται κυρίως για τη σύγκριση της αλλαγής μεταξύ δύο συνόλων δεδομένων που μετρώνται σε διαφορετικές μονάδες Και. Για παράδειγμα ύψος και βάρος σώμα μαθητών σε δείγμα. Χρησιμοποιείται για να προσδιοριστεί σε ποια κατανομή τα δεδομένα είναι πιο ομαδοποιημένα και ο μέσος όρος είναι πιο αντιπροσωπευτικός (1).

Ο συντελεστής διακύμανσης είναι ένας πιο αντιπροσωπευτικός δείκτης διασποράς από τους προηγούμενους αφού είναι ένας αφηρημένος αριθμός. Με άλλα λόγια είναι ανεξάρτητο από τις μονάδες στις οποίες εμφανίζονται οι μεταβλητές τιμές. Γενικά αυτός ο συντελεστής διακύμανσης εκφράζεται ως ποσοστό (3).
Συμπεράσματα για τους δείκτες διασποράς
Τα ευρετήρια της διασποράς υποδεικνύουν αφενός το βαθμό μεταβλητότητας στο δείγμα. Από την άλλη η αντιπροσωπευτικότητα της κεντρικής αξίας αφού αν λάβετε μια χαμηλή τιμή σημαίνει ότι οι τιμές συγκεντρώνονται γύρω από αυτό το κέντρο. Αυτό θα σήμαινε ότι υπάρχει μικρή μεταβλητότητα στα δεδομένα και το κέντρο τα αντιπροσωπεύει όλα καλά.
Αντίθετα, εάν λάβετε υψηλή τιμή σημαίνει ότι οι τιμές δεν είναι συγκεντρωμένες αλλά διάσπαρτες. Αυτό σημαίνει ότι υπάρχει μεγάλη μεταβλητότητα και το κέντρο δεν θα είναι πολύ αντιπροσωπευτικό. Από την άλλη, όταν κάνουμε συμπεράσματα θα χρειαστούμε μεγαλύτερο δείγμα αν θέλουμε μειώστε το σφάλμα αυξήθηκε ακριβώς λόγω της αύξησης της μεταβλητότητας.