Software evolution is related to either the fix of any errors in the original or previous design of the software or the demand of the users to have additional features in the software. However, for the software to continue to be functional and viable, it needs to keep track of the new requirements. To achieve this, mostly, apart from the updates in the software, new information needs to be added. Schema evolution refers to the change of the internal structure of the database, either in terms of changes of the tables, or the attributes of the schema. The impact of this evolution on the entire software, that is built around the schema, is very big which makes it very important to find out how schemata evolve over time, as well as to extract some patterns related to their evolution. Historically, due to the absence of datasets, only with the appearance of open-source software, was, the conduction of studies on schema evolution, made feasible. Recently, in bibliography the biggest study related to the schema evolution, has been conducted, with 195 schemata that were studied, in which, families of schemata (taxa) were extracted, by observing the way that schema evolves. In this Thesis, we continue this research, and we proceed to the assessment of the taxa that were proposed. Moreover, we observe how the schema evolves over time as well as the measurements that are related to this evolution. The main question we seek to answer is: Assuming a taxon is given, what are the characteristics of the projects that belong to it and vice versa. Moreover, a question that arises is whether we could find a centroid to each taxon, which would represent its characteristics. Finally, based on the answers that were derived from the study of the previous questions, we group the taxa in larger groups, which we call super taxa, and demonstrate a more clean separation of the evolutionary behavior of their projects. We also study heartbeat, activity, duration for the super taxa and report our findings, along with the identification of centroids for each super taxon. Η εξέλιξη του λογισμικού αφορά είτε τη διόρθωση τυχόν σφαλμάτων στον αρχικό ή προηγούμενο σχεδιασμό του λογισμικού, είτε την απαίτηση των χρηστών για πρόσθετα χαρακτηριστικά στο λογισμικό. Ωστόσο, προκειμένου το λογισμικό να συνεχίσει να είναι λειτουργικό και βιώσιμο, πρέπει να παρακολουθεί τις νέες απαιτήσεις. Για να επιτευχθεί αυτό, τις περισσότερες φορές, εκτός από τις ενημερώσεις του λογισμικού, πρέπει να προστεθούν νέες πληροφορίες. Η εξέλιξη του σχήματος αναφέρεται στην αλλαγή της εσωτερικής δομής της βάσης δεδομένων, είτε στα πλαίσια αλλαγών στους πίνακες είτε στα χαρακτηριστικά του σχήματος. Ο αντίκτυπος της εξέλιξης αυτής είναι πολύ μεγάλος σε ολόκληρο το λογισμικό, το οποίο είναι χτισμένο γύρω από το σχήμα, πράγμα που καθιστά πολύ σημαντικό να ανακαλύψουμε τον τρόπο με τον οποίο εξελίσσονται τα σχήματα με την πάροδο του χρόνου, καθώς και να εξάγουμε ορισμένα μοτίβα που σχετίζονται με την εξέλιξή τους. Ιστορικά, λόγω της απουσίας συνόλων δεδομένων, μόνο με την εμφάνιση του λογισμικού ανοικτού κώδικα έγινε εφικτή η διεξαγωγή μελετών για την εξέλιξη των σχημάτων. Πρόσφατα, στη βιβλιογραφία, διεξήχθη η μεγαλύτερη μελέτη που έχει πραγματοποιηθεί ποτέ σχετικά με την εξέλιξη των σχημάτων, με 195 σχήματα που μελετήθηκαν και στην οποία, μελετώντας τον τρόπο με τον οποίο εξελίσσεται το σχήμα αυτών των έργων, εξήχθησαν οικογένειες σχημάτων (taxa). Στην παρούσα εργασία, συνεχίζουμε την προσπάθεια αυτή και κάνουμε αξιολόγηση αυτών των οικογενειών που προτάθηκαν. Επιπλέον, παρατηρούμε πώς εξελίσσεται το σχήμα με την πάροδο του χρόνου καθώς και ποια είναι τα χαρακτηριστικά που σχετίζονται με αυτή την εξέλιξη. Το κύριο ερώτημα που θέλουμε να απαντήσουμε είναι, αν δοθεί μια οικογένεια, ποια είναι τα χαρακτηριστικά των έργων που ανήκουν σε αυτό, και αντίστροφα. Επιπλέον, ένα ερώτημα που προκύπτει είναι αν θα μπορούσαμε να βρούμε ένα κεντροειδές για κάθε οικογένεια, το οποίο θα αντιπροσωπεύει τα χαρακτηριστικά της εκάστοτε οικογένειας. Τέλος, με βάση τις παρατηρήσεις που προέκυψαν από τη μελέτη των προηγούμενων ερωτημάτων, ομαδοποιούμε τις οικογένειες σε μεγαλύτερες ομάδες, τις οποίες αποκαλούμε “super taxa”, και επιδεικνύουμε μια πιο σαφή διάκριση της εξελικτικής συμπεριφοράς των σχημάτων τους. Επίσης, μελετάμε το heartbeat, τη δραστηριότητα και την διάρκεια των super taxa και αναφέρουμε τα ευρήματα μας, σχετικά με την εξακρίβωση κεντροειδών για κάθε taxon. 102 σ.