Με 68 μονάχα Likes  κάποιος αναλυτής δεδομένων να προβλέψει με 95% ακρίβεια το χρώμα δέρματος, με 88% ακρίβεια τη σεξουαλική ταυτότητα και 85% ακρίβεια τις πολιτικές πεποιθήσεις ενός χρήστη του Facebook. Αρκούν 10 Likes για να εκτιμήσει την προσωπικότητα ενός χρήστη καλύτερα από τον/την συνάδελφο του, 70 καλύτερα από τους φίλους του, 150 καλύτερα από τους γονείς του και 300 καλύτερα από τον/την σύντροφο του.

Την προηγούμενη εβδομάδα, ο ιδρυτής και διευθύνων σύμβουλος του Facebook, Mark Zuckerberg, κλήθηκε να καταθέσει ενώπιον του Κογκρέσου αναφορικά με το πρόσφατο σκάνδαλο υποκλοπής προσωπικών δεδομένων 87 εκατομμυρίων χρηστών της επιχείρησης του. Ύστερα από περίπου δέκα ώρες ακρόασης και 600 ερωτήσεις των Γερουσιαστών, το ερώτημα είναι ένα: Εμείς, οι χρήστες των μέσων κοινωνικής δικτύωσης, γίναμε πιο σοφοί; Αυτός ήταν άλλωστε και ο λόγος της ζωντανής μετάδοσης της ακρόασης. Να ενημερωθούν δηλαδή τόσο οι Αμερικανοί, όσο και οι Ευρωπαίοι χρήστες του διαδικτυακού κολοσσού.

Ως ερευνητής του Πανεπιστημίου King’s College του Λονδίνου, με ειδίκευση στην διασύνδεση των Μεγάλων Δεδομένων με την πολιτική επικοινωνία, έχω καταλήξει στο συμπέρασμα πως και οι δύο καταθέσεις του Mr. Facebook δεν πέτυχαν ούτε κατ’ ελάχιστον τον σκοπό τους. Από τη μία πλευρά είχαμε ερωτήσεις γενικές και αόριστες, ενώ από την άλλη ακούσαμε απαντήσεις διπλωματικές, ασαφείς και προσχεδιασμένες από έναν νευρικό Zuckerberg, που το μόνο που μας δίδαξε είναι ότι περισσότερα γνωρίζει ένας απλός αναλυτής δεδομένων παρά ο ίδιος ο ιδρυτής του Facebook. Μάλιστα, ο νεαρός επιχειρηματίας κλήθηκε να απαντήσει σε ερωτήσεις ακόμα και του Γερουσιαστή του Τέξας, Ted Cruz, ο οποίος ήταν και ο τελευταίος αντίπαλος του Donald Trump για την διεκδίκηση του χρίσματος των Ρεπουμπλικάνων και ο πρώτος Αμερικάνος πολιτικός που είχε προσλάβει την Cambridge Analytica κατά την προεκλογική του εκστρατεία, έναντι 5,8 εκατομμυρίων δολαρίων.

Αναμφίβολα, τα τελευταία χρόνια το Facebook έχει υπερβεί τα όρια του αρχικού σχεδιασμού του ως ενός απλού μέσου κοινωνικής δικτύωσης και σήμερα ο διαδικτυακός κολοσσός του Zuckerberg λαμβάνει διαστάσεις ενός ασυναγώνιστα δυνατού μέσου επιβολής κοινωνικής, πολιτικής και οικονομική ισχύος. Δεν είναι τυχαίο ότι πολλοί αναλυτές έχουν χαρακτηρίσει το Facebook ως την ιδιωτική έκδοση της NSA (Υπηρεσία Εθνικής Ασφαλείας των ΗΠΑ), αφού δύναται να γνωρίζει ακόμα και τα πιο απόκρυφα χαρακτηριστικά της προσωπικότητας των χρηστών του. Για να υπολογίσουμε και να κατανοήσουμε αυτή τη δύναμη απαιτούνται εκτενείς και μακροχρόνιες επιστημονικές έρευνες, και στο παρόν άρθρο θα σας παρουσιάσουμε τα ευρήματα δύο εξ αυτών που αναφέρονται στη δύναμη των Likes. Συγκεκριμένα, τα ευρήματα των δύο ερευνών αποδεικνύουν ότι αρκούν μονάχα μερικές δεκάδες Likes για να σκιαγραφήσει κανείς με εντυπωσιακή ακρίβεια την προσωπικότητα ενός χρήστη, σε τέτοιο βαθμό μάλιστα που το Facebook ενδέχεται να μας γνωρίζει καλύτερα ακόμα και από την ίδια μας την οικογένεια.

Τα ευρήματα προέρχονται από δύο έρευνες: Η πρώτη ανήκει στον ερευνητή Michal Kosinski και το Πανεπιστήμιο του Cambridge, ενώ η δεύτερη αποτελεί μέρος δικής μου έρευνας, που διεξήχθη στο Πανεπιστήμιο King’s College του Λονδίνου. Στο πλαίσιο των δύο αυτών ερευνών χρησιμοποιήθηκαν δύο διαφορετικά μοντέλα στατιστικής ανάλυσης και τα δείγματα αφορούσαν ανώνυμα ψηφιακά δεδομένα περισσότερων από 150.000 Αμερικανών χρηστών του Facebook. Στο σημείο αυτό θα πρέπει να διευκρινίσουμε ότι τα δεδομένα αυτά αποκτήθηκαν και επιδέχθηκαν επεξεργασίας νόμιμα, στο πλαίσιο επιστημονικής έρευνας. Στόχος αμφότερων των ερευνών ήταν η εξέταση του πώς και κατά πόσο τα ψηφιακά μας αποτυπώματα (digital footprints) στο Facebook, όπως τα Likes, μπορούν να χρησιμοποιηθούν για την αυτόματη και ακριβή πρόβλεψη μιας σειράς ιδιαίτερα ευαίσθητων προσωπικών χαρακτηριστικών, όπως είναι ο σεξουαλικός προσανατολισμός, η εθνότητα, οι θρησκευτικές και πολιτικές πεποιθήσεις, τα χαρακτηριστικά της προσωπικότητας, η ευφυΐα, η ευτυχία, η χρήση ναρκωτικών ουσιών, η ηλικία και το φύλο.

Σύμφωνα, λοιπόν, με τα ευρήματα των δυο ερευνών αρκούν κατά μέσο όρο 68 μονάχα Likes για να μπορέσει κάποιος αναλυτής δεδομένων να προβλέψει με 95% ακρίβεια το χρώμα δέρματος, με 88% ακρίβεια τη σεξουαλική ταυτότητα και 85% ακρίβεια τις πολιτικές πεποιθήσεις ενός χρήστη του Facebook. Επιπλέον, εντύπωση προκαλεί η διαπίστωση πως αρκούν 10 Likes για να εκτιμήσει κανείς την προσωπικότητα ενός χρήστη καλύτερα από τον/την συνάδελφο του, 70 καλύτερα από τους φίλους του, 150 καλύτερα από τους γονείς του και 300 καλύτερα από τον/την σύντροφο του.

Το παρακάτω γράφημα παρουσιάζει την ακρίβεια πρόβλεψης διχοτομικών μεταβλητών μέσω στατιστικής ανάλυσης των Likes, δηλαδή μεταβλητών που μπορούν να λάβουν μόνο δύο τιμές, όπως π.χ. το φύλο. Με μια πρώτη ανάγνωση διαπιστώνουμε ότι η υψηλότερη ακρίβεια πρόβλεψης επιτυγχάνεται για την εθνοτική καταγωγή και το φύλο. Συγκεκριμένα, λευκοί και έγχρωμοι Αμερικανοί κατατάχθηκαν σωστά στο 95% των περιπτώσεων, ενώ γυναίκες και άνδρες στο 93% των περιπτώσεων, γεγονός που υποδηλώνει ότι τα πρότυπα της διαδικτυακής συμπεριφοράς, όπως αυτά εκφράζονται μέσω των Likes, διαφέρουν σημαντικά μεταξύ αυτών των συγκεκριμένων ομάδων επιτρέποντας σχεδόν την τέλεια ταξινόμηση τους. Εν συνεχεία, χριστιανοί και μουσουλμάνοι κατατάχθηκαν σωστά στο 82% των περιπτώσεων, και παρόμοια αποτελέσματα επιτεύχθηκαν για τους Δημοκρατικούς και Ρεπουμπλικάνους (85%). Ο σεξουαλικός προσανατολισμός ήταν ευκολότερος στη διάκρισή του μεταξύ ανδρών (88%) συγκριτικά με τις γυναίκες (75%), ενώ σχετικά ικανοποιητική ακρίβεια επετεύχθη αναφορικά με το αν κάποιος βρίσκεται σε σχέση ή όχι, αν είναι καπνιστής ή όχι, καθώς και αν κάνει χρήση ναρκωτικών ουσιών ή όχι (μεταξύ 65% και 73%).


Γράφημα 1. Ακρίβεια πρόβλεψης διχοτομικών μεταβλητών

Σε ικανοποιητικά επίπεδα κυμαίνεται επίσης η ακρίβεια πρόβλεψης ποσοτικών μεταβλητών όπως είναι η ηλικία, καθώς και στοιχεία της προσωπικότητας όπως η ευφυΐα και η ανεκτικότητα στο διαφορετικό. Μια πιο λεπτομερή εικόνα μπορεί να μας δώσει το δεύτερο γράφημα που ακολουθεί.


Γράφημα 2. Ακρίβεια πρόβλεψης αριθμητικών μεταβλητών

Όπως είχε προβλέψει ο εφευρέτης του Παγκόσμιου Ιστού, Tim Berners-Lee, οι σημαντικότεροι κίνδυνοι στο διαδικτυακό τοπίο είναι τρεις: Η συνεχώς αυξανόμενη απώλεια του ελέγχου επί των προσωπικών μας δεδομένων, η δυσανάλογη συγκέντρωση της αλγοριθμικής δύναμης στα χέρια λίγων και η έλλειψη διαφάνειας στη διαδικτυακή διαφήμιση, και ιδίως όσον αφορά στη πολιτική διαφήμιση. Αυτά είναι σήμερα τα ζητήματα που καλούνται οι νομοθέτες να διευθετήσουν σε εθνικό, κοινοτικό και διεθνές επίπεδο για να διασφαλίσουν την ομαλή και δίκαιη λειτουργία των μέσων κοινωνικής δικτύωσης και των υπόλοιπων διαδικτυακών κολοσσών που κατέχουν και επεξεργάζονται προσωπικά δεδομένα. Αυτά θα έπρεπε να είναι και τα θέματα υπό συζήτηση στις πρόσφατες ακροάσεις του Mark Zuckerberg στο Κογκρέσο, ζητήματα γνωστά στην επιστημονική κοινότητα, τα οποία παρά τις προβλέψεις και επισημάνσεις των ειδικών, παραμένουν πιο επίκαιρα από ποτέ, κλιμακώνουν τις ψηφιακές κοινωνικές ανισότητες και δύνανται ακόμα και να ανεβοκατεβάζουν κυβερνήσεις. Από τη πλευρά μας, οι χρήστες του διαδικτύου και νόμιμοι κάτοχοι των προσωπικών μας δεδομένων, οφείλουμε στο εξής να είμαστε πιο προσεκτικοί και να γνωρίζουμε πως αν και οι ευκαιρίες που παρουσιάζονται στο ίντερνετ είναι τεράστιες και ελπιδοφόρες, εντούτοις τα οικονομικά και πολιτικά συμφέροντα είναι ακόμα μεγαλύτερα και δυστυχώς τις περισσότερες φορές επισκιάζουν τους κοινωνικούς σκοπούς της τεχνολογικής προόδου.

* O Φοίβος Παναγιώτης Παπαδάκης. Δημοσιογράφος – Ερευνητής και Διδακτορικός Φοιτητής στις Ψηφιακές Ανθρωπιστικές Επιστήμες, στο Πανεπιστήμιο King’s College του Λονδίνου, με ειδίκευση στη Διασύνδεση των Μεγάλων Δεδομένων με τη Πολιτική Επικοινωνία