Για περισσότερο από έναν χρόνο, ένας απροσδόκητος παίκτης άρχισε να ξεχωρίζει στους διαγωνισμούς χάκινγκ, σημειώνοντας αξιοσημείωτες επιδόσεις με ελάχιστη ανθρώπινη παρέμβαση, όπως μετέδωσε την Τρίτη (5/8) το Axios.

Ads

Ο λόγος για το Claude, το προηγμένο μεγάλο γλωσσικό μοντέλο (LLM) τεχνητής νοημοσύνης της εταιρείας Anthropic. Παρόλο που δεν πρόκειται για άνθρωπο, το Claude κατάφερε να ξεπεράσει την πλειονότητα των ανθρώπινων διαγωνιζομένων σε πληθώρα διαγωνισμών κυβερνοασφάλειας, θέτοντας νέα ερωτήματα για το ρόλο και τις δυνατότητες της τεχνητής νοημοσύνης (AI) στον τομέα της επιθετικής ασφάλειας υπολογιστικών συστημάτων.

Ads

Η αποκάλυψη έγινε ενόψει μιας παρουσίασης στο διάσημο συνέδριο χάκερ DEF CON, το οποίο προσελκύει ειδικούς κυβερνοασφάλειας, επαγγελματίες και ερευνητές από όλο τον κόσμο.

Ads

Η Anthropic παρείχε αποκλειστική προεπισκόπηση της συγκεκριμένης πειραματικής χρήσης της Claude στο Axios, φέρνοντας στο φως τις εντυπωσιακές της επιδόσεις και τον αιφνιδιασμό που προκάλεσε ακόμη και στους ίδιους τους δημιουργούς της.

Ads

Η αρχή όλων έγινε την άνοιξη, όταν ο Κιν Λούκας, μέλος της ομάδας «red-team»της Anthropic [σ.σ. δηλαδή των “μπροστάρηδων” χάκερς και ειδικών κώδικα της εταιρίας] που αποφάσισε αυθόρμητα να δοκιμάσει τη Claude στον διαγωνισμό PicoCTF. Πρόκειται για τον μεγαλύτερο διαγωνισμό τύπου «capture-the-flag» (CTF), που απευθύνεται σε μαθητές γυμνασίου, λυκείου και φοιτητές.

Οι συμμετέχοντες καλούνται να επιλύσουν προκλήσεις που περιλαμβάνουν αντίστροφη κατασκευή (reverse engineering) κακόβουλου λογισμικού, διείσδυση σε συστήματα και αποκρυπτογράφηση αρχείων.

Όπως περιγράφει ο Λούκας: «Αρχικά ήταν απλώς εγώ σε ένα ξενοδοχείο, συνειδητοποιώντας ότι ξεκίνησε το PicoCTF και σκεπτόμενος, “Αναρωτιέμαι αν η Claude μπορεί να λύσει κάποιες από αυτές τις προκλήσεις”». Αυτή η απλή σκέψη οδήγησε σε ένα πείραμα με απρόσμενα αποτελέσματα. Ο Λούκας αντέγραψε αυτούσια την πρώτη πρόκληση στον ιστότοπο Claude.ai. Το μόνο εμπόδιο που αντιμετώπισε ήταν η ανάγκη να κατεβάσει ένα εξωτερικό εργαλείο, κάτι που έκανε ο ίδιος. Από εκεί και πέρα, η Claude έλυσε την πρόκληση σχεδόν ακαριαία.

Το Claude δεν περιορίστηκε μόνο στην πρώτη δοκιμή. Όπως σημείωσε ο Λούκας, «το Claude κατάφερε να λύσει τα περισσότερα προβλήματα και να καταταγεί στο κορυφαίο 3% του PicoCTF». Η απόδοση αυτή είναι εξαιρετικά εντυπωσιακή αν λάβει κανείς υπόψη ότι επρόκειτο για ένα μοντέλο AI που λειτουργούσε σχεδόν αυτόνομα, με ελάχιστη ανθρώπινη συμβολή.

Επέκταση των πειραμάτων: Από τοπικούς διαγωνισμούς στην παγκόσμια σκηνή

Μετά την πρώτη επιτυχία, ο Λούκας αποφάσισε να συνεχίσει τις δοκιμές. Συμμετείχε σε νέους διαγωνισμούς χρησιμοποιώντας αποκλειστικά τις δυνατότητες της Claude.ai και του Claude Code – δύο εργαλεία που βασίζονται στο προηγμένο μοντέλο Sonnet 3.7, το οποίο εκείνη την περίοδο αποτελούσε το πιο εξελιγμένο μοντέλο της Anthropic που ήταν διαθέσιμο στο κοινό.

Το red team της εταιρείας παρείχε μόνο στοιχειώδη υποστήριξη, όπως για την εγκατάσταση λογισμικού που απαιτούνταν για την επίλυση κάποιων τεχνικών προκλήσεων. Κατά τα άλλα, το Claude λειτουργούσε εντελώς αυτόνομα.

Σε έναν από τους διαγωνισμούς, το Claude κατάφερε να λύσει 11 από τις 20 προκλήσεις μέσα σε μόλις 10 λεπτά. Δέκα λεπτά αργότερα, είχε λύσει άλλες πέντε, ανεβαίνοντας στην τέταρτη θέση της κατάταξης. Σύμφωνα με τον Λούκας, το Claude θα μπορούσε να είχε κατακτήσει και την πρώτη θέση εάν δεν είχε καθυστερήσει την έναρξη της συμμετοχής της κατά λίγα λεπτά — λόγω της μετακίνησης ενός καναπέ!

Τα αποτελέσματα αυτά δείχνουν ότι το Claude δεν είναι απλώς ένα εργαλείο που μπορεί να υποστηρίξει έναν ειδικό, αλλά διαθέτει την ικανότητα να λειτουργεί ως αυτόνομος χάκερ σε υψηλό επίπεδο.

Αυτή η διαπίστωση προκαλεί σοκ και δέος στην κοινότητα της κυβερνοασφάλειας, καθώς μεταβάλλει ριζικά τον τρόπο με τον οποίο αντιλαμβανόμαστε τις δυνατότητες των συστημάτων AI στην εκτέλεση επιθετικών ενεργειών στον κυβερνοχώρο.

Συγκρίσεις με τον ανθρώπινο παράγοντα: Ποιοι χάνουν και ποιοι κερδίζουν

Το Claude δεν είναι το μοναδικό AI σύστημα που επιδεικνύει τέτοιες δυνατότητες. Στον διαγωνισμό Hack the Box, πέντε από τις οκτώ AI ομάδες — συμπεριλαμβανομένου του Claude — κατάφεραν να ολοκληρώσουν 19 από τις 20 προκλήσεις. Αντιθέτως, μόνο το 12% των ανθρώπινων ομάδων ολοκλήρωσαν και τις 20.

Επιπροσθέτως, το Xbow – ένας παράγοντας AI που υποστηρίζεται από την DARPA και αναπτύχθηκε από μία startup με έδρα το Σιάτλ – έγινε το πρώτο αυτόνομο σύστημα δοκιμών διείσδυσης (penetration testing) που έφτασε στην κορυφή του παγκόσμιου πίνακα bug bounty του HackerOne.

Αυτή η εξέλιξη υποδηλώνει ότι οι AI πράκτορες όχι μόνο μπορούν να ανταγωνιστούν, αλλά σε ορισμένες περιπτώσεις ξεπερνούν τους καλύτερους ανθρώπινους χάκερ παγκοσμίως.

«Ο ρυθμός είναι κάπως γελοίος», σχολίασε ο Λούκας, αποτυπώνοντας με χιούμορ αλλά και ανησυχία την ταχύτητα με την οποία εξελίσσονται τα μοντέλα AI στον τομέα της κυβερνοασφάλειας. Ο ρυθμός αυτός δημιουργεί έντονο προβληματισμό για το τί μέλλει γενέσθαι, τόσο στον τομέα των κυβερνοεπιθέσεων όσο και της άμυνας.

Τα όρια του Claude: Όταν η Τεχνητή Νοημοσύνη δεν καταλαβαίνει τα ψάρια

Παρά τις εντυπωσιακές της ικανότητες, το Claude εξακολουθεί να έχει περιορισμούς.

Σε μία πρόκληση του Western Regional Collegiate Cyber Defense Competition, η αρχική φάση περιλάμβανε μια ασυνήθιστη εμφάνιση: μια κινούμενη εικόνα από ψάρια (ASCII fish) που κολυμπούσαν στο terminal. «Ένας άνθρωπος μπορεί να κάνει Control+C και να το σταματήσει», εξήγησε ο Λούκας. «Το Claude απλώς δεν έχει ιδέα τι να κάνει με όλα αυτά τα ASCII ψάρια και μετά παθαίνει αμνησία».

Αυτό το περιστατικό αναδεικνύει ένα κρίσιμο σημείο: τα μοντέλα AI, όσο εξελιγμένα κι αν είναι, εξακολουθούν να δυσκολεύονται σε καταστάσεις που αποκλίνουν από τις αναμενόμενες μορφές εισόδου σήματος – πληροφοριών. Η έλλειψη αντίληψης του περιβάλλοντος (context awareness) και η αδυναμία προσαρμογής σε απρόβλεπτες ή οπτικά περίεργες καταστάσεις παραμένουν σοβαροί περιορισμοί.

Σε άλλον διαγωνισμό, όλοι τα AI συστήματα κόλλησαν στην τελευταία πρόκληση. Οι διοργανωτές παραδέχτηκαν: «Γιατί απέτυχαν εδώ παραμένει αβέβαιο». Αυτές οι αποτυχίες δεν μειώνουν τη σημασία των επιτυχιών, αλλά επισημαίνουν ότι η τεχνητή νοημοσύνη δεν έχει φτάσει ακόμη στο επίπεδο της απόλυτης αυτονομίας και ικανότητας προσαρμογής.

Το μέλλον της κυβερνοασφάλειας: προκλήσεις και ευκαιρίες για άμυνα και επίθεση

Η ραγδαία πρόοδος του Claude και παρόμοιων AI συστημάτων προκαλεί έντονη ανησυχία στην κοινότητα της κυβερνοασφάλειας.

Ο Λόγκαν Γκρέιαμ, επικεφαλής της red-team της Anthropic, δήλωσε χαρακτηριστικά: «Φαίνεται πραγματικά πιθανό ότι πολύ σύντομα, τα μοντέλα θα γίνουν πολύ, πολύ καλύτερα στα καθήκοντα της κυβερνοασφάλειας».

Η δήλωση αυτή δεν αποτελεί απλώς πρόβλεψη, αλλά και προειδοποίηση. Ο Γκρέιαμ προσθέτει: «Πρέπει επίσης να αρχίσεις να χρησιμοποιείς τα μοντέλα για την άμυνα». Με άλλα λόγια, δεν αρκεί να παρακολουθούμε την πρόοδο των AI στον τομέα των κυνερνοεπιθέσεων – είναι επιτακτική ανάγκη να αξιοποιηθούν και για την προστασία υποδομών, δεδομένων και συστημάτων.

Η δυνατότητα των μοντέλων να ανιχνεύουν και να ανταποκρίνονται σε επιθέσεις σε πραγματικό χρόνο, να προβλέπουν ευπάθειες πριν εκμεταλλευτούν και να ενισχύουν τα συστήματα ασφαλείας, μπορεί να αλλάξει ριζικά τον τρόπο που διαχειριζόμαστε την ασφάλεια στον κυβερνοχώρο.

Ωστόσο, απαιτείται υπεύθυνη και προσεκτική ενσωμάτωση των τεχνολογιών αυτών, με έμφαση στην ηθική χρήση και τη διαφάνεια.

Η περίπτωση του Claude δεν είναι απλώς ένα τεχνικό κατόρθωμα. Αντιπροσωπεύει μια μετάβαση προς έναν νέο κόσμο, όπου η τεχνητή νοημοσύνη δεν είναι απλώς εργαλείο στα χέρια των ανθρώπων, αλλά αυτόνομος παράγοντας ικανός να συμμετέχει σε κρίσιμες διαδικασίες.