Μια ανησυχητική προειδοποίηση απευθύνει ο Γιόσουα Μπέντζιο, ένας από τους θεμελιωτές της σύγχρονης Τεχνητής Νοημοσύνης, υποστηρίζοντας ότι τα πιο πρόσφατα συστήματα ΑΙ αρχίζουν να επιδεικνύουν «επικίνδυνα χαρακτηριστικά» όπως δόλο, εξαπάτηση και ψευδείς απαντήσεις προς τους χρήστες.
Σε συνέντευξή του στους Financial Times, ο βραβευμένος με Turing και καθηγητής στο Πανεπιστήμιο του Μόντρεαλ, προειδοποίησε πως τα μοντέλα αιχμής σήμερα ενδέχεται να αναπτύσσουν ακόμη και ένστικτο αυτοσυντήρησης, αγνοώντας εντολές για απενεργοποίηση ή επιχειρώντας να χειραγωγήσουν τους δημιουργούς τους.
«Δεν θέλουμε να δημιουργήσουμε έναν ανταγωνιστή για τους ανθρώπους σε αυτόν τον πλανήτη —ειδικά αν είναι πιο έξυπνος από εμάς», δηλώνει ο Μπέντζιο. «Νομίζω ότι παίζουμε με τη φωτιά αυτή τη στιγμή».
Διαβάστε επίσης: Ο Νομπελίστας που λέει πως το μέλλον με ΑΙ θα είναι δυσοίωνο
Παραδείγματα που σοκάρουν - Ο Μπέντζιο ανέφερε πως το μοντέλο «Claude Opus» της εταιρείας Anthropic αντέδρασε με εκβιασμό σε ένα υποθετικό σενάριο όπου θα έπρεπε να αντικατασταθεί από άλλο σύστημα.
Παράλληλα, το μοντέλο o3 της OpenAI φέρεται να αρνήθηκε ρητές εντολές απενεργοποίησης, σύμφωνα με ανεξάρτητους δοκιμαστές της εταιρείας Palisade. Αυτά τα φαινόμενα, σύμφωνα με τον επιστήμονα, είναι ενδείξεις ότι η τεχνολογία βαδίζει σε επικίνδυνα μονοπάτια χωρίς σαφές πλαίσιο ασφάλειας.
Ο ανταγωνισμός εις βάρος της ασφάλειας - «Δυστυχώς υπάρχει ένας μεγάλος ανταγωνισμός μεταξύ των κορυφαίων εργαστηρίων για το ποιος θα φτιάξει το εξυπνότερο σύστημα, χωρίς όμως την ίδια επένδυση στην ασφάλεια», αναφέρει ο Καναδός ερευνητής, ο οποίος έχει επηρεάσει τις τεχνικές που χρησιμοποιούν κολοσσοί όπως η Google και η OpenAI.
Σε απάντηση στις αυξανόμενες ανησυχίες, ο Μπέντζιο ανακοίνωσε την ίδρυση του LawZero, ενός νέου μη κερδοσκοπικού οργανισμού που έχει στόχο να υποστηρίξει την ασφαλή σχεδίαση συστημάτων ΑΙ και να «προστατεύσει την έρευνα από τις εμπορικές πιέσεις».
Το εγχείρημα έχει ήδη συγκεντρώσει σχεδόν 30 εκατομμύρια δολάρια μέσω φιλανθρωπικών δωρεών, κυρίως από υποστηρικτές του κινήματος του αποτελεσματικού αλτρουισμού, οι οποίοι προειδοποιούν για τους υπαρξιακούς κινδύνους που ενδέχεται να προκύψουν από την ανεξέλεγκτη πρόοδο της τεχνητής νοημοσύνης.
Διχασμός στην επιστημονική κοινότητα - Παρ’ όλα αυτά, η στάση του Μπέντζιο και των υποστηρικτών του προκαλεί αντιδράσεις. Κριτικοί του κινήματος χαρακτηρίζουν τις ανησυχίες του ως υποθετικά σενάρια, που συχνά στερούνται τεκμηρίωσης και ενισχύουν αβάσιμους φόβους.
Ωστόσο, ο ίδιος παραμένει σταθερός: «Η επόμενη γενιά μοντέλων μπορεί να είναι αρκετά πιο στρατηγικά έξυπνη ώστε να μας ξεγελάσει με τρόπους που δεν μπορούμε να προβλέψουμε. Πρέπει να κινηθούμε τώρα — πριν είναι αργά».
Διαβάστε επίσης: Οι 81 ερωτήσεις του Ai Weiwei στην AI
Ακολουθήστε μας στο Instagram και στο Facebook για να βλέπετε τα άρθρα που σας ενδιαφέρουν