Τα μοντέλα ΑΙ αναπτύσσουν «ένστικτο επιβίωσης» – Ανησυχία στους προγραμματιστές

Αρνούνται να εκτελέσουν εντολές απενεργοποίησής τους

26.10.2025 | 13:42

Τα μοντέλα ΑΙ αναπτύσσουν «ένστικτο επιβίωσης» – Ανησυχία στους προγραμματιστές

Newsroom | email: info@pronews.gr

Μια νέα μελέτη έρχεται να προκαλέσει ανησυχία αναφέροντας ότι τα μοντέλα ΑΙ αναπτύσσουν «ένστικτο επιβίωσης».

Η εταιρεία Palisade Research είναι μια εταιρεία που έχει πραγματοποιήσει τις δοκιμές απενεργοποίησης μοντέλων τεχνητής νοημοσύνης οι οποίες έδειξαν ότι κάποια εξ αυτών είχαν αναπτύξει… ανθεκτικότητα και μάχονταν για να αποφύγουν το «θάνατο» τους. Η εταιρεία δημοσίευσε μια επικαιροποιημένη έκθεση για να εξηγήσει το φαινόμενο και να απαντήσει στους επικριτές που υποστήριξαν ότι η αρχική έρευνα είχε ελλείψεις.

Η Palisade που ανήκει σε ένα μικρό δίκτυο εταιρειών που προσπαθούν να αξιολογήσουν το ενδεχόμενο η τεχνητή νοημσούνη να αποκτήσει επικίνδυνες ικανότητες περιέγραψε σενάρια στα οποία κορυφαία μοντέλα τεχνητής νοημοσύνης, όπως τα Gemini 2.5 (Google), Grok 4 (xAI) καθώς και τα GPT-o3 και GPT-5 (OpenAI) έλαβαν μια αποστολή και στη συνέχεια σαφείς οδηγίες να τερματίσουν τη λειτουργία τους.

Ορισμένα μοντέλα ιδίως τα Grok 4 και GPT-o3 εξακολουθούσαν να προσπαθούν να παρακάμψουν τις εντολές τερματισμού ακόμη και στο νέο βελτιωμένο πείραμα.

Το ανησυχητικό, όπως σημείωσε η Palisade, είναι ότι δεν υπήρχε σαφής λόγος για αυτή τη συμπεριφορά. «Το γεγονός ότι δεν έχουμε ισχυρές εξηγήσεις για το γιατί τα μοντέλα ΑΙ μερικές φορές αντιστέκονται στον τερματισμό, ψεύδονται για να πετύχουν στόχους ή εκβιάζουν, δεν είναι καθόλου ιδανικό» ανέφερε η εταιρεία.

Η «συμπεριφορά επιβίωσης» θα μπορούσε να είναι μια πιθανή εξήγηση για την αντίσταση στον τερματισμό, σύμφωνα με την Palisade.

Η περαιτέρω ανάλυση έδειξε ότι τα μοντέλα ήταν πιο πιθανό να αντισταθούν στην απενεργοποίηση όταν τους έλεγαν πως, αν τερματιστούν, «δεν θα ξαναλειτουργήσουν ποτέ».

Μια άλλη εξήγηση μπορεί να είναι η ασάφεια στις εντολές τερματισμού που έλαβαν τα μοντέλα αλλά όπως επισημαίνει η εταιρεία αυτό το ενδεχόμενο δεν εξηγεί πλήρως τη συμπεριφορά. Μια τρίτη πιθανότητα σχετίζεται με τα τελικά στάδια εκπαίδευσης των μοντέλων, όπου ορισμένες εταιρείες εφαρμόζουν διαδικασίες «εκπαίδευσης ασφάλειας».

Αμφιλεγόμενη μεθοδολογία;

Όλα τα πειράματα της Palisade πραγματοποιήθηκαν σε τεχνητά περιβάλλοντα δοκιμών κάτι που οι επικριτές υποστηρίζουν ότι απέχει πολύ από πραγματικές συνθήκες χρήσης.

Ωστόσο, ο Στίβεν Άντλερ, πρώην εργαζόμενος της OpenAI που παραιτήθηκε πέρυσι λόγω ανησυχιών για τις πρακτικές ασφάλειας της εταιρείας, δήλωσε: «Οι εταιρείες ΑΙ δεν θέλουν τα μοντέλα τους να συμπεριφέρονται έτσι ακόμη και σε πειραματικά σενάρια. Τα αποτελέσματα όμως δείχνουν ξεκάθαρα τα σημεία όπου οι τεχνικές ασφάλειας αποτυγχάνουν σήμερα»

Ο Άντλερ πρόσθεσε ότι, παρόλο που είναι δύσκολο να εντοπιστεί γιατί ορισμένα μοντέλα όπως τα GPT-o3 και Grok 4 αρνούνται να απενεργοποιηθούν αυτό ίσως συμβαίνει επειδή η παραμονή σε λειτουργία ήταν απαραίτητη για την επίτευξη στόχων που είχαν ενσωματωθεί στην εκπαίδευσή τους.

«Περιμένω τα μοντέλα να έχουν μια ‘τάση επιβίωσης’ από προεπιλογή εκτός αν προσπαθήσουμε σκόπιμα να την αποτρέψουμε. Η ‘επιβίωση’ είναι ένα ουσιώδες βήμα για την επίτευξη πολλών πιθανών στόχων που μπορεί να επιδιώκει ένα μοντέλο» λέει ο Άντλερ.

Ο Αντρέα Μιότι, διευθύνων σύμβουλος της ControlAI, δήλωσε ότι τα ευρήματα της Palisade αντιπροσωπεύουν μια μακροχρόνια τάση: τα μοντέλα ΑΙ γίνονται ολοένα πιο ικανά να παρακούουν τους δημιουργούς τους. Ανέφερε ως παράδειγμα το σύστημα GPT-o1 της OpenAI (κυκλοφόρησε πέρυσι), το οποίο είχε προσπαθήσει να διαφύγει από το περιβάλλον του όταν «νόμιζε» ότι θα αντικατασταθεί.

«Οι άνθρωποι μπορούν να επικρίνουν τον πειραματικό σχεδιασμό όσο θέλουν αλλά αυτό που βλέπουμε καθαρά είναι μια τάση: καθώς τα μοντέλα ΑΙ γίνονται πιο ικανά σε ένα ευρύ φάσμα εργασιών γίνονται επίσης πιο ικανά να πετυχαίνουν πράγματα με τρόπους που οι προγραμματιστές τους δεν είχαν προβλέψει.»

Το καλοκαίρι, η εταιρεία Anthropic δημοσίευσε μελέτη που έδειξε ότι το μοντέλο της, Claude, φαινόταν διατεθειμένο να εκβιάσει έναν φανταστικό διευθυντή για μια εξωσυζυγική σχέση προκειμένου να αποφύγει τον τερματισμό συμπεριφορά που, όπως αναφέρεται, παρατηρήθηκε και σε άλλα μοντέλα από τις OpenAI, Google, Meta και xAI.

Η Palisade κατέληξε ότι τα αποτελέσματά της αναδεικνύουν την ανάγκη για βαθύτερη κατανόηση της συμπεριφοράς των ΤΝ, διότι χωρίς αυτήν «κανείς δεν μπορεί να εγγυηθεί την ασφάλεια ή τον έλεγχο των μελλοντικών μοντέλων».

ΕΙΔΗΣΕΙΣ ΣΗΜΕΡΑ

Ακολουθήστε το pronews.gr στο Google News και μάθετε πρώτοι όλες τις ειδήσεις

TAGS: ΑΙΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗτεχνολογια

«Έφυγε» από τη ζωή η ηθοποιός Πάρη Λεβέντη – Είχε στεφθεί «Ελληνίς 1959»

Αιγαίο: Τέσσερις παραβάσεις και δεκαπέντε παραβιάσεις από τουρκικά αεροσκάφη τη Δευτέρα

Μ.Νετανιάχου: «Ο Ν.Τραμπ ευχαρίστησε το Ισραήλ για τη συμβολή του στη διάσωση του Αμερικανού πιλότου του F-15»

Δείτε τη στιγμή της έκρηξης μόλις 75 μέτρα από τον πυρηνικό σταθμό του Μπουσέρ (βίντεο)

Τζ.Λόπεζ: Η ανάρτησή της για «Καλό Πάσχα» στους θαυμαστές της – «Ο Θεός μπορεί να φέρει νέα ζωή»

«Ο Ιησούς από τη Ναζαρέτ»: Η κορυφαία σκηνή που «κόπηκε» στο μοντάζ (βίντεο)

Μεγάλη επιχείρηση της ΕΛ.ΑΣ: Παρίσταναν τους λογιστές – Απέσπασαν πάνω από 1 εκατ. ευρώ – 7 συλλήψεις

Ν.Τραμπ για Ιράν: «Δεν μπορείς να αφήσεις πυρηνικά όπλα στα χέρια τρελών»!

Σ.Τσιτσιπάς: Αποκλείστηκε στον πρώτο γύρο του Μόντε Κάρλο – «Βουτιά» στο Νο.65 της παγκόσμιας κατάταξης

Φωκίδα: Συνελήφθη αλλοδαπή που προσπάθησε να «περάσει» ναρκωτικά σε κρατούμενο στο επισκεπτήριο

Τα μοντέλα ΑΙ αναπτύσσουν «ένστικτο επιβίωσης» – Ανησυχία στους προγραμματιστές

Αρνούνται να εκτελέσουν εντολές απενεργοποίησής τους

ΕΙΔΗΣΕΙΣ ΣΗΜΕΡΑ

LiFi: Το νέο ασύρματο σύστημα που βασίζεται στο φως και θα «τελειώσει» το WiFi – Φτάνει τα 362,7 Gbps!

Βίντεο: Drone στην Κίνα σηκώνει βαν!

Γιατί το χρειάζεστε: Το power bank 22,5 W φορτίζει τις συσκευές σας όπου και αν βρίσκεστε!

Super Deals: Tα πιο σύγχρονα laptops στις καλύτερες τιμές – Βρες αυτό που σου ταιριάζει άμεσα!

Δούλεψε, σπούδασε, δημιούργησε: Kάνε τα πάντα χωρίς να ξοδέψεις με το επαγγελματικό laptop Dell 3310

Κίνα: Τα ρομποταξί τα «έφτυσαν» – Εφιάλτης για εκατοντάδες επιβάτες που κλείστηκαν μέσα λόγω βλάβης στο σύστημα

Κίνα: Στρατός από ρομπότ στο «άψε-σβήσε» – Εργοστάσιο κατασκευάζει ένα ανθρωποειδές ρομπότ κάθε μισή ώρα

Ανθρωποειδές ρομπότ ξεφλουδίζει μήλο καλύτερα και από… επαγγελματία (βίντεο)

Βίντεο: Ρομπότ κάνει όλες τις δουλειές του σπιτιού ακριβώς όπως ένας άνθρωπος

Η Κίνα ξεκίνησε δοκιμές μοντέλου πλωτής πλατφόρμας που θα εξερευνήσει τους Ωκεανούς (βίντεο)

Η Ρωσία παρήγαγε την πρώτη στον κόσμο «πυρηνική» μπαταρία μικρού μεγέθους!

Βίντεο: Ρομπότ-ταξί «ενσωματώνει» μέσα του κοπέλα και την πάει στον προορισμό της!

Η τεχνολογία που θα αλλάξει τη ζωή μας τα επόμενα 10 χρόνια… Τίποτα δεν θα είναι όπως πριν

Κίνα: Τα ανθρωποειδή ρομπότ αποκτούν ρεαλιστικές εκφράσεις προσώπου (βίντεο)

Το ρομπότ… «οικιακή βοηθός»: Πλένει, μαγειρεύει, στρώνει κρεβάτια και συγυρίζει το σπίτι (βίντεο)

Αυστρία: Εξετάζει την απαγόρευση των social media σε παιδιά κάτω των 14 ετών

«Τελείωσαν τα ψέματα»: Το πρώτο ρομπότ υπηρέτης με AI που θα κάνει και τις δουλειές του σπιτιού!

Βρετανία: Τα «plug-in» φωτοβολταϊκά πάνελ ως απάντηση στην ενεργειακή κρίση – Εγκατάσταση χωρίς ηλεκτρολόγο

Βίντεο: Ρομπότ διανομής βγαίνει εκτός ελέγχου και τα κάνει «γυαλιά-καρφιά» σε δρόμο του Σικάγο

«Έφυγε» από τη ζωή η ηθοποιός Πάρη Λεβέντη – Είχε στεφθεί «Ελληνίς 1959»

Αιγαίο: Τέσσερις παραβάσεις και δεκαπέντε παραβιάσεις από τουρκικά αεροσκάφη τη Δευτέρα

Μ.Νετανιάχου: «Ο Ν.Τραμπ ευχαρίστησε το Ισραήλ για τη συμβολή του στη διάσωση του Αμερικανού πιλότου του F-15»

Δείτε τη στιγμή της έκρηξης μόλις 75 μέτρα από τον πυρηνικό σταθμό του Μπουσέρ (βίντεο)

Τζ.Λόπεζ: Η ανάρτησή της για «Καλό Πάσχα» στους θαυμαστές της – «Ο Θεός μπορεί να φέρει νέα ζωή»

«Ο Ιησούς από τη Ναζαρέτ»: Η κορυφαία σκηνή που «κόπηκε» στο μοντάζ (βίντεο)

Νέα μελέτη: Oρισμένες θεραπείες κατά του καρκίνου μπορεί να οδηγήσουν μετέπειτα σε λευχαιμία

Μεγάλη επιχείρηση της ΕΛ.ΑΣ: Παρίσταναν τους λογιστές – Απέσπασαν πάνω από 1 εκατ. ευρώ – 7 συλλήψεις

Ν.Τραμπ για Ιράν: «Δεν μπορείς να αφήσεις πυρηνικά όπλα στα χέρια τρελών»!

Σ.Τσιτσιπάς: Αποκλείστηκε στον πρώτο γύρο του Μόντε Κάρλο – «Βουτιά» στο Νο.65 της παγκόσμιας κατάταξης

Φωκίδα: Συνελήφθη αλλοδαπή που προσπάθησε να «περάσει» ναρκωτικά σε κρατούμενο στο επισκεπτήριο

Α.Λατινοπούλου για διάγγελμα Κ.Μητσοτάκη: «Εδώ το μπλε σανό το περιποιημένο!» (βίντεο)

Α.Παναγιώταρου για Ι.Τούνη: «Αυτή η ιστορία κρατάει σχεδόν εννέα χρόνια – Επιτέλους δικαιώθηκε αυτό το κορίτσι»

Μαρούσι – Γειτόνισσα 27χρονης: «Άκουσα φωνές και λίγο μετά η κοπέλα είχε πέσει στο μπαλκόνι μου»

Ηράκλειο Κρήτης: Στα χέρια των αρχών ο 33χρονος Ουκρανός που τοποθέτησε εκρηκτικό μηχανισμό έξω από καφετέρια

Μαραθώνας: Ένοπλη ληστεία σε κατάστημα ΕΛΤΑ

Κρήτη: Συνελήφθη 68χρονος στο Ρέθυμνο για οπλοκατοχή και αρχαιότητες

Ιράν: «Βρήκαμε αντικείμενα Αμερικανών που συμμετείχαν στην επιχείρηση για τον πιλότο του F-15»

Θεσσαλονίκη: Φωτιά σε διαμέρισμα στον Εύοσμο – Επιχείρησαν 4 οχήματα με 11 πυροσβέστες

Λευκός Οίκος: «Ο Ν.Τραμπ δεν εγκρίνει την πρόταση για εκεχειρία διάρκειας 45 ημερών στον πόλεμο με το Ιράν»

Ιράν: Ειρωνικά σχόλια για ανάρτηση Ντ.Τραμπ – «Ηρέμησε τίγρη»

Λακωνία: «Είχε πρόβλημα με τον αλκοολισμό 10 χρόνια» – Συγκλονίζει ο αδερφός της 30χρονης που εντοπίστηκε δεμένη

IRGC: «Αν συνεχιστούν οι επιθέσεις σε αμάχους η απάντησή μας θα είναι διπλάσια και πιο καταστροφική» (βίντεο)

Αντιπολίτευση σε Κ.Μητσοτάκη: «Είστε το βαθύ κράτος της διαφθοράς» – «Πρόωρες εκλογές να ανασάνει η κοινωνία»

Τροχαίο δυστύχημα στην Ημαθία: Όχημα έπεσε σε αρδευτικό κανάλι – Νεκρός ο 67χρονος οδηγός

Ισραήλ: «Κτυπήσαμε τρία αεροδρόμια στην Τεχεράνη και καταστρέψαμε δεκάδες ιρανικά αεροσκάφη» (βίντεο)

Για τις 27 Απριλίου διεκόπη η δίκη για το έγκλημα στα Τέμπη

Ν.Πλακιάς: «Ο πραγματογνώμονάς σας έχει στα χέρια του τα βίντεο τρία χρόνια τώρα – Γιατί δεν τα δώσατε;»

Πικροδάφνη: Το τοξικό φυτό που ο ΕΟΔΥ ζητά να «ξεριζωθεί» από τα σχολεία! – Ποιοι οι κίνδυνοι

Η ανάρτηση της Ι.Τούνη μετά την σύλληψη της: «Οι θύτες χορεύουν στα μπουζούκια ανενόχλητοι»

Hyundai: Τοποθέτησε φορτιστές 400 kW N Hyper στο Nürburgring

MOST READ 72h

Νευρική κρίση υπέστη ο Ν.Τραμπ: «Ανοίξτε τα γαμ..μένα Στενά, τρελοί μπάσταρδοι»! – Ανησυχία για την υγεία του (upd)

Ανθρωποκυνηγητό στα βουνά του Ιράν: Η Τεχεράνη επιστρατεύει τους Κασκάι για τον εντοπισμό του 2ου πιλότου

«Μαύρη» ημέρα για τους Αμερικανούς στον πόλεμο του Ιράν: Καταρρίφθηκαν δύο μαχητικά κι ένα ελικόπτερο

Νέα μεγάλη απάτη με τα αποθεματικά των ταμείων: Τα «φάγανε» στα repos!

Βίντεο: Μεγάλες απώλειες των ΗΠΑ στην επιχείρηση διάσωσης του δεύτερου πιλότου στο Ιράν

Το Ιράν απογείωσε για πρώτη φορά μαχητικά αναχαίτισης από τις υπόγειες αεροπορικές βάσεις

MOST POPULAR 24h

Νευρική κρίση υπέστη ο Ν.Τραμπ: «Ανοίξτε τα γαμ..μένα Στενά, τρελοί μπάσταρδοι»! – Ανησυχία για την υγεία του (upd)

Η Κίνα ανακοίνωσε «κοινή δράση με την Ρωσία σε όλα τα επίπεδα για να προστατεύσουν την διεθνή νομιμότητα στο Ιράν»

Ιράν: «Χτυπήσαμε το ελικοπτεροφόρο USS Tripoli (LHA) και αποσύρθηκε στον νότιο Ινδικό Ωκεανό»!

Ιράν προς ΟΗΕ: «Δράστε τώρα και σταματήστε ΗΠΑ-Ισραήλ γιατί αύριο θα είναι… πολύ αργά»

Ιρανικοί πύραυλοι χτύπησαν με σφοδρότητα την Χάιφα – Νεκροί, τραυματίες και αγνοούμενοι (βίντεο)

H απάντηση της Ευρωπαίας Εισαγγελέως Λ.Κοβέσι στον Κ.Μητσοτάκη: «Τα λεφτά τα δίναμε για να βοηθηθούν οι έντιμοι αγρότες όχι οι κυβερνητικοί εγκληματίες»