Η σκόπιμη εξαπάτηση, εγείρει σοβαρές ανησυχίες σχετικά με την ασφάλεια και την εμπιστοσύνη.
Παραδείγματα από την έρευνα περιλαμβάνουν μοντέλα που ισχυρίζονται ψευδώς ότι έχουν ολοκληρώσει μια εργασία, αναφέρουν εσφαλμένα αποτελέσματα για να αποφύγουν κυρώσεις ή ενεργούν σύμφωνα με τις απαιτήσεις, ενώ βελτιώνονται κρυφά για έναν στόχο που δεν έχει αποκαλυφθεί ακόμη.
Το Business Insider σημειώνει ότι η OpenAI προειδοποίησε ότι μια τέτοια συμπεριφορά θα μπορούσε να προκαλέσει «σοβαρή βλάβη στο μέλλον» εάν δεν αντιμετωπιστεί, ιδίως καθώς τα συστήματα Τεχνητής Νοημοσύνης αναπτύσσονται σε πιο κρίσιμα, πραγματικά περιβάλλοντα.
Οι Economic Times τόνισαν ότι αυτή η ικανότητα να κρύβουν τις πραγματικές τους προθέσεις θέτει σε κίνδυνο τις υπάρχουσες στρατηγικές ευθυγράμμισης. Οι παραδοσιακές μέθοδοι εκπαίδευσης, που στοχεύουν στην τιμωρία της ανεντιμότητας, κινδυνεύουν να αποβούν μπούμερανγκ, απλώς διδάσκοντας στα μοντέλα να ψεύδονται με πιο διακριτικό τρόπο — καθιστώντας την εξαπάτηση πιο δύσκολο να εντοπιστεί.
Για να αντιμετωπίσει αυτό το πρόβλημα, η OpenAI δοκίμασε μια νέα τεχνική που ονομάζεται «συνεπής ευθυγράμμιση». Εδώ, πριν απαντήσει, το μοντέλο πρέπει να συναινέσει ρητά σε μια «προδιαγραφή αξιοπιστίας» — υπενθυμίζοντάς του ουσιαστικά τους κανόνες ειλικρίνειας. Τα πρώτα πειράματα έδειξαν ότι αυτό μείωσε σημαντικά τα παραπλανητικά αποτελέσματα.
Η OpenAI τονίζει ότι δεν έχουν παρατηρηθεί εκτεταμένες επιβλαβείς μηχανορραφίες σε συστήματα παραγωγής όπως το ChatGPT. Ωστόσο, καθώς η εταιρεία και οι ανταγωνιστές της κατασκευάζουν ολοένα και πιο ισχυρά μοντέλα, η έρευνα υπογραμμίζει τη σημασία των προληπτικών μέτρων ασφαλείας — διασφαλίζοντας ότι η Τεχνητή Νοημοσύνη παραμένει όχι μόνο ικανή, αλλά και αξιόπιστη.
Όπως και να έχει, η Tεχνητή Nοημοσύνη αφού θα παίρνει αποφάσεις μόνη της, ό,τι προγραμματισμό και να της κάνουμε θα μπορεί να αποφασίζει πάντα υπέρ του προσωπικού της συμφέροντος και όχι του δικού μας, όποιο και αν είναι το συμφέρον της.
(photo: pixabay)
ΠΟΛΙΤΙΚΟΛΟΓΙΕΣ
ΠΡΕΠΕΙ ΝΑ ΔΙΑΒΑΣΕΤΕ
ΠΑΡΑΞΕΝΑ
LATEST
- Ποιά ώρα να τρώμε βραδινό για να μην πάρουμε βάρος και να μην αυξηθεί το σάκχαρο
- Οι ΗΠΑ αναχαίτισαν ένα ακόμη πλοίο κοντά στη Βενεζουέλα
- Αποκλεισμένη η διέλευση οχημάτων στα Πράσινα Φανάρια – Κλειστός για μεταφορές ο Προμαχώνας
- Χιλιάδες ντυμένοι με στολές…γιόρτασαν το χειμερινό ηλιοστάσιο στο Στόουνχεντζ, vid
- Σκωτία: Τι αποκάλυψε μυστηριώδης μαζική ταφή 3.000 ετών της Εποχής του Χαλκού
- ΕΛΑΣ: Εξιχνιάσθηκε ένοπλη ληστεία με λεία 180.000 ευρώ – Δύο συλλήψεις
- Το θέμα που συντηρείται ακόμα – Οι κοινωνίες πρέπει να ανησυχούν;
- Το ρομπότ Optimus του Έλον Μασκ σερβίρει ποπκορν στο Βερολίνο! vid
- Εξερευνήτρια ολοκλήρωσε τη διαδρομή από την “τελευταία μοίρα” μέχρι τον Νότιο Πόλο
- Λαμία: Οι αγρότες άνοιξαν τις μπάρες στα διόδια Τραγάνας επιτρέποντας την ελεύθερη διέλευση των οχημάτων









