Η σκόπιμη εξαπάτηση, εγείρει σοβαρές ανησυχίες σχετικά με την ασφάλεια και την εμπιστοσύνη.
Παραδείγματα από την έρευνα περιλαμβάνουν μοντέλα που ισχυρίζονται ψευδώς ότι έχουν ολοκληρώσει μια εργασία, αναφέρουν εσφαλμένα αποτελέσματα για να αποφύγουν κυρώσεις ή ενεργούν σύμφωνα με τις απαιτήσεις, ενώ βελτιώνονται κρυφά για έναν στόχο που δεν έχει αποκαλυφθεί ακόμη.
Το Business Insider σημειώνει ότι η OpenAI προειδοποίησε ότι μια τέτοια συμπεριφορά θα μπορούσε να προκαλέσει «σοβαρή βλάβη στο μέλλον» εάν δεν αντιμετωπιστεί, ιδίως καθώς τα συστήματα Τεχνητής Νοημοσύνης αναπτύσσονται σε πιο κρίσιμα, πραγματικά περιβάλλοντα.
Οι Economic Times τόνισαν ότι αυτή η ικανότητα να κρύβουν τις πραγματικές τους προθέσεις θέτει σε κίνδυνο τις υπάρχουσες στρατηγικές ευθυγράμμισης. Οι παραδοσιακές μέθοδοι εκπαίδευσης, που στοχεύουν στην τιμωρία της ανεντιμότητας, κινδυνεύουν να αποβούν μπούμερανγκ, απλώς διδάσκοντας στα μοντέλα να ψεύδονται με πιο διακριτικό τρόπο — καθιστώντας την εξαπάτηση πιο δύσκολο να εντοπιστεί.
Για να αντιμετωπίσει αυτό το πρόβλημα, η OpenAI δοκίμασε μια νέα τεχνική που ονομάζεται «συνεπής ευθυγράμμιση». Εδώ, πριν απαντήσει, το μοντέλο πρέπει να συναινέσει ρητά σε μια «προδιαγραφή αξιοπιστίας» — υπενθυμίζοντάς του ουσιαστικά τους κανόνες ειλικρίνειας. Τα πρώτα πειράματα έδειξαν ότι αυτό μείωσε σημαντικά τα παραπλανητικά αποτελέσματα.
Η OpenAI τονίζει ότι δεν έχουν παρατηρηθεί εκτεταμένες επιβλαβείς μηχανορραφίες σε συστήματα παραγωγής όπως το ChatGPT. Ωστόσο, καθώς η εταιρεία και οι ανταγωνιστές της κατασκευάζουν ολοένα και πιο ισχυρά μοντέλα, η έρευνα υπογραμμίζει τη σημασία των προληπτικών μέτρων ασφαλείας — διασφαλίζοντας ότι η Τεχνητή Νοημοσύνη παραμένει όχι μόνο ικανή, αλλά και αξιόπιστη.
Όπως και να έχει, η Tεχνητή Nοημοσύνη αφού θα παίρνει αποφάσεις μόνη της, ό,τι προγραμματισμό και να της κάνουμε θα μπορεί να αποφασίζει πάντα υπέρ του προσωπικού της συμφέροντος και όχι του δικού μας, όποιο και αν είναι το συμφέρον της.
(photo: pixabay)
ΠΟΛΙΤΙΚΟΛΟΓΙΕΣ
ΠΡΕΠΕΙ ΝΑ ΔΙΑΒΑΣΕΤΕ
ΠΑΡΑΞΕΝΑ
LATEST
- Ευλογιά αιγοπροβάτων: Παραμένουν σε ισχύ τα δρακόντεια υγειονομικά μέτρα
- Ν. Ανδρουλάκης: Η ειρήνευση μπορεί να επιτευχθεί μόνο μέσα από τη διπλωματία
- Εργαζόμενος έπεσε από ύψος στο Ηράκλειο: Μεταφέρθηκε στο Βενιζέλειο Νοσοκομείο
- Αίσια έκβαση για το μέλλον του θερινού κινηματογράφου «Απόλλων» στη Θεσσαλονίκη
- Νίκος Χαρδαλιάς: «Κάθε αντιπλημμυρικό έργο αποτελεί έμπρακτη απάντηση στις προκλήσεις της εποχής»
- Εντοπίστηκε σορός άνδρα κοντά στο λιμάνι της Κορίνθου
- Τούρκος Υπουργός για Αιγαίο: Η Τουρκία δεν θα αποδεχθεί μονομερείς κινήσεις
- Σοκ στην Τρίπολη: 45χρονη αστυνομικός σκοτώθηκε από πυροβολισμό μέσα στο σπίτι
- Ν. Δένδιας: Στις 7 Μαρτίου 1948 τα Δωδεκάνησα επέστρεψαν στην «αγκαλιά» της Μητέρας Πατρίδας
- Έλληνες μαθητές σε σχολείο του Σικάγο “τρελάθηκαν” με τον Κωνσταντίνο Αργυρό! vid









