Το φαινόμενο έχει αιφνιδιάσει πολλούς αγγλόφωνους Αμερικανούς τον τελευταίο μήνα, με ορισμένους να μοιράζονται εικόνες στα μέσα κοινωνικής δικτύωσης με απαντήσεις που δημιουργούνται μέσω “ΑΙ” και στις οποίες εμφανίζεται τυχαία αραβικό κείμενο στις συνομιλίες τους.
«Το έκανε δύο φορές στο τηλέφωνό μου και μία φορά στον φορητό υπολογιστή της δουλειάς μου, δεν βρίσκομαι καν σε αραβόφωνη χώρα», έγραψε ένα άτομο στο Reddit, δείχνοντας πώς το δημοφιλές chatbot άρχισε να τους δίνει υλικά για συνταγές στα αραβικά πριν από δύο εβδομάδες.
Άλλοι ανέφεραν ότι οι αριθμοί άλλαξαν επίσης σε αραβικά και ότι η τεχνητή νοημοσύνη άρχισε ακόμη και να ανταποκρίνεται σε αγγλόφωνες ερωτήσεις χρησιμοποιώντας αρμενικά, εβραϊκά, ισπανικά, κινέζικα και ρωσικά.
Ενώ κάποιοι απέδωσαν το παράξενο κείμενο σε σφάλματα τεχνητής νοημοσύνης, όταν τα chatbot παράγουν απαντήσεις που είναι λανθασμένες ή εντελώς ανόητες, το πρόβλημα φαίνεται να πηγάζει από τον τρόπο με τον οποίο εκπαιδεύτηκε το ChatGPT.
Το ChatGPT, το οποίο είναι επίσης γνωστό ως μοντέλο μεγάλης γλώσσας (LLM), δεν διαβάζει ολόκληρες λέξεις όπως οι άνθρωποι, αλλά διασπά το κείμενο σε μικρά κομμάτια που ονομάζονται «συμβολοσειρές», τα οποία μπορεί να είναι μέρη λέξεων, σημεία στίξης ή ακόμα και σύντομες λέξεις από άλλες γλώσσες.
Επειδή ορισμένες ξένες λέξεις είναι μικρότερες και πιο εύκολες στην επεξεργασία από το σύστημα, το μοντέλο μπορεί περιστασιακά να τις επιλέξει εάν ταιριάζουν στο πλαίσιο και απαιτούν λιγότερα tokens.
Αυτό δεν σημαίνει ότι η Τεχνητή Νοημοσύνη αλλάζει γλώσσες σκόπιμα, αλλά απλώς επιλέγει το πιο πιθανό επόμενο κομμάτι κειμένου με βάση τις πιθανότητες.
Το ChatGPT, το οποίο φέρεται να χρησιμοποιείται από σχεδόν 900 εκατομμύρια ανθρώπους κάθε μήνα, δημιουργήθηκε από την εταιρεία τεχνητής νοημοσύνης OpenAI το 2022.
Επιτρέπει στους χρήστες να πληκτρολογούν ερωτήσεις ή προτροπές σε κανονική γλώσσα και απαντά με εκπληκτικά ανθρώπινο κείμενο. Εκατομμύρια το έχουν χρησιμοποιήσει για να γράψουν δοκίμια, να εξηγήσουν έννοιες, να δημιουργήσουν ιστορίες, να μεταφράσουν γλώσσες, να λύσουν προβλήματα ή απλώς να συνομιλήσουν.
Ενώ πολλά chatbot ΑΙ ακολούθησαν, το GPT συνεχίζει να κυριαρχεί στην αγορά, ελέγχοντας σχεδόν τα δύο τρίτα του αναπτυσσόμενου κλάδου.
Πριν από δύο χρόνια, οι χρήστες του GPT ανέφεραν πάλι εκτεταμένα περιστατικά δημιουργίας «ασυναρτησιών», τα οποία προκλήθηκαν από ένα εσωτερικό σφάλμα αντιστοίχισης διακριτικών κατά τη διάρκεια μιας ενημέρωσης.
Οι χρήστες των μέσων κοινωνικής δικτύωσης που έχουν μοιραστεί αυτές τις μυστηριώδεις απαντήσεις έχουν επισημάνει ότι οι λέξεις σε άλλες γλώσσες δεν ήταν ασυναρτησίες. Στις περισσότερες περιπτώσεις, η λέξη είχε στην πραγματικότητα την ίδια σημασία με την αγγλική λέξη την οποία αντικαθιστούσε.
Ένας χρήστης του Reddit απάντησε στην εικόνα της συνταγής, εξηγώντας: «Η λέξη σημαίνει χαμηλή σε λιπαρά. Φαίνεται λοιπόν ότι λείπει μια λέξη. Πιθανώς γιαούρτι χαμηλών λιπαρών».
Για να κατανοήσουμε γιατί το ChatGPT έστελνε σε αμέτρητους χρήστες απαντήσεις στα αραβικά, είναι χρήσιμο να δούμε τι είναι στην πραγματικότητα τα «tokens».
Τα διακριτικά που χρησιμοποιούνται από τα chatbots τεχνητής νοημοσύνης μπορούν να περιλαμβάνουν ολόκληρες λέξεις (όπως «γεια»), μέρη λέξεων (όπως «un-» ή «-ing»), σημεία στίξης και μικρότερες φράσεις σε ξένες γλώσσες.
Επομένως, το ChatGPT θα αναζητήσει τον πιο αποτελεσματικό τρόπο για να απαντήσει στην προτροπή ενός ανθρώπου, χρησιμοποιώντας την επόμενη πιο λογική λέξη ή φράση για να ολοκληρώσει τη σκέψη του με βάση όλα τα δεδομένα με τα οποία έχει εκπαιδευτεί το chatbot.
Όπως έχουν διαπιστώσει πρόσφατα οι χρήστες, η Τεχνητή Νοημοσύνη μπορεί να αποφασίσει ότι ο πιο αποτελεσματικός τρόπος για να απαντήσει στην ερώτηση κάποιου είναι να πληκτρολογήσει ένα διακριτικό αντί για (π.χ.) τρία – ακόμα κι αν η εναλλακτική λύση είναι μια αραβική λέξη που ο χρήστης δεν καταλαβαίνει.
Ωστόσο, κάποιοι ισχυρίστηκαν χωρίς αποδεικτικά στοιχεία ότι τα σφάλματα δεν ήταν τυχαία, λέγοντας ότι οι προηγούμενες εκδόσεις του ChatGPT δεν έστελναν ποτέ απαντήσεις αναμεμειγμένες με λέξεις σε ξένες γλώσσες.
«Αυτή είναι η πρώτη φορά που το κάνει αυτό και χρησιμοποιώ τεχνητή νοημοσύνη εδώ και χρόνια. Δεν μπορεί να είναι τυχαίο λάθος», είπε ένας χρήστης του GPT που έπαθε το ίδιο.
Ένα άλλο άτομο στα μέσα κοινωνικής δικτύωσης δημοσίευσε ότι το ChatGPT ισχυρίστηκε ότι μια αραβική λέξη «μπήκε στο κείμενο» ενώ απαντούσε.
«Αδερφέ, μιλάω αγγλικά. Γιατί απαντάς στα αραβικά;» δημοσίευσε ο χρήστης του GPT στο X.
”Η λέξη μπήκε κατά λάθος.” ΜΠΗΚΕ ΚΑΤΑ ΛΑΘΟΣ;;; Είναι ένα εντελώς διαφορετικό αλφάβητο.
photo: pixabay









