03-02-2024 13:25

Έρευνα έδειξε ότι ήδη η AI έχει ξεπεράσει τους ανθρώπους στη δημιουργική σκέψη

Το ChatGPT-4 αντιμετώπισε 151 ανθρώπους συμμετέχοντες σε τρία τεστ αποκλίνουσας σκέψης, αποκαλύπτοντας ότι η τεχνητή νοημοσύνη επέδειξε υψηλότερο επίπεδο δημιουργικότητας. Οι δοκιμές, σχεδιασμένες για να αξιολογήσουν την ικανότητα δημιουργίας μοναδικών λύσεων, έδειξαν ότι το GPT-4 παρέχει πιο πρωτότυπες και περίπλοκες απαντήσεις.

Σε μια πρόσφατη μελέτη, 151 συμμετέχοντες αντιμετώπισαν το ChatGPT-4 σε τρία τεστ που σχεδιάστηκαν για τη μέτρηση της αποκλίνουσας σκέψης, η οποία θεωρείται δείκτης δημιουργικής σκέψης.

Η αποκλίνουσα σκέψη χαρακτηρίζεται από την ικανότητα δημιουργίας μιας μοναδικής λύσης σε μια ερώτηση που δεν έχει μία αναμενόμενη λύση, όπως «Ποιος είναι ο καλύτερος τρόπος για να αποφύγω να μιλήσω για πολιτική με τους γονείς μου;» Στη μελέτη, το GPT-4 έδωσε πιο πρωτότυπες και περίπλοκες απαντήσεις από τους ανθρώπους που συμμετείχαν.

Συνολικά, το GPT-4 ήταν πιο πρωτότυπο και πιο περίτεχνο από τους ανθρώπους σε καθεμία από τις αποκλίνουσες εργασίες σκέψης, ακόμη και όταν ελέγχεται η ευχέρεια των απαντήσεων.

Η μελέτη, «Η τρέχουσα κατάσταση των μοντέλων παραγωγής γλώσσας τεχνητής νοημοσύνης είναι πιο δημιουργική από τους ανθρώπους σε αποκλίνουσες εργασίες σκέψης», δημοσιεύτηκε στο Scientific Reports και συντάχθηκε από τους U of A Ph.D. φοιτητές της ψυχολογικής επιστήμης, Kent F. Hubert και Kim N. Awa, καθώς και από τη Darya L. Zabelina, επίκουρη καθηγήτρια ψυχολογικής επιστήμης στο U of A και διευθύντρια του Εργαστηρίου Μηχανισμών Δημιουργικής Γνώσης και Προσοχής.

Οι τρεις δοκιμές που χρησιμοποιήθηκαν ήταν η Εργασία Εναλλακτικής Χρήσης, η οποία ζητά από τους συμμετέχοντες να βρουν δημιουργικές χρήσεις για καθημερινά αντικείμενα όπως ένα σχοινί ή ένα πιρούνι, την Εργασία Συνεπειών, η οποία καλεί τους συμμετέχοντες να φανταστούν πιθανά αποτελέσματα υποθετικών καταστάσεων, όπως «τι θα γινόταν αν οι άνθρωποι δεν χρειάζονταν πλέον ύπνο;» και το Divergent Associations Task, το οποίο ζητά από τους συμμετέχοντες να δημιουργήσουν 10 ουσιαστικά που είναι όσο το δυνατόν πιο απομακρυσμένα σημασιολογικά. Για παράδειγμα, δεν υπάρχει μεγάλη σημασιολογική απόσταση μεταξύ «σκύλου» και «γάτας», ενώ υπάρχει μεγάλη διαφορά μεταξύ λέξεων όπως «γάτα» και «οντολογία».

Οι απαντήσεις αξιολογήθηκαν για τον αριθμό των απαντήσεων, τη διάρκεια της απάντησης και τη σημασιολογική διαφορά μεταξύ των λέξεων. Τελικά, οι συγγραφείς διαπίστωσαν ότι «Συνολικά, το GPT-4 ήταν πιο πρωτότυπο και πιο περίτεχνο από τους ανθρώπους σε καθεμία από τις αποκλίνουσες εργασίες σκέψης, ακόμη και όταν ελέγχεται η ευχέρεια των απαντήσεων. Με άλλα λόγια, το GPT-4 έδειξε υψηλότερο δημιουργικό δυναμικό σε μια ολόκληρη σειρά διαφορετικών εργασιών σκέψης».

Αυτό το εύρημα συνοδεύεται από ορισμένες επιφυλάξεις. Οι συγγραφείς δηλώνουν, «Είναι σημαντικό να σημειωθεί ότι τα μέτρα που χρησιμοποιούνται σε αυτή τη μελέτη είναι όλα μέτρα δημιουργικού δυναμικού, αλλά η συμμετοχή σε δημιουργικές δραστηριότητες ή επιτεύγματα είναι μια άλλη πτυχή της μέτρησης της δημιουργικότητας ενός ατόμου».

Ο σκοπός της μελέτης ήταν να εξετάσει το δημιουργικό δυναμικό σε ανθρώπινο επίπεδο, όχι απαραίτητα άτομα που μπορεί να έχουν επιδείξει δημιουργικά διαπιστευτήρια.

Οι Hubert και Awa σημειώνουν περαιτέρω ότι «το AI, σε αντίθεση με τους ανθρώπους, δεν έχει αυτενέργεια» και «εξαρτάται από τη βοήθεια ενός ανθρώπου χρήστη. Ως εκ τούτου, το δημιουργικό δυναμικό της τεχνητής νοημοσύνης βρίσκεται σε συνεχή κατάσταση στασιμότητας, εκτός εάν ζητηθεί».

Επίσης, οι ερευνητές δεν αξιολόγησαν την καταλληλότητα των αποκρίσεων GPT-4. Έτσι, ενώ το AI μπορεί να έχει δώσει περισσότερες απαντήσεις και πιο πρωτότυπες απαντήσεις, οι συμμετέχοντες μπορεί να ένιωσαν ότι περιορίζονταν στις απαντήσεις τους που έπρεπε να γειωθούν στον πραγματικό κόσμο.

Ο Awa αναγνώρισε επίσης ότι το ανθρώπινο κίνητρο για να γράψει περίπλοκες απαντήσεις μπορεί να μην ήταν υψηλό και είπε ότι υπάρχουν πρόσθετες ερωτήσεις σχετικά με το «πώς θέτεις σε λειτουργία τη δημιουργικότητα; Μπορούμε πραγματικά να πούμε ότι η χρήση αυτών των δοκιμών για ανθρώπους μπορεί να γενικευτεί σε διαφορετικούς ανθρώπους; Αξιολογεί ένα ευρύ φάσμα δημιουργικής σκέψης; Επομένως, νομίζω ότι μας κάνει να εξετάσουμε κριτικά ποια είναι τα πιο δημοφιλή μέτρα αποκλίνουσας σκέψης».

Το αν τα τεστ είναι τέλεια μέτρα του ανθρώπινου δημιουργικού δυναμικού δεν είναι πραγματικά το θέμα. Το θέμα είναι ότι τα μεγάλα γλωσσικά μοντέλα προχωρούν γρήγορα και ξεπερνούν τους ανθρώπους με τρόπους που δεν είχε γίνει πριν. Το αν αποτελούν απειλή για την αντικατάσταση της ανθρώπινης δημιουργικότητας μένει να φανεί.

Προς το παρόν, οι συγγραφείς συνεχίζουν να βλέπουν ότι «προχωρώντας προς τα εμπρός, οι μελλοντικές δυνατότητες της τεχνητής νοημοσύνης που λειτουργεί ως εργαλείο έμπνευσης, ως βοήθημα στη δημιουργική διαδικασία ενός ατόμου ή για να ξεπεράσει τη σταθερότητα, είναι πολλά υποσχόμενες».

(photo: pixabay)