EL - Νέο μοντέλο AI δημιουργεί "ψηφιακούς κόσμους" σε πραγματικό χρόνο! vid

Η εταιρεία υπόσχεται επίσης ότι οι χρήστες θα μπορούν να αλληλεπιδρούν με τους κόσμους για πολύ περισσότερο χρόνο από πριν και ότι το μοντέλο θα θυμάται πραγματικά πού βρίσκονται τα πράγματα όταν αποστρέφετε το βλέμμα σας από αυτά.

Τα “world models” είναι ένας τύπος συστήματος τεχνητής νοημοσύνης που μπορεί να προσομοιώσει περιβάλλοντα για σκοπούς όπως η εκπαίδευση, η ψυχαγωγία ή για να βοηθήσει στην εκπαίδευση ρομπότ ή πρακτόρων τεχνητής νοημοσύνης. Με τα “world models”, δίνετε μια εντολή και δημιουργείται ένας χώρος στον οποίο μπορείτε να κινηθείτε όπως θα κάνατε σε ένα βιντεοπαιχνίδι, αλλά αντί ο κόσμος να είναι χειροποίητος με τρισδιάστατα στοιχεία, όλα δημιουργούνται με τεχνητή νοημοσύνη.

Η εταιρεία παρουσίασε το Genie 2 τον Δεκέμβριο , το οποίο θα μπορούσε να δημιουργήσει διαδραστικούς κόσμους βασισμένους σε μια εικόνα, και δημιουργεί μια ομάδα μοντέλων κόσμων με επικεφαλής έναν πρώην συν-επικεφαλής του εργαλείου δημιουργίας βίντεο Sora της OpenAI .

Οι χρήστες θα μπορούν να δημιουργούν κόσμους με μια προτροπή που υποστηρίζει «λίγα» λεπτά συνεχούς αλληλεπίδρασης, η οποία είναι μεγαλύτερη από τα 10-20 δευτερόλεπτα αλληλεπίδρασης που είναι δυνατά με το Genie 2, σύμφωνα με μια ανάρτηση ιστολογίου . Η Google λέει ότι το Genie 3 μπορεί να διατηρεί χώρους στην οπτική μνήμη για περίπου ένα λεπτό, πράγμα που σημαίνει ότι αν απομακρυνθείτε από κάτι σε έναν κόσμο και μετά επιστρέψετε σε αυτό, πράγματα όπως μπογιά σε έναν τοίχο ή γράψιμο σε έναν πίνακα θα βρίσκονται στην ίδια θέση. Οι κόσμοι θα έχουν επίσης ανάλυση 720p και θα τρέχουν στα 24fps.

Το DeepMind προσθέτει και στο Genie 3 αυτό που αποκαλεί “promptable world events”. Χρησιμοποιώντας μια προτροπή, θα μπορείτε να κάνετε πράγματα όπως να αλλάξετε τις καιρικές συνθήκες σε έναν κόσμο ή να προσθέσετε νέους χαρακτήρες.

Ωστόσο, αυτό πιθανότατα δεν είναι ένα μοντέλο που θα μπορείτε να δοκιμάσετε μόνοι σας. Κυκλοφορεί ως «μια περιορισμένη ερευνητική προεπισκόπηση» που θα είναι διαθέσιμη σε «μια μικρή ομάδα ακαδημαϊκών και δημιουργών», ώστε οι προγραμματιστές του να μπορούν να κατανοήσουν καλύτερα τους κινδύνους και πώς να τους μετριάσουν κατάλληλα, σύμφωνα με την Google. Υπάρχουν επίσης πολλοί περιορισμοί, όπως οι περιορισμένοι τρόποι με τους οποίους οι χρήστες μπορούν να αλληλεπιδράσουν με τους ψηφιακούς κόσμους και ότι το ευανάγνωστο κείμενο «συχνά δημιουργείται μόνο όταν παρέχεται στην περιγραφή του κόσμου εισόδου».

Η Google λέει ότι «εξερευνά» πώς να φέρει το Genie 3 σε «πρόσθετους δοκιμαστές» στο μέλλον.

Δείτε ΒΙΝΤΕΟ ΕΔΩ

photo: pixabay