Η εταιρεία υπόσχεται επίσης ότι οι χρήστες θα μπορούν να αλληλεπιδρούν με τους κόσμους για πολύ περισσότερο χρόνο από πριν και ότι το μοντέλο θα θυμάται πραγματικά πού βρίσκονται τα πράγματα όταν αποστρέφετε το βλέμμα σας από αυτά.
Τα “world models” είναι ένας τύπος συστήματος τεχνητής νοημοσύνης που μπορεί να προσομοιώσει περιβάλλοντα για σκοπούς όπως η εκπαίδευση, η ψυχαγωγία ή για να βοηθήσει στην εκπαίδευση ρομπότ ή πρακτόρων τεχνητής νοημοσύνης. Με τα “world models”, δίνετε μια εντολή και δημιουργείται ένας χώρος στον οποίο μπορείτε να κινηθείτε όπως θα κάνατε σε ένα βιντεοπαιχνίδι, αλλά αντί ο κόσμος να είναι χειροποίητος με τρισδιάστατα στοιχεία, όλα δημιουργούνται με τεχνητή νοημοσύνη.
Η εταιρεία παρουσίασε το Genie 2 τον Δεκέμβριο , το οποίο θα μπορούσε να δημιουργήσει διαδραστικούς κόσμους βασισμένους σε μια εικόνα, και δημιουργεί μια ομάδα μοντέλων κόσμων με επικεφαλής έναν πρώην συν-επικεφαλής του εργαλείου δημιουργίας βίντεο Sora της OpenAI .
Οι χρήστες θα μπορούν να δημιουργούν κόσμους με μια προτροπή που υποστηρίζει «λίγα» λεπτά συνεχούς αλληλεπίδρασης, η οποία είναι μεγαλύτερη από τα 10-20 δευτερόλεπτα αλληλεπίδρασης που είναι δυνατά με το Genie 2, σύμφωνα με μια ανάρτηση ιστολογίου . Η Google λέει ότι το Genie 3 μπορεί να διατηρεί χώρους στην οπτική μνήμη για περίπου ένα λεπτό, πράγμα που σημαίνει ότι αν απομακρυνθείτε από κάτι σε έναν κόσμο και μετά επιστρέψετε σε αυτό, πράγματα όπως μπογιά σε έναν τοίχο ή γράψιμο σε έναν πίνακα θα βρίσκονται στην ίδια θέση. Οι κόσμοι θα έχουν επίσης ανάλυση 720p και θα τρέχουν στα 24fps.
Το DeepMind προσθέτει και στο Genie 3 αυτό που αποκαλεί “promptable world events”. Χρησιμοποιώντας μια προτροπή, θα μπορείτε να κάνετε πράγματα όπως να αλλάξετε τις καιρικές συνθήκες σε έναν κόσμο ή να προσθέσετε νέους χαρακτήρες.
Ωστόσο, αυτό πιθανότατα δεν είναι ένα μοντέλο που θα μπορείτε να δοκιμάσετε μόνοι σας. Κυκλοφορεί ως «μια περιορισμένη ερευνητική προεπισκόπηση» που θα είναι διαθέσιμη σε «μια μικρή ομάδα ακαδημαϊκών και δημιουργών», ώστε οι προγραμματιστές του να μπορούν να κατανοήσουν καλύτερα τους κινδύνους και πώς να τους μετριάσουν κατάλληλα, σύμφωνα με την Google. Υπάρχουν επίσης πολλοί περιορισμοί, όπως οι περιορισμένοι τρόποι με τους οποίους οι χρήστες μπορούν να αλληλεπιδράσουν με τους ψηφιακούς κόσμους και ότι το ευανάγνωστο κείμενο «συχνά δημιουργείται μόνο όταν παρέχεται στην περιγραφή του κόσμου εισόδου».
Η Google λέει ότι «εξερευνά» πώς να φέρει το Genie 3 σε «πρόσθετους δοκιμαστές» στο μέλλον.
Δείτε ΒΙΝΤΕΟ ΕΔΩ
photo: pixabay
ΠΟΛΙΤΙΚΟΛΟΓΙΕΣ
ΠΡΕΠΕΙ ΝΑ ΔΙΑΒΑΣΕΤΕ
ΠΑΡΑΞΕΝΑ
LATEST
- Θεσσαλονίκη: Ακυρώνονται τρεις παραστάσεις του ΚΘΒΕ λόγω στάσης εργασίας των εργαζομένων του
- Θεσ/νίκη: Χειροπέδες σε Έλληνα καταζητούμενο για μεγάλη υπόθεση φοροδιαφυγής σχεδόν 30 εκατ. ευρώ
- Μέγαρο Μουσικής: Το καλλιτεχνικό πρόγραμμα για την αρχή του 2026 – Τον Φεβρουάριο το αφιέρωμα στον Ραχμάνινοφ
- Γεωπολιτική «απόδραση» της Ρωσίας μέσω Ιράν – Τεράστια εξέλιξη για την Μόσχα
- Παρίσι: Η διεύθυνση του Λούβρου ανακοίνωσε πως το μουσείο λειτουργεί εν μέρει, παρά την απεργία
- Θεσσαλονίκη: Το ρομπότ Pepper μαθαίνει στους καταναλωτές τα δικαιώματά τους – Δείτε βίντεο
- ΟΠΕΚΕΠΕ και ΕΛΓΑ: Ολοκληρώθηκαν οι πληρωμές 487,9 εκατ. – Επιπλέον 600 εκατ. ευρώ μέχρι 31/12
- Βενεζουέλα: Απέπλευσαν δύο τάνκερ με υποπροϊόντα πετρελαίου
- ΑΑΔΕ: Καταβλήθηκε η τέταρτη δόση της αυξημένης επιστροφής ΕΦΚ πετρελαίου για αγρότες
- Εθνική Στρατηγική Κυβερνοασφάλειας 2026 –2030: Οδικός χάρτης για ένα ασφαλές ψηφιακό μέλλον στην Ελλάδα









