Η κινεζική νεοφυής εταιρεία τεχνητής νοημοσύνης DeepSeek εισήγαγε έναν νέο τρόπο για να βελτιώσει τις συλλογιστικές δυνατότητες των μεγάλων γλωσσικών μοντέλων (LLM) για να προσφέρει καλύτερα και ταχύτερα αποτελέσματα σε γενικά ερωτήματα από τους ανταγωνιστές της.
Η DeepSeek πυροδότησε φρενίτιδα τον Ιανουάριο όταν ήρθε στη σκηνή με το R1, ένα μοντέλο τεχνητής νοημοσύνης (AI) και chatbot που η εταιρεία ισχυρίστηκε ότι ήταν φθηνότερο και είχε εξίσου καλή απόδοση με το ανταγωνιστικό μοντέλο ChatGPT της OpenAI.
Σε συνεργασία με ερευνητές από το πανεπιστήμιο Tsinghua της Κίνας, η DeepSeek είπε στην τελευταία της εργασία που κυκλοφόρησε την Παρασκευή ότι είχε αναπτύξει μια τεχνική για αυτοβελτιωτικά μοντέλα τεχνητής νοημοσύνης.
Η υποκείμενη τεχνολογία ονομάζεται συντονισμός αυτο-αρχών κριτικής ή self-principled critique tuning (SPCT), η οποία εκπαιδεύει την τεχνητή νοημοσύνη να αναπτύσσει τους δικούς της κανόνες για την κρίση περιεχομένου και στη συνέχεια χρησιμοποιεί αυτούς τους κανόνες για να παρέχει λεπτομερείς κριτικές.
Αυτή η προσέγγιση είναι γνωστή ως Generative Reward Modeling (GRM), ένα σύστημα μηχανικής μάθησης που ελέγχει και βαθμολογεί τι παράγουν τα μοντέλα AI, διασφαλίζοντας ότι ταιριάζουν με αυτό που ζητούν οι άνθρωποι με το SPCT.
Πώς λειτουργεί;
Συνήθως, η βελτίωση της τεχνητής νοημοσύνης απαιτεί να μεγαλώνουν τα μοντέλα κατά τη διάρκεια της εκπαίδευσης, κάτι που απαιτεί μεγάλη ανθρώπινη προσπάθεια και υπολογιστική ισχύ. Αντίθετα, η DeepSeek δημιούργησε ένα σύστημα με ενσωματωμένο «κριτή» που αξιολογεί τις απαντήσεις της AI σε πραγματικό χρόνο.
Όταν κάνετε μια ερώτηση, αυτός ο κριτής συγκρίνει την προγραμματισμένη απάντηση της AI τόσο με τους βασικούς κανόνες της AI όσο και με το πώς θα πρέπει να είναι μια καλή απάντηση.
Εάν υπάρχει στενή αντιστοιχία, η AI λαμβάνει θετικά σχόλια, τα οποία την βοηθούν να αυτοβελτιωθεί.
Η DeepSeek ονομάζει αυτό το αυτοβελτιωμένο σύστημα “DeepSeek-GRM”. Οι ερευνητές είπαν ότι αυτό θα βοηθούσε τα μοντέλα να έχουν καλύτερες επιδόσεις από ανταγωνιστές όπως το Gemini της Google, το Llama της Meta και το GPT-4o του OpenAI.
Η DeepSeek σχεδιάζει να διαθέσει αυτά τα προηγμένα μοντέλα τεχνητής νοημοσύνης ως λογισμικό ανοιχτού κώδικα, αλλά δεν έχει δοθεί χρονοδιάγραμμα.
photo: pixabay
ΠΟΛΙΤΙΚΟΛΟΓΙΕΣ
ΠΡΕΠΕΙ ΝΑ ΔΙΑΒΑΣΕΤΕ
ΠΑΡΑΞΕΝΑ
LATEST
- Ποδόσφαιρο-Αγγλία: Μάντσεστερ Σίτι εναντίον Λίβερπουλ έβγαλε η κληρωτίδα στα προημιτελικά του Κυπέλλου Αγγλίας
- Ποδόσφαιρο-Μουντιάλ 2026: Το Ιράκ ζητά να αναβληθεί ο αγώνας μπαράζ για την πρόκριση λόγω Μ. Ανατολής
- Το Ιράν προειδοποιεί ότι θα αυξήσει ισχύ, συχνότητα και βεληνεκές των πυραύλων που εκτοξεύει
- ΥΠΑ: Αλλαγές λόγω εργασιών στον διάδρομο του αεροδρομίου Χίου – Ποιες πτήσεις θα γίνονται από την Πέμπτη 12 Μαρτίου
- H G7 προσανατολίζεται στην άντληση πετρελαίου από τα στρατηγικά αποθέματα των χωρών, σύμφωνα με τον Μακρόν
- Τραμ: Παρατείνονται οι κυκλοφοριακές ρυθμίσεις στη Γραμμή 6 «Πικροδάφνη-Σύνταγμα» – Τερματικός σταθμός η στάση «Φιξ»
- Μέση Ανατολή: Στο στόχαστρο των επιθέσεων και το νερό – Τι μπορεί να ξεσπάσει ανά πάσα στιγμή
- Θεσσαλονίκη: Στη φυλακή 28χρονος που ανάγκαζε 13χρονη να του στέλνει γυμνές φωτογραφίες και βίντεο
- Bruno Mars: Ιστορική επιστροφή στην κορυφή του Billboard 200 μετά από 13 χρόνια!
- Στο τουρκικό ΥΠΕΞ κλήθηκε ο Ιρανός πρέσβης για την εκτόξευση βαλλιστικού πυραύλου προς την Τουρκία









