Κυριακή 29 Ιουνίου 2025

Η τελευταία ενημέρωση R1 του DeepSeek προσελκύει την παγκόσμια προσοχή των μέσων ενημέρωσης

Δημοσιεύτηκε: 29 Μαΐου 2025, 10:26 μ.μ.
βαθιά αναζήτηση

βαθιά αναζήτηση


Η κινεζική τεχνολογική νεοσύστατη εταιρεία DeepSeek κυκλοφόρησε μια ενημέρωση για το μοντέλο συλλογισμού R1 την Πέμπτη, προσελκύοντας αυξανόμενη προσοχή από πολλά μέσα ενημέρωσης, με ορισμένα από αυτά να λένε ότι η τελευταία κίνηση πρόκειται να εντείνει τον ανταγωνισμό με την OpenAI. 

Σύμφωνα με τον επίσημο λογαριασμό της στο WeChat, το τελευταίο μοντέλο, DeepSeek-R1-0528, εξακολουθεί να βασίζεται στο μοντέλο DeepSeek V3 Base που κυκλοφόρησε τον Δεκέμβριο του 2024, αλλά έχει υποβληθεί σε περαιτέρω εκπαίδευση με αυξημένους υπολογιστικούς πόρους, ενισχύοντας σημαντικά το βάθος σκέψης και τις δυνατότητες συλλογισμού του.

Το ενημερωμένο μοντέλο R1 έχει επιτύχει κορυφαία απόδοση μεταξύ όλων των εγχώριων μοντέλων σε πολλαπλές αξιολογήσεις benchmark - συμπεριλαμβανομένων των μαθηματικών, του προγραμματισμού και της γενικής λογικής - με τη συνολική απόδοση να πλησιάζει εκείνη των κορυφαίων διεθνών μοντέλων όπως το o3 και το Gemini 2.5 Pro, σύμφωνα με την εταιρεία.

Νωρίς την Πέμπτη, η DeepSeek κυκλοφόρησε το R1-0528 στην πλατφόρμα προγραμματιστών Hugging Face. Τα διεθνή μέσα ενημέρωσης παρακολούθησαν στενά την τελευταία ενημέρωση μοντέλου από την DeepSeek.

Το Reuters ανέφερε την Πέμπτη ότι η κυκλοφορία εντείνει τον ανταγωνισμό με τους Αμερικανούς αντιπάλους όπως η OpenAI. Ο πίνακας κατάταξης LiveCodeBench, ένας πίνακας αναφοράς που αναπτύχθηκε από ερευνητές από το UC Berkeley, το MIT και το Cornell, κατέταξε το ενημερωμένο μοντέλο συλλογισμού R1 της DeepSeek ελαφρώς πίσω από τα μοντέλα συλλογισμού o4 mini και o3 της OpenAI στην παραγωγή κώδικα, αλλά μπροστά από το Grok 3 mini της xAI και το Qwen 3 της Alibaba.

«Το DeepSeek νωρίτερα φέτος ανέτρεψε τις πεποιθήσεις ότι οι έλεγχοι εξαγωγών των ΗΠΑ εμπόδιζαν τις εξελίξεις στην Τεχνητή Νοημοσύνη της Κίνας, αφού η νεοσύστατη εταιρεία κυκλοφόρησε μοντέλα Τεχνητής Νοημοσύνης που ήταν στο ίδιο επίπεδο ή και καλύτερα από τα κορυφαία μοντέλα του κλάδου στις ΗΠΑ με ένα κλάσμα του κόστους», ανέφερε το Reuters.

Το CNBC ανέφερε ότι, όπως ακριβώς συνέβη και με το ντεμπούτο του DeepSeek R1, το αναβαθμισμένο μοντέλο κυκλοφόρησε με λίγες φανφάρα. Πρόκειται για ένα μοντέλο συλλογισμού, που σημαίνει ότι η Τεχνητή Νοημοσύνη μπορεί να εκτελέσει πιο περίπλοκες εργασίες μέσω μιας βήμα προς βήμα λογικής διαδικασίας σκέψης, ανέφερε το CNBC.

Η κινεζική έκδοση της Wall Street Journal ανέφερε ότι από τις αρχές του τρέχοντος έτους, το χαμηλού κόστους και υψηλής απόδοσης μοντέλο R1 της DeepSeek έχει προσελκύσει την παγκόσμια προσοχή και έχει προκαλέσει μια αύξηση στις τιμές των κινεζικών τεχνολογικών μετοχών, με την αγορά να διατηρεί μια αισιόδοξη άποψη για τις δυνατότητες τεχνητής νοημοσύνης της χώρας.

Ο Wang Peng, αναπληρωτής ερευνητής στην Ακαδημία Κοινωνικών Επιστημών του Πεκίνου, δήλωσε στους Global Times ότι η ευρεία προσοχή στην ενημέρωση του μοντέλου της DeepSeek αντανακλούσε την αυξανόμενη παγκόσμια αναγνώριση και επιρροή της κινεζικής καινοτομίας στην τεχνητή νοημοσύνη, αν και αντιμετωπίζει αμείλικτη καταστολή από τις ΗΠΑ.

«Τα δημοσιεύματα των μέσων ενημέρωσης όχι μόνο επιβεβαιώνουν την τεχνική ισχύ της χώρας, αλλά και καταδεικνύουν την αυξανόμενη παγκόσμια ανταγωνιστικότητα των κινεζικών εταιρειών τεχνητής νοημοσύνης, η οποία θα μπορούσε να αναδιαμορφώσει το παγκόσμιο τοπίο της τεχνητής νοημοσύνης», δήλωσε ο Wang.

Τον Απρίλιο, ο κινεζικός τεχνολογικός γίγαντας Alibaba κυκλοφόρησε το μοντέλο Qwen3, το οποίο μπορεί να εναλλάσσεται μεταξύ της λειτουργίας σκέψης για σύνθετες, πολυβηματικές εργασίες όπως τα μαθηματικά, ο προγραμματισμός και η λογική εξαγωγή, και της λειτουργίας μη σκέψης για γρήγορες, γενικού σκοπού απαντήσεις, σύμφωνα με δημοσίευμα του Xinhua.

Τον Μάρτιο, μια άλλη τεχνολογική εταιρεία Baidu κυκλοφόρησε το αυτοαναπτυγμένο πολυτροπικό μοντέλο ERNIE 4.5, επιτυγχάνοντας συνεργατική βελτιστοποίηση μέσω κοινής μοντελοποίησης πολλαπλών τρόπων, επιδεικνύοντας εξαιρετικές δυνατότητες πολυτροπικής κατανόησης.

Ο Wang δήλωσε ότι η ανάπτυξη της Τεχνητής Νοημοσύνης της Κίνας όχι μόνο οδηγεί στον μετασχηματισμό και την αναβάθμιση της εγχώριας οικονομίας της, αλλά φέρνει και νέες ευκαιρίες για παγκόσμια τεχνολογική πρόοδο στην Τεχνητή Νοημοσύνη. Επιτρέπει την ανταλλαγή πόρων και επιτευγμάτων με διεθνείς εταίρους, επεκτείνει τα σενάρια χρήσης και συλλογικά προωθεί την παγκόσμια καινοτομία και πρόοδο στην Τεχνητή Νοημοσύνη. 

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου

Σημείωση: Μόνο ένα μέλος αυτού του ιστολογίου μπορεί να αναρτήσει σχόλιο.