A DeepSeek hallgat a V4 megjelenéséről – technológiai áttörés zajlik?
2026. 01. 15. 12:00:31
A kínai mesterséges intelligencia startup, a DeepSeek nem kívánt nyilatkozni azokról a széles körben terjedő jelentésekről, amelyek szerint következő generációs V4 modellje 2026 február közepén debütál, így az AI-iparág csak találgathat a nyílt forráskódú AI-fejlesztés újabb mérföldkövét jelentő esemény időzítéséről és funkcióiról.
A hangzsoui székhelyű cég nem erősítette meg a megjelenés dátumát sem a V4, a 2024 decemberében kiadott V3 modell utódjának, sem a várt R2 következtetési modellnek a tekintetében. A The Information szerint a belső teljesítménymérések arra utalnak, hogy a V4 felülmúlja majd az Anthropic és az OpenAI vezető modelljeit programozási feladatokban, és a megjelenés időzítése egybeeshet a február 17-én kezdődő holdújévi ünnepekkel.
A legújabb publikációk építészeti újításokat mutatnak be
A DeepSeek az elmúlt hetekben két jelentős szakmai tanulmányt publikált, amelyek az iparági szakértők szerint előrevetítik a V4-ben várhatóan megjelenő innovációkat. Január 12-én a vállalat bemutatta az Engramot, egy „feltételes memória” architektúrát, amely elválasztja a statikus tudástárolást a dinamikus gondolkodástól azáltal, hogy neurális számítás helyett hash-alapú keresést használ. Ez a megközelítés lehetővé teszi a modellek számára, hogy a memóriát a CPU RAM-ba helyezzék ki, ami potenciálisan csökkenti a GPU-függőséget és az üzemeltetési költségeket, miközben javítja a teljesítményt hosszú kontextusú feladatoknál.
Néhány nappal korábban, január 1-jén a DeepSeek kutatást publikált a sokaság-korlátozott hiperkapcsolatokról (Manifold-Constrained Hyper-Connections), egy módszerről, amely hatékonyabbá teszi a nagyobb modellek tanítását azáltal, hogy újragondolja a mélytanulás alapvető architektúráját. A tanulmányok aláhúzzák a DeepSeek költséghatékonysági stratégiáját, amelyet a fejlett félvezetőkhöz való korlátozott hozzáférés miatt alkalmaznak, köszönhetően az amerikai exportkorlátozásoknak.
Az iparág a lehetséges „DeepSeek-pillanatra” vár
A DeepSeek korábbi kiadásai megrendítették az AI-ipar feltételezéseit a költségek és a képességek közötti összefüggésről. A vállalat 2025. január 20-án bemutatott R1 érvelőmodellje bebizonyította, hogy magas szintű mesterségesintelligencia-érvelés a nagy amerikai technológiai vállalatokon kívül is elérhető, a szokásos fejlesztési költségek töredékéért. Ez a bejelentés hullámokat vert a Szilícium-völgyben és a globális pénzügyi piacokon. A várható V4 modellről feltételezik, hogy két változatban érkezik: egy csúcsmodell intenzív programozási feladatokhoz és egy könnyebb verzió mindennapi fejlesztésekhez. Ha a kiszivárgott képességek pontosnak bizonyulnak, a V4 új mércét állíthat az AI-alapú szoftverfejlesztés terén, miközben megőrzi a DeepSeek nyílt forráskódú hozzáférhetőség iránti elkötelezettségét.
(Nethuszár)







