Deep Cogito lanceert nieuwe serie krachtige LLM's
Het Amerikaanse AI bedrijf Deep Cogito heeft een reeks nieuwe LLM's uitgebracht die volgens het bedrijf beter presteren dan bestaande open source modellen. De modellen zijn getraind met een nieuwe techniek die het mogelijk maakt om zichzelf te verbeteren.
Deep Cogito heeft een serie nieuwe LLM's aangekondigd onder de naam Cogito v1. Het gaat om modellen in verschillende formaten, variërend van drie miljard tot zeventig miljard parameters. Volgens het bedrijf presteren deze modellen beter dan vergelijkbare open source modellen van concurrenten zoals LLaMA, DeepSeek en Qwen.
De nieuwe modellen zijn ontwikkeld met behulp van een techniek die het bedrijf "Iterated Distillation and Amplification" (IDA) noemt. Deze methode stelt de modellen in staat om via een iteratief proces hun eigen prestaties te verbeteren. Dit gebeurt in twee stappen: eerst wordt het model in staat gesteld om met extra rekenkracht betere oplossingen te vinden, waarna deze verbeterde capaciteiten worden gedistilleerd in de parameters van het model zelf.
Een bijzonder kenmerk van de nieuwe modellen is dat ze op twee manieren kunnen functioneren: in een standaardmodus voor directe antwoorden, en in een reflectiemodus waarbij het model eerst nadenkt voordat het antwoordt. Het grootste model van zeventig miljard parameters presteert volgens Deep Cogito zelfs beter dan het recent uitgebrachte Llama 4 model van 109 miljard parameters.
De ontwikkeling van de modellen duurde ongeveer vijfenzeventig dagen met een klein team. Deep Cogito heeft aangekondigd dat er de komende weken en maanden nog grotere modellen zullen volgen, waaronder versies van 109 miljard, 400 miljard en 671 miljard parameters.
Het bedrijf ziet deze ontwikkeling als een belangrijke stap in het onderzoek naar kunstmatige intelligentie. Waar eerdere AI systemen zoals AlphaGo alleen in specifieke domeinen bovenmenselijke prestaties konden leveren, maakt de IDA techniek het volgens Deep Cogito mogelijk om de intelligentie van modellen te laten groeien zonder beperkt te worden door menselijke capaciteiten.
Alle modellen worden beschikbaar gesteld via platforms als Huggingface en Ollama, en kunnen ook worden gebruikt via de API's van Fireworks AI en Together AI. Het bedrijf benadrukt dat de modellen zijn geoptimaliseerd voor programmeren, het aanroepen van functies en het uitvoeren van taken als agent.
Deep Cogito, gevestigd in San Francisco, geeft aan goed gefinancierd te zijn door vooraanstaande investeerders in de AI sector. Het bedrijf is actief op zoek naar toptalent en nodigt ervaren engineers en onderzoekers uit om zich aan te sluiten bij hun missie.
De prestaties van de modellen zijn getest met standaard benchmarks in de industrie, waarbij ze consistent goede resultaten laten zien. Het bedrijf erkent dat benchmarkscores niet altijd een volledige weerspiegeling zijn van prestaties in de praktijk, maar is ervan overtuigd dat de modellen ook in real-world toepassingen uitstekend zullen functioneren.