Samsungs lilla AI-modell TRM utmanar större LLM-modeller

TRM är en liten AI-modell med endast 7 miljoner parametrar som överträffar större språkmodeller på komplexa resoneringsuppgifter.
Modellen använder en rekursiv metod där nätverket iterativt förfinar sina svar genom upp till 16 upprepningar.
Modellen presterar märkbart bättre än stora språkmodeller som Deepseek R1 och Gemini 2,5 Pro på specifika uppgifter.
RM har potential för användning i resursbegränsade miljöer som robotik och personlig databehandling.

Samsung forskare har utvecklat en ny öppen resonemangsmodell kallad TRM (Tiny Recursion Model) som överträffar modeller som är 10 000 gånger större på specifika problem. Modellen som bygger på rekursivt resonemang visar att små nätverk kan uppnå hög prestanda utan stora investeringar i GPU: och kraft.

TRM är öppen källkod under en MIT-licens och är utformad för strukturerade, visuella och grid-baserade problem vilket utmanar den dominerande filosofin att ”skala är allt som behövs” inom AI-forskningen.

Med bara två lager i sitt neurala nätverk simulerar TRM en djupare arkitektur utan att belasta minnet eller kräva massiva beräkningsresurser. Den rekursiva cykeln körs upp till 16 gånger för varje uppgift, vilket gör att modellen kan göra allt mer exakta förutsägelser – lite som hur stora språkmodeller använder steg-för-steg-resonemang, fast här uppnås det med en smal, effektiv design.

Table of Contents

Träningskostnad under 500 dollar

En annan fascinerande detalj är att träningen av TRM kostade under 500 dollar och tog bara två dagar på fyra H100-GPU:er. Det här står i skarp kontrast till de miljarder som spenderas på att träna de största språkmodellerna. Resultaten visar att genom att designa arkitekturer som kan resonera iterativt och själv-korrigera är det möjligt att lösa extremt svåra problem med en bråkdel av beräkningsresurserna.

Forskningspapperet och koden är öppet tillgängliga på GitHub för den som vill experimentera vidare. Det här kan öppna dörrar för mer forskning kring små, effektiva modeller som kan köras på enheter med begränsade resurser.

What's Hot

Today’s NYT Mini Crossword Answers for March 29

The 10 Best Game Boy Advance & Nintendo DS Games on Nintendo Switch – SwitchArcade Special

Kink in the Archive: The pleasures of porn in…

Samsungs lilla AI-modell TRM utmanar större LLM-modeller

Your Job Isn't Going Away… But It's Definitely Evolving

Brazil Turns WhatsApp Into a Bank Teller as Generative AI Transforms Everyday Finance

A new generative AI approach to predicting chemical reactions | MIT News

MIT engineers design proteins by their motion, not just their shape | MIT News

Seeing sounds | MIT News

AI system learns to keep warehouse robot traffic running smoothly | MIT News

Black Swans in Artificial Intelligence — Dan Rose AI

BMW Will Put eFuel In Cars Made In Germany From 2028

Best Sonic Lego Deals – Dr. Eggman’s Drillster Gets Big Price Cut

Most Popular

Black Swans in Artificial Intelligence — Dan Rose AI

BMW Will Put eFuel In Cars Made In Germany From 2028

Best Sonic Lego Deals – Dr. Eggman’s Drillster Gets Big Price Cut

Subscribe to Updates

What's Hot

Samsungs lilla AI-modell TRM utmanar större LLM-modeller

Träningskostnad under 500 dollar

Mer info:

Related posts:

Your Job Isn't Going Away… But It's Definitely Evolving

Brazil Turns WhatsApp Into a Bank Teller as Generative AI Transforms Everyday Finance

A new generative AI approach to predicting chemical reactions | MIT News

Related Posts

Subscribe to Updates