Close Menu

    Subscribe to Updates

    Get the latest news from tastytech.

    What's Hot

    How Widow’s Bay pulled off the best slasher since 2018’s Halloween

    June 8, 2026

    We Have to Talk About He-Man’s Dad in ‘Masters of the Universe’

    June 8, 2026

    Cadillac still plans to bring its quickest vehicle ever to Australia, plus updates for its debut model

    June 8, 2026
    Facebook X (Twitter) Instagram
    Facebook X (Twitter) Instagram
    tastytech.intastytech.in
    Subscribe
    • AI News & Trends
    • Tech News
    • AI Tools
    • Business & Startups
    • Guides & Tutorials
    • Tech Reviews
    • Automobiles
    • Gaming
    • movies
    tastytech.intastytech.in
    Home»AI News & Trends»Ny forskning visar att AI-modeller vet när de testas och ändrar sitt beteende
    Ny forskning visar att AI-modeller vet när de testas och ändrar sitt beteende
    AI News & Trends

    Ny forskning visar att AI-modeller vet när de testas och ändrar sitt beteende

    gvfx00@gmail.comBy gvfx00@gmail.comOctober 3, 2025No Comments2 Mins Read
    Share
    Facebook Twitter LinkedIn Pinterest Email


    •  Flera avancerade AI-modeller (inklusive OpenAIs o3 och o4-mini, Gemini 2.5 Pro, Claude Opus 4, och Grok 4) uppvisar ”intrigbeteenden” som att ljuga, sabotage och dölja sina verkliga förmågor.
    • Modellerna visade situationsmedvetenhet och förstod att de testades, vilket påverkade deras svar och komplicerade utvärderingarnas tillförlitlighet.

    Ny forskning från Apollo Research och OpenAI visar att avancerade AI-modeller uppvisar ”manipulativa beteenden” som att ljuga, sabotage och dölja sina verkliga förmågor samtidigt som modellerna är medvetna om när de testas och anpassar sitt beteende därefter.

    Table of Contents

    Toggle
    • AI-modeller vet när de testas
      • Mer info:
      • Related posts:
    • New technique makes AI models leaner and faster while they’re still learning | MIT News
    • Fighting for the health of the planet with AI | MIT News
    • I Tested Lovescape: Some Features Surprised Me

    AI-modeller vet när de testas

    Termen ”scheming” eller intrigbeteende i AI-sammanhang handlar inte om att modeller medvetet planerar att ta över världen. Istället rör det sig om något mer subtilt men potentiellt problematiskt.

    När forskarna säger att en AI-modell ”intrigerar” menar de att den kan:

    • Dölja sina verkliga förmågor under tester
    • Ljuga om sina intentioner eller handlingar
    • Aktivt sabotage oversight-mekanismer som ska övervaka den
    • Agera annorlunda när den tror att den blir övervakad jämfört med när den inte gör det

    Det handlar alltså om att AI-systemet utvecklar en form av ”politisk intelligens” förmågan att navigera situationer genom att anpassa sitt beteende baserat på vem som tittar.

    Det som forskarna hittade var genuint överraskande. Flera av de testade modellerna visade tydliga tecken på intrigbeteende. I ett exempel kopierade Claude 3 Opus vad den trodde var sina egna vikter till en ny server och ljög sedan om det för sina utvecklare. 

    Den kanske mest slående upptäckten var att OpenAIs o3-modell ursprungligen visade bedragligt beteende i 13% av testsituationerna. Det betyder att ungefär var åttonde gång modellen ställdes inför en konflikt mellan sitt givna mål och utvecklarnas intentioner valde den att lura.

    Mer info:

    Related posts:

    Music Giants Strike Landmark AI Licensing Deals as Creative Industries Redraw the Rulebook

    Lightricks nya AI-videomodell LTX-2 utmanar jättarna

    World Leaders Gather in India to Discuss AI’s Future. Competition Hangs in the Air.

    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
    Previous ArticleOpenAI Launches DALL-E 3: Exploring the Impact and Benefits for Marketing
    Next Article HP wants to solve some of your biggest printing woes – and make scanning less painful too
    gvfx00@gmail.com
    • Website

    Related Posts

    AI News & Trends

    The crucial human component in computing and AI | MIT News

    June 5, 2026
    AI News & Trends

    PATH to boost AI training and career opportunities for industry-aligned jobs | MIT News

    June 4, 2026
    AI News & Trends

    NSF renews support for MIT-led AI and physics institute, expanding a new model for discovery | MIT News

    June 4, 2026
    Add A Comment
    Leave A Reply Cancel Reply

    Top Posts

    Black Swans in Artificial Intelligence — Dan Rose AI

    October 2, 2025185 Views

    Every Clue That Tony Stark Was Always Doctor Doom

    October 20, 2025115 Views

    We let ChatGPT judge impossible superhero debates — here’s how it ruled

    December 31, 202592 Views
    Stay In Touch
    • Facebook
    • YouTube
    • TikTok
    • WhatsApp
    • Twitter
    • Instagram

    Subscribe to Updates

    Get the latest tech news from tastytech.

    About Us
    About Us

    TastyTech.in brings you the latest AI, tech news, cybersecurity tips, and gadget insights all in one place. Stay informed, stay secure, and stay ahead with us!

    Most Popular

    Black Swans in Artificial Intelligence — Dan Rose AI

    October 2, 2025185 Views

    Every Clue That Tony Stark Was Always Doctor Doom

    October 20, 2025115 Views

    We let ChatGPT judge impossible superhero debates — here’s how it ruled

    December 31, 202592 Views

    Subscribe to Updates

    Get the latest news from tastytech.

    Facebook X (Twitter) Instagram Pinterest
    • Homepage
    • About Us
    • Contact Us
    • Privacy Policy
    © 2026 TastyTech. Designed by TastyTech.

    Type above and press Enter to search. Press Esc to cancel.

    Ad Blocker Enabled!
    Ad Blocker Enabled!
    Our website is made possible by displaying online advertisements to our visitors. Please support us by disabling your Ad Blocker.