Databricks ontwikkelt methode waarmee AI-modellen zichzelf verbeteren

Databricks heeft een nieuwe techniek ontwikkeld die de prestaties van AI-modellen verbetert zonder schone data. Het bedrijf gebruikt een combinatie van versterkend leren en kunstmatige trainingsdata om modellen slimmer te maken.
Jonathan Frankle, hoofdwetenschapper AI bij Databricks, ontdekte dat vieze data het grootste probleem is voor bedrijven. "Iedereen heeft wat data en een idee wat ze willen doen," zegt Frankle. Maar zonder schone data (data die nauwkeurig, up-to-date en foutloos zijn) is het moeilijk om een model te verbeteren voor specifieke taken. "Niemand komt met mooie, schone fine-tuning data die je in een prompt of een API kunt stoppen."
Slim trucje
De nieuwe techniek, Test-time Adaptive Optimization (TAO) genoemd, gebruikt een slim trucje. Het systeem leert voorspellen welke modeluitkomsten mensen zouden verkiezen. Dit creëert een beloningsmodel dat andere AI-systemen kan verbeteren zonder extra gelabelde data. TAO maakt gebruik van het beste uit meerdere pogingen en bakt deze voordelen in het model zelf.
Databricks testte hun aanpak met het FinanceBench meetinstrument voor financiële vragen. Llama 3.1B, het kleinste gratis model van Meta, scoorde normaal 68,4 procent. Met de TAO-techniek verhoogde dit naar 82,8 procent. Daarmee presteerde het beter dan de modellen GPT-4o en o3-mini van OpenAI, die 82,1 procent scoorden.
Veelbelovend
Christopher Amato, computerwetenschapper aan Northeastern University, vindt de methode veelbelovend. "Ik ben het er volledig mee eens dat het gebrek aan goede trainingsdata een groot probleem is", aldus Amato. Hij waarschuwt wel dat versterkend leren soms onvoorspelbaar kan zijn en voorzichtig moet worden toegepast. "Het zou veel schaalbaarder gegevenslabeling en verbeterde prestaties kunnen toestaan naarmate de modellen sterker worden."
LAATSTE AI-NIEUWS



Download GRATIS AI-prompts die je business helpen veranderen!
Exclusieve whitepapers en e-books met waardevolle kennis en AI-prompts - ontwikkeld om direct resultaat te leveren.
Je kunt deze krachtige tools zo downloaden.
➡️ Ga naar de producten-pagina en profiteer nu!