V roce 2021 se v oblasti umělé inteligence objevil nový pojem: "foundation model". Tento termín, poprvé použitý výzkumníky ze Stanfordského institutu pro umělou inteligenci zaměřenou na člověka, označuje zásadní posun v myšlení od úzce specializovaných AI modelů k univerzálním, všestranným modelům. Co přesně jsou foundation modely a proč jsou tak významné?
Rok 2020 přinesl první viditelné výsledky tohoto posunu myšlení s uvedením modelu GPT-3, který je považován za jeden z prvních komerčně dostupných foundation modelů. Podle stanfordských výzkumníků jde o nespecializované systémy trénované na obrovských objemech nestrukturovaných dat zahrnujících text, obrázky, videa a zvuk. Tyto modely jsou schopné zvládat širokou škálu úkolů.
Před rokem 2020 se trénovaly neuronové sítě (modely) pro specifické úkoly jako je např. rozpoznání specifických objektů na obrázku.
Po zhruba roce 2020 lze vidět postupný posun v myšlení, kdy se společnosti začínají věnovat budováním foundation modelů. Mezi veřejně známe foundation modely patří GPT-3 a další verze od OpenAI, Llama od Mety nebo Gemini od Google.
I když jsou tyto modely ze své podstaty všestranné, lze je dále specializovat dvěma klíčovými způsoby:
Foundation modely představují významný milník ve vývoji umělé inteligence. Jejich schopnost zvládat širokou škálu úkolů s pozoruhodnou efektivitou otevírá nové možnosti pro inovace napříč různými odvětvími.