ChatGPT, jazykový model umělé inteligence vyvinutý společností OpenAI, dělá vlny v technologickém světě. Lidé na celém světě jsou ohromeni jeho schopností generovat lidské reakce na textové výzvy. Rychlá expanze modelu však vyvolala obavy z možného nedostatku grafických procesorových jednotek (GPU). Jsou nezbytné pro školení a provozování velkých jazykových modelů, jako je ChatGPT.
Podle časopisu Fortune generální ředitel OpenAI Sam Altman na soukromé schůzce odhalil, že vážný nedostatek GPU brzdí pokrok ChatGPT. Podle zprávy se Altman v květnu setkal s několika vývojáři aplikací a manažery startupů. Raza Habib, generální ředitel londýnského startupu Humanloop s umělou inteligencí, ve svém tweetu uvedl, že Altman si myslí, že OpenAI postrádá dostatek GPU, což zpomalilo mnohé snahy o optimalizaci ChatGPT.
Proč má ChatGPT problémy s rychlostí a spolehlivostí
Podle zápisů z Habibových schůzek byly hlavními stížnostmi uživatelů na ChatGPT rychlost a spolehlivost rozhraní API. Altman to pochopil a vysvětlil, že hlavním důvodem je, že GPU nestačí. Krátce po zveřejnění zápisu z jednání OpenAI kontaktovala Habiba, aby ho informovala, že akce není pro veřejnost.
Ačkoli Habib později tweet smazal, vydržel dostatečně dlouho na to, aby lidé mohli nahlédnout do nejdůležitějších detailů. Podle zpětné vazby si Altman stěžoval, že nedostatek GPU vede k nízkému výpočetnímu výkonu a OpenAI nemůže rozšířit mailing list ChatGPT. To ovlivňuje, kolik informací může ChatGPT zpracovat při odpovídání na dotazy uživatelů. To také omezuje “paměť” ChatGPT a může mít potíže se správou záznamů minulých otázek. ChatGPT také nemůže provádět nudnější úkoly kvůli nízkému výpočetnímu výkonu. Například nástroj AI může mít potíže s psaním komplexních programových kódů kvůli nedostatečným GPU.
Podle IT Home je OpenAI jednou z mnoha značek postižených nedostatkem GPU. Poskytovatelé cloudových služeb jako Google, Amazon a Microsoft se potýkají s vážným nedostatkem GPU. Také vzrostla cena akcií hlavního dodavatele NVIDIA a stala se první polovodičovou společností s komerční nabídkou více než 1 bilion dolarů. Cena akcií společnosti letos vzrostla téměř dvakrát.
Historie nedostatku GPU
Nedostatek GPU není pro technický průmysl novým problémem. V roce 2017 se trh potýkal s podobným nedostatkem kvůli zvýšené poptávce po grafických kartách způsobené rostoucími cenami Etherea. Dnešní nedostatek je však jiný, protože jej zesílilo a prohloubilo několik faktorů. Hlavním viníkem je problém s dodavatelskými řetězci GPU, ke kterému se přidala zvýšená poptávka v regionu. Pandemie také narušila dodavatelské řetězce a rozvinula celý polovodičový průmysl. To firmám ztěžuje přístup ke komponentám potřebným k výrobě GPU.
Vliv nedostatku GPU na ChatGPT
Exploze v popularitě ChatGPT vyvolala určité obavy, že další nedostatek GPU je na obzoru. Jeden analytik tvrdí, že k trénování ChatGPT bylo použito přibližně 10 000 GPU NVIDIA. Kromě toho existuje zpětná vazba, která naznačuje, že služba nadále roste, stejně jako potřeba GPU.
Nedostatek GPU ztížil OpenAI, aby umožnil uživatelům předávat více dat přes velké jazykové modely, které jsou základem jeho softwaru, jako je ChatGPT. To zpozdilo plánované zavedení dalších funkcí a služeb společnosti. Stávající služby OpenAI byly také pomalejší a méně spolehlivé. To je pro mnoho uživatelů velký problém a zdráhají se vytvářet podnikové aplikace založené na technologii OpenAI.
Je však důležité poznamenat, že přesný stav nedostatku GPU není příliš jasný. Podle článku Fierce Electronics z března 2023 existuje „obrovský“ nedostatek dodávek GPU kvůli potřebám AI. Na druhou stranu, v srpnu zpráva od Ars Technica uvádí, že nedostatek GPU je oficiálně u konce a nyní jsme v GPU nadbytku. The Verge také v červenci 2022 oznámil, že nedostatek GPU skončil. Přesný stav nedostatku GPU je proto stále nejasný. To může záviset na mnoha faktorech, jako je umístění, poptávka a narušení dodavatelského řetězce.
Možná řešení nedostatku GPU
Jedním z potenciálních řešení nedostatku GPU je pro polovodičové společnosti zvýšení výrobní kapacity. To se však snadněji řekne, než udělá, protože pandemie narušila dodavatelské řetězce a ztížila společnostem přístup ke komponentám potřebným k výrobě GPU.
Dalším potenciálním řešením je pro společnosti najít jiné způsoby, jak školit a provozovat velké jazykové modely, jako je ChatGPT. OpenAI například odepřela svůj výkonný nový jazykový model GPT-4 z bezplatné verze ChatGPT, která stále používá slabší model GPT-3.5, kvůli vysokým nákladům na provoz GPT-4.
Generální ředitel OpenAI Sam Altman tento problém nepřímo uznal a řekl, že společnost pracuje na tom, aby byly její modely AI efektivnější a méně náročné na zdroje.
Poslední slova
Nedostatek GPU je hlavní překážkou pro ChatGPT a další důležité jazykové modely. Pandemie a zvýšená poptávka po GPU znesnadnily značkám přístup k sestavením potřebným k výrobě GPU, což zpozdilo zavádění nových funkcí a služeb pro ChatGPT.
Existují však potenciální řešení tohoto problému, jako je zvýšení propustnosti a nalezení jiných způsobů, jak trénovat a provozovat velké jazykové modely. Vzhledem k tomu, že se technologický průmysl neustále vyvíjí, bude zajímavé sledovat, jak se společnosti jako OpenAI vypořádají s výzvami, které představuje nedostatek GPU, a budou pokračovat v inovacích v AI.