Žít v exponenciální době je podle mě fascinující, když už se nějak sžijete s tím, co AI umí, přijde další vylepšení, které vše několikanásobně překoná. V případě ChatGPT jsou novinky naprosto skvělé a v OpenAI opět konkurenci ukázali, jak se to má dělat, a to od posledního velkého vylepšení neuběhl ani rok.
Dle dostupných informací se ke konci roku, možná opět na výročí spuštění ChatGPT, dočkáme dalších podstatných vylepšení. Proto čím dříve se s AI sžijete, tím snáze se dokážete přizpůsobit, ať už v byznyse nebo v práci. Brzy se nejspíš dočkáme toho, že budeme mít každý vlastní AI, a ta bude jen tak dobrá, jak ji to umožníte a jak se na to připravíte.
To nejlepší, co můžete udělat dnes je pochopit, jak AI funguje a udělat si z ní parťáka, který za vás bude dělat čím dál více věcí, ke kterým ho vycvičíte. Umělá inteligence, pokud ji to tedy umožníte, o vás totiž bude sbírat data a čím lépe bude znát vás a činnosti které často děláte, tím lépe pro vás bude pracovat.
V tomto článku vám prozradím vše, co byste měli vědět o novém modelu GPT 4o, který je, a to se podržte, dostupný i pro free uživatele. A to včetně GPT asistentů pro automatizaci rutinních úkolů, specializované na odborné studie, nebo vytváření myšlenkových map a diagramů.
Současné odhady uvádí, že počet pravidelných uživatelů je více než 100 milionů, ale pouze 1 až 4 miliony z nich mají předplatné Plus nebo Team. To znamená, že až 99 milionů lidí bude v příštích měsících velmi překvapeno až si vyzkouší co dokáže GPT 4o, suverénně nejlepší model současnosti.
Co je GPT 4o?
OpenAI, přední hráč na poli umělé inteligence, opět změnil pravidla hry. Představili nový model GPT 4o, který je nyní dostupný zdarma pro všechny uživatele. V názvu GPT 4o "o" znamená "omni", což značí že je model multimodální a to znamená, že byl trénován na a umí pracovat s textem, obrazem, videem i hlasem. Díky tomu má schopnosti výrazně lepší než předchozí modely a stává se z něj skutečně mocný nástroj.
Můžete si s ním povídat o tom co vidí přes vaši obrazovku nebo kameru, nebo slyší přes váš mikrofon. Dokonce porozumí i vaším emocím podle tónu hlasu a dechu, nebo ze záběru vaší kamery. Stává se tak tichým asistentem, kterého můžete kdykoliv povolat, aby vám například podle snímku obrazovky pomohl s nastavením nějaké aplikace, nebo pracoval s informacemi které vidí. Tedy pravdou je, že tyto funkce budou dostupné až s plným spuštěním aplikace pro počítače.
Další důležitou novinkou je aktualizace tréninkových dat až do března 2024, a tím i potvrzení slibu ze strany OpenAI a jejich zakladatele Sama Altmana, že jejich modely už nikdy nebudou mít data příliš vzdálená současnému dění.
Klíčové novinky v GPT 4o
Vylepšené prohledávání internetu
V placené verzi jste sice doposud mohli prohledávat internet pomocí vyhledávače Bing od Microsoftu, ale výsledky stály za prd. Občas jste dostali odkazy na neexistující stránky nebo stránky ne zcela ideální jako zdroj fakticky správných odpovědí. To se ale změnilo a myslím, že například vyhledávač Perplexity bude mít krušné chvíle. Dnes totiž dostanete seznam všech odkazů použitých pro výstupní text z ChatGPT a funguje to velmi dobře. Můžete tak vyřešit problém s ne zcela aktuálními daty, které byly použity pro trénink modelu a zaručit že si ChatGPT nebude fakta vymýšlet. Za mě jedna z nejlepších inovací.
Delší kontextové okno
GPT-4o dokáže lépe chápat a udržovat kontext během delších konverzací, což zajišťuje, že odpovědi jsou relevantnější a konzistentnější. Díky tomu je komunikace s ním přirozenější a příjemnější, ať už jej využíváte pro pracovní účely nebo pro zábavu. V rámci chatu začne ChatGPT zapomínat, když přesáhnete cca 32.000 tokenů tedy asi 22.000 slov, přes API slibují až 128.000 tokenů což odpovídá 90.000 slovům a to je pro představu cca 350 stránkový román.
Pokročilé logické myšlení
Díky vylepšeným schopnostem logického myšlení dokáže GPT 4o efektivněji řešit komplexní problémy a poskytovat přesnější analýzy a odpovědi. Ať už potřebujete vyřešit matematický problém, nebo analyzovat složitá data, GPT 4o to zvládne. Pocítíte to také v průběhu konverzaci a při argumentaci, zkrátka už rozhovor nepůsobí občas velmi hloupě, protože nový model zvládne lépe komplexně logicky přemýšlet o všem co už jste v chatu probrali.
Multimodální schopnosti
GPT-4o lépe pracuje s textem, videem, hlasem a obrázky současně, což umožňuje bohatší interakce a lepší porozumění vizuálním kontextům. Nový model tak může sledovat co děláte nebo píšete a dát vám zpětnou vazbu v reálném čase. Tato schopnost otevírá dveře pro využití AI v mnoha oblastech, od analýzy obrázků či rukou psaných poznámek přes personalizované vzdělávání, až po osobního tlumočníka.
Hlasové ovládání
Multimodalita nového modelu umožňuje zpracovávat audio a video v reálném čase, což je velký pokrok oproti předchozím modelům. Například můžete mluvit s GPT 4o pomocí hlasového chatu, kde model rozpozná emoce ve vašem hlase, nebo dokáže emoce v hlase napodobit a dokonce vám i zazpívá. To je ideální pro použití například v autě nebo při jiných činnostech, kde nemáte volné ruce. Pro lidi handicapované může být spojení hlasového ovládání a multimodality skvělým pomocníkem, který umožní například slepému "vidět".
Desktopová aplikace
S aplikací pro stolní počítače může GPT 4o sledovat vaši obrazovku, zatímco pracujete! Aplikace je zatím pouze pro Mac OS a ne pro všechny, ale v příštích měsících bude dostupná i pro uživatele s Windows. Pokud budete mít aplikaci spuštěnou při práci, může vám pomáhat psát prompty, vytvářet automatizace, odpovídat na e-maily atd. Stačí aplikaci říct, že má pracovat s daty, která vidí na obrazovce.
Lepší jazykové znalosti
Nový model mnohem lépe zvládá i ostatní jazyky nejen angličtinu a velmi dobře si už poradí i s vyjadřováním v češtině. Češtiny se navíc dočkalo i uživatelské prostředí, takže nyní máte i české menu a ovládání chatbota. Používat jiný nástroj jako překladač tak pomalu postrádá smysl, protože s ChatGPT přeložíte i celé soubory. A navíc dokáže mezi více než 50 jazyky překládat v reálném čase, takže vám spolehlivě nahradí tlumočníka kdekoliv na světě, přímo ve vašem mobilu.
Vylepšená kreativita
Nový model GPT 4o umí generovat kreativnější texty, což je ideální pro tvorbu marketingových materiálů, kreativní psaní a vytváření příběhů. Také poskytuje efektivnější řešení problémů, ať už jednoduchých nebo složitých. Texty znějí mnohem více lidsky a méně roboticky, což znamená, že odpovědi jsou kvalitnější a přirozenější. Díky tomu můžete získat originální a inovativní řešení, která by vás možná nenapadla.
Rozšířená znalostní základna
Model byl trénován na aktuálních datech až do března 2024, což znamená, že má k dispozici nejnovější informace a může poskytovat aktuální rady a odpovědi. Navíc má i free model k dispozici internetový vyhledávač Bing pro ověření dat, který hravě doplní chybějící fakta.
Personalizovaná interakce
Díky schopnosti si pamatovat předchozí interakce a preference uživatele může GPT 4o poskytovat více personalizované odpovědi, které lépe odpovídají potřebám a očekáváním uživatele. Je to, jako byste měli osobního asistenta, který se neustále učí a přizpůsobuje se vašim požadavkům. V praxi to bude fungovat tak že si o vás ChatGPT bude sbírat data z toho k čemu ho používáte a také data o vás a časem bude mnohem lépe dělat přesně to co chcete. A nebojte se budete mít přístup k tomu co je v paměti uloženo, přidávat do paměti data dle vlastního uvážení i je mazat.
Rychlost a efektivita
Model je rychlejší a efektivnější než předchozí verze, což zajišťuje rychlejší generování odpovědí a nižší latenci. V praxi je rychlost podobná GPT 3.5 a text generuje nový model rychleji, než nejspíš dokážete číst. Také se snížila latence v hlasové odpovědi na cca 200 až 300ms, což stačí, aby vám to připadalo jako rozhovor s člověkem. Při prodlevě nad hranici 500ms vás totiž začne zajímat, zda vás druhá osoba slyšela, nebo zda tam ještě je. Dříve byla prodleva mezi dotazem a odpovědí cca 3-4 sekundy, což je v praxi spíše otravné než použitelné. A nyní můžete v podstatě v reálném čase diskutovat nad obsahem obrazovky nebo o tom co vidí kamera vašeho mobilu.
GPT 4o byl tajně vypuštěn k testování o cca měsíc dříve pod názvem "im-also-a-good-gpt2-chatbot" a podle hodnocení více než 1 miliónů lidí, suverénně lepší než jakýkoliv konkurenční model. Hodnotilo se naslepo, podle subjektivního pocitu uživatelů, tedy které odpovědi chatbotů jim přišly nejlepší.
Výhody pro Free uživatele
Nyní mají free uživatelé přístup nejen k nejvýkonnějšímu modelu ale také k funkcím, které byly dříve dostupné pouze pro předplatitele:
Práce se soubory a obrázky
Toto je neocenitelná funkce, která výrazně rozšíří možnosti, co můžete s AI dělat. Můžete analyzovat dokumenty či tabulky, pracovat s obrázky, fotkami či rukou psanými poznámkami apod. Můžete si třeba načrtnout design webové stránky a nechat ChatGPT podle takového obrázku stránku naprogramovat. Práci se soubory obzvlášť oceníte při výzkumu a studiu, kdy můžete pracovat se studiemi nebo celými knihami.
GPT Asistenti
Free uživatelé nyní mohou využívat tzv GPT asistenty pro různé úlohy jako marketing, psaní článků, nebo prohledávání databází více než 200 mil. Studií jako to umí GPT Consensus. Ať už potřebujete pomoc s plánováním, psaním nebo analýzou dat, vyzkoušejte GPT modely – v menu „Prozkoumej modely GPT“. Můžete ale používat jen asistenty, které vytvořil někdo jiný, ty vlastní si vytvoříte jen v placené verzi.
Přístup k vyhledávání na internetu
Schopnost procházet internet a poskytovat aktuální informace z webu, zvyšuje užitečnost modelu pro hledání aktuálních dat a informací. Hlavně tak zabráníte tomu, aby vám chatbot na výstupu prezentoval nepravdivé nebo neaktuální informace, které neměl v tréninkových datech.
Proč teda mít předplatné Plus?
I když jsou nyní hlavní funkce dostupné zdarma, předplatné Plus stále nabízí několik výhod, kvůli kterým stojí za to si ho ponechat.
Rychlejší odezva
Předplatitelé Plus mají prioritní přístup k serverům, což zajišťuje rychlejší generování odpovědí a nižší latenci. Pokud potřebujete rychlé výsledky bez čekání, předplatné Plus je tou správnou volbou.
Dostupnost během špičky
Během období vysoké poptávky mohou mít free uživatelé omezený přístup nebo delší čekací doby, zatímco předplatitelé Plus mají zaručený přístup. To je obzvláště užitečné v časech, kdy je AI celosvětově nejvíce využívaná.
Vyšší limity na počet dotazů
Předplatitelé Plus mohou denně odeslat 5x více dotazů než free uživatelé - limity se budou měnit ale zatím je to 40 za 3 hodiny pro platící uživatele. Pokud používáte AI intenzivně, tato výhoda vám umožní využívat GPT 4o i v době kdy se připojí USA, tedy v odpoledních a večerních hodinách.
Hlasový chat a desktop aplikace
Podle dostupných informací zatím nebudou hlasový chat ani desktop aplikace dostupné zdarma. A v případě aplikace pro počítače tak přijdete o možnost, kdy ChatGPT v reálném čase sleduje, co děláte a může vám s prací pomáhat aniž byste museli vše vkládat ručně do chatu.
Vytváření vlastních GPT asistentů
GPT asistentů existuje asi více než milión, ale většina uživatelů potřebuje ChatGPT využívat svým specifickým způsobem. Pokud si to chcete zjednodušit a nemuset pokaždé vypisovat váš dlouhý vymakaný prompt který za vás odvede kus práce. Chcete mít možnost to jednou zadat do GPT asistenta a pak už vždy jen dodat nová data a nechat si je zpracovat a to budou moci jen platící uživatelé.
Co ještě není dostupné?
Aplikace pro počítače - zatím ani Mac (bude během týdnů) ani Windows (bude během roku).
Možnost pracovat s tím co vidí kamera mobilu nebo s obsahem obrazovky - bude pravděpodobně spuštěno se spuštěním aplikace pro počítače.
Limit kontextu v rámci jednoho chatu 128.000 přímo v aplikaci není a paměť ztratí po cca 32.000 tokenech.
Zatím ani u platících uživatelů (tedy alespoň ne v ČR) není k dispozici paměť pro dlouhodobé ukládání klíčových údajů o vás a vaší práci s ChatGPT.
Plná multimodalita také zatím přístupná není, tzn. že zatím do chatu nenahrajete ani audio ani video soubor, abyste mohli pracovat s jejich obsahem.
Závěr
Když se podíváme na to, kolik nových funkcionalit přibylo a co vám nový model umožní je celkem jasné, že spousta startupů to může rovnou zabalit. Například společnosti, které vytvořili aplikaci AI kamaráda, přítelkyně, psychologa, učitele nebo odborného konzultanta. Nebo projekty které, přišly se zařízením, které dokáže poslouchat vaše rozhovory, přepsat je na text a pracovat s ním, nebo se zařízením, které funguje jako překladatel v reálném čase. S vydáním modelu již nemají co navíc nabídnout, protože to teď hravě zvládne ChatGPT.
Tedy po pravdě některé funkce budou spuštěny teprve v průběhu roku a ne všem uživatelům najednou. Přesto jakmile budou k dispozici a ve vašem mobilu, nebudete mít potřebu kupovat si přece externí zařízení se stejnou funkcí, nebo aplikaci která umí zlomek toho co ChatGPT.
Zkuste si GPT 4o sami a zapojte se do revoluce v umělé inteligenci. Nechte se unést možnostmi, které vám tato úžasná technologie nabízí, a udělejte z ní svého parťáka pro lepší život, práci i byznys.
Chcete prozkoumat co všechno s novým GPT 4o můžete dělat? Navštivte blog OpenAI, najdete tam videa s ukázkami a také sekci „Explorations of capabilities“, kde si můžete prohlédnout dalších 17 ukázek s ukázkami a prompty.
Blog OpenAI: https://openai.com/index/hello-gpt-4o/