Na svém prvním DevDay (konference pro developery) OpenAI představila svůj nový model GPT 4 Turbo, který je již dostupný přes ChatGPT pro předplatitele ChatGPT Plus. GPT 4 Turbo, představuje značný posun oproti svým předchůdcům, jako je GPT 4 nebo GPT 3.5 a je nyní je bez sebemenších pochyb nejlepší chatbot na světě. Předplatné Plus se tak dnes vyplatí násobně více, protože se ChatGPT může stát vaším autonomním asistentem, který může vytvářet soubory či posílat zprávy a emaily.
Aktuálně ChatGPT používá 100 miliónů uživatelů týdně a je tím také nejpoužívanější chatbot na světě.
Nový model přináší tak zásadní vylepšení, že to pravděpodobně pomůže vyčistit rybník více než desítky tisíc aplikací poháněných umělou inteligencí, které nabízí specializované funkce jako například práce s pdf dokumenty a staví právě na GPT 4. Jak Sam Altman (zakladatel OpenAI) na konferenci prohlásil, společnost bedlivě sledovala, jak lidé nejpopulárnější chatbot používají a jaké aplikace pomocí GPT 4 vytváří, a to nejlepší právě dali k dispozici ve své nové verzi. Tisíce startupů stavěli vlastní řešení, která měla dodat funkce jež ChatGPT chybí, a nyní mohou zavřít byznys.
OpenAI vyhověli mnoha požadavkům na snazší používání chatbota, a tak dnes už nemusíte přepínat mezi tím, zda má ChatGPT používat Bing a internet, nebo zda má spouštět kód pomocí Code Interpreter (později Advanced Data Analysis), nebo zda má pracovat se souborem s daty či vytvářet otázky. Nový model je o dost chytřejší a sám pozná jaký nástroj má použít, aby vám doručil co nejlepší výstup.
V rámci Dev Day byly představeny také vylepšený model Whisper verze 3, který převádí řeč na text a funguje zatím nejlépe ze všech dostupných tzv. speech-to-text modelů. A nový model s obrácenou technologií tedy text-to-speech a vybrat si můžete ze šesti reálně znějících hlasů. Tyto modely pro práci s hlasem jsou však zatím dostupné pouze přes API, tedy spíše pro vývojáře software. Už dnes je najdete na Githubu i Huggingface a přípravuji pro vás video návod pro jednoduchý převod jakéhokoliv audio záznamu na text pomocí Whisper 3.
Co je nového v GPT 4 Turbo?
Jedním z nejvýznamnějších vylepšení GPT 4 Turbo je značné rozšíření limitu tokenů až na 128.000, to odpovídá přibližně 96.000 slov vstupního a výstupního textu, což znamená že můžete pracovat s cca 300 A4 textu.
GPT 4 Turbo je nyní plně multimodální a dokáže pracovat nejen se soubory jako docx, xlsx, pdf, txt, csv a další známé často používané formáty, ale rozumí obrázkům a objektům které na nich jsou. Umožňuje tak například tvořit obrázky či webové stránky na základě vašich náčrtů a poznámek psaných rukou nebo třeba ze screenshotu. Osobně si myslím, že to že GPT 4 Turbo „vidí“ je jedna z nejlepších věcí, která nabízí široké možnosti využití.
Microsoft nedávno publikovat studii 100 vyzkoušených užitečných možností využití GPT 4 Vision v životě a je to fakt sci-fi. Zde jsou některé příklady, co dokáže ChatGPT Vision, které zkoumali v této studii – interpretovat rentgenové snímky, CT a MRI, pro předběžnou diagnózu, interpretovat obsah účtenek a faktur, rozpoznávat orientační body a nápisy v cizím jazyce při cestování, pomáhat s nákupem podle obsahu lednice a potravinové intolerance či alergie, z fotografie rozpoznat defekt a navrhnout postup opravy, nebo třeba rozpoznávat celebrity na fotografiích.
Odkaz na studii zde: https://arxiv.org/abs/2309.17421
Všechny novinky GPT 4 Turbo
- Zjednodušené rozhraní bez nutnosti přepínat mezi modely. ChatGPT nyní sám pozná co potřebuje a spustí potřebné funkce jako např. prohledávání internetu nebo vytváření obrázků.
- Rozšířená kontextová délka až 128.000 tokenů.
- Zároveň nový model lépe chápe souvislosti v delším kontextu a vytvářet lepší shrnutí dlouhých textů, což oceníte při práci s dokumenty, tabulkami i knihami.
- Vylepšená kontrola nad výstupy a nově umožňují „donutit“ model generovat zcela identické výstupy na zadaný prompt.
- Rozšířené znalosti a přístup k informacím do dubna 2023. Sam Altman slíbil, že už OpenAI nikdy nedopustí, aby byl model tak neaktuální jako doposud.
- Zvýšená efektivita modelu umožnila snížit náklady v průměru 2,75 krát. Platí pouze pro přístup přes API, tzn. že externí aplikace postavené na GPT velmi pravděpodobně sníží ceny pro koncové uživatele.
- Integrace schopností zpracování hlasu na vstupu pomocí vylepšeného modelu Whisper 3 i výstupu, který umožňuje vybrat si ze 6 různých hlasů kterými na vás bude UI mluvit.
- Sam Altman také slíbil, že v případě právních sporů na sebe vezme společnost OpenAI odpovědnost.
- Nový model „vidí“ tzn. že dokáže pracovat s obrázky a fotkami z reálného života, což otvírá nevídané možnosti.
- GPTs – nová možnost vytvořit si vlastního chatbota (asistenta) s vlastními daty a schopností autonomně jednat, který může být soukromý, sdílený přes odkaz nebo zcela veřejný.
GPT‘s – autonomní agenti udělají práci za vás
Na závěr vám chci představit, podle mého názoru nejlepší novinku, a tou je možnost vytvářet vlastní chatboty na vlastních datech a propojit je s více než 6.000 aplikacemi.
Pokud máte k dispozici soukromá data z jakékoliv oblasti, které ChatGPT pravděpodobně nemá, můžete je tak snadno „nalít“ do vlastního chatbota, kterým se teď říká GPT‘s, nebo česky GPTčka [gé pé téčka]. Přes aplikaci Zapier pak můžete každému GPT umožnit ovládat jakoukoliv z cca 6.000 aplikací, se kterými se Zapier umí spojit.
Můžete si tak vytvořit autonomního asistenta s umělou inteligencí, který dokáže sám provádět akce v reálném světě. Pro každou rutinní práci si tak můžete vytvořit asistenta, který bude pracovat za vás.
Váš GPT asistent tak pro vás například může vytvářet soubory s textem a posílat je emailem nebo přes zprávy. Zpracovat textová data z různých zdrojů a souborů a přetvořit je na příspěvek na sociální sítě a ten rovnou odeslat na vaši zeď na Facebooku. Vytvářet události v kalendáři a informovat o nich jejich účastníky emailem či zprávou. Přidat informace z příchozího emailu do tabulky v Google Sheets. Pokud píšete články, můžete si vytvořit svého „kopilota“, který bude psát vaším stylem. A existují desítky tisíc dalších možností automatizace.
Dokonce si můžete na firemních datech vytvořit privátního firemního chatbota se znalostmi o firmě, který umožní snadno vyhledávat jakékoliv informace, nebo může například pomáhat zapracovat nové kolegy.
GPT asistenty můžete mít jen pro sebe, sdílet je pomocí odkazu s kolegy či známými, nebo ho dát k dispozici veřejně.
Nejlepší na GPT asistentech je, že je můžete vytvářet velmi snadno pomocí chatu. Stačí tak popsat co na co se má váš vlastní chatbot specializovat, jak se má jmenovat. Pak už můžete pomocí detailní konfigurace dodat také instrukce pro chování a výstupy, nahrát soubory s vlastními daty, umožnit využívání přístupu k internetu, Code Interpreter a DALL-E 3. Doplnit můžete také návodné prompty, aby bylo pro uživatele snazší pochopit, jak s daným GPT asistentem začít. A pomocí tzv. Actions dokážete vašeho chatbota propojit s externími aplikacemi jako například zmiňovaný Zapier.
Návod krok za krokem jak na vytváření vlastních GPT asistentů najdete zde.
Sečteno podtrženo, vývoj postupuje skutečně exponenciální rychlostí a současné ChatGPT je dnes násobně lepší než před rokem, kdy ho veřejnost měla poprvé možnost vyzkoušet ve verzi GPT 3.5. Nikdo už dnes nedokáže odhadnout co bude umělá inteligence umět za 10 let, ale v příštích několika letech si všichni zvykneme na to, že většinu rutinních úkolů za nás dělá umělá inteligence sama a my jen řídíme co za nás má vykonávat.
Tento článek jsem psal sám bez použití AI pro psaní ;)