Máte představu, na jaké úrovni je dnes rozpoznávání řeči?
Hele když říkám, že revoluce je tady a svět se od základu změní, nemyslím tím jen ChatGPT. To je jen díl skládačky. Nejviditelnější (společně s Midjourney). Ale zásadní pokrok se odehrává na celé řadě front.
Pojďme se podívat na rozpoznávání hlasu.
Pokud jste zkoušeli v posledních letech diktovat do mobilu, tak víte, že to funguje neskutečně dobře. Vím, že velká spousta lidí o této funkci netuší, pokud mezi ně patříte, zkuste si to, otevřete třeba Poznámky a klikněte na klávesnici na ikonku s mikrofonem. Budete překvapeni, jak je to dobré.
Před pár měsíci vyšla umělá inteligence, která si poradí s rozpoznáváním řeči ještě o parník lépe (zatím není dostupná v mobilech). Zvládá šum. Zvládá hodně šumu. Zvládá bordel. Navíc je zdarma. Umí velkou spoustu jazyků, i češtinu, ale jak to u AI nástrojů bývá, trénovaná je primárně na angličtině.
Abyste měli představu, na jaké úrovni je dnes, dal jsem jí rozpoznat kus záznamu. Poslechněte si jej v prvním komentáři. Co na to říkáte?