Ze záznamu řeči umíme zjistit vaše pohlaví, věk a odhadnout sociální roli, prozrazuje vědec brněnského VUT Černocký

6. červenec 2021

Řeč je to, co nás odlišuje nejen od zvířat. Důležité je nejen to, co říkáme, ale i to, jakým způsobem mluvíme. Co všechno už dnes umí rozklíčovat takzvané řečové technologie? „Kdyby nás ten přístroj slyšel už dřív, tak by nás měl zaregistrované, my říkáme enrolované. Takže by dokázal ověřit, jestli se v rozhovoru skutečně objevujeme my dva, nebo jestli to je někdo jiný,“ vyzdvihuje jednu z dovedností technologií vědec Jan Černocký.

Černocký vede Ústav počítačové grafiky a multimédií na Fakultě informačních technologií VUT v Brně a jeho výzkumná skupina se snaží získat z lidské řeči veškeré možné informace.

Čtěte také

„První, co asi každého napadne, je přepis – a abychom to nemuseli přepisovat ručně, dá se spustit rozpoznávač řeči,“ připouští a uvádí příklady zajímavějších technologií: 

„Kdybychom měli i mononahrávku našeho rozhovoru, dokáže rozkouskovat řeč na segmenty, kde mluvíte vy i já, a to dokonce bez toho, aby nás předtím slyšel. Protože běžně pracuje s předem neviděnými mluvčími, kdy se snaží nahrávku rozdělit do segmentů podle toho, kde mluví různí lidé.“

Pohlaví i věk

Bez toho, aby nás přístroj viděl, dokáže spolehlivě poznat naše pohlaví, s odchylkou pěti až sedmi let i určit věk mluvčích.

Čtěte také

„Přepis řeči bychom ale mohli pustit do technologií přirozeného jazyka, které by se zabývalo sémantikem i i významem toho, co jsme řekli v jednotlivých větách. Taky ale i účel, proč jsme to tedy řekli,“ vysvětluje Černocký. To je podle něj důležité ve chvíli, kdy někdo zavolá do klientského centra, kde potřebuje něco vyřídit. A tam by mohly nastoupit právě technologie. 

„A když se podíváme ještě výš, tak bychom dokázali určit, jak ten dialog probíhal – kdo mluvil jak dlouho, kdo komu skákal do řeči, kdo třeba začínal silnějším hlasem. Takže asi bychom dokázali odhadnout, kdo byl v rozhovoru dominantní i další sociální role účastníků – a bylo by toho ještě víc,“ prozrazuje vědec Černocký.

Emoce v rozhovoru ale technologie zatím určit neumí, na jejich určení by se ostatně nemuseli shodnout ani lidé.  

Jak naučit technologii rozumět lidské řeči? A proč je Česko tak úspěšné v řečových technologiích? Celý rozhovor pořadu Studio Leonardo si poslechněte v audiu, ptala se Martina Pouchlá.

autoři: Martina Pouchlá , lup
Spustit audio

Související