AmI systém RUDO

Ambientný systém RUDO v inteligentných budovách

Klasické ponímanie komfortu pri bývaní bolo v minulosti zo stavebného hľadiska obsiahnuté v optimálnom navrhnutí architektúry, polohy budovy, vykurovacieho systému, rozvodu vody, elektriny a telefónnych liniek.

Pri ďalšom zvyšovaní komfortu sa prihliadalo na kvalitu vnútorného zariadenia a elektrických spotrebičov.

Súčasná doba prináša s rozvojom informatiky nové ponímanie komfortu pri bývaní.

Stavebnou súčasťou budov sa stali dátové rozvody počítačových sietí. Sieť býva dostupná aj pomocou bezdrôtovej technológie WiFi. Budovy začínajú byť vybavované centrálnym počítačom pripojeným na lokálnu počítačovú sieť. Domový server môže takto vyhodnocovať údaje zo senzorov nainštalovaných v budove a automaticky ovládať najrozličnejšie sofistikované zariadenia.

V domových serveroch moderných budov sa inštalujú informačné systémy, ktoré nazývame ambientné systémy, sú zamerané:

  • na vzdialenú správu zariadení,
  • na odovzdávanie informácií o stave priestorov,
  • na zabezpečenie,
  • na ovládanie zariadení a úsporu energií.

Budovy vybavené ambientnými systémami, senzormi a zariadeniami sa nazývajú inteligentné budovy.

Informatizácia budov však neponúka len zvyšovanie komfortu v bežnom ponímaní. Súčasťou ambientných systémov v inteligentných budovách môžu byť aj asistenčné technológie, ktoré pomáhajú pri bývaní starým alebo zdravotne hendikepovaným ľuďom.

Súčasné ambientné systémy s asistenčnými technológiami (Ambient Assisted Living, ďalej AAL) sú prioritne zamerané na asistenčné služby pre starších ľudí. Sú preto zamerané na pomoc:

  • pri onemocnení pohybovej sústavy,
  • pri slabozrakosti,
  • pri ľahšej forme stareckej demencie,
  • pri údržbe hygienických potrieb a zvýšení bezpečnosti.

AAL systémy taxonomicky klasifikujú osoby, ktoré zo zdravotného hľadiska vyžadujú asistenčnú podporu. Pri tejto činnosti vyhodnocujú dáta z pohybových senzorov alebo kamier.

Pri krízovej klasifikácii systém vyšle podnet na privolanie opatrovateľskej pomoci alebo zdravotníckeho zásahu.

Súčasťou AAL systémov je prispôsobené alebo adaptabilné používateľské rozhranie, ktoré môže vhodne kompenzovať zdravotný hendikep.

Môžu byť využité aj doplňujúce služby kontrolujúce hygienické podmienky, ekoparametre – teplota, intenzita svetla a podobne.

Poslednou zmienenou vlastnosťou AAL systémov je aj ich ekonomické hodnotenie – náklady na zriadenie, licenčné obmedzenia a náklady na údržbu.

Na Fakulte prírodných vied UMB v Banskej Bystrici bolo v roku 1997 zriadené pracovisko, v rámci ktorého sú vyvíjané asistenčné technológie zamerané na pomoc pre nevidiacich ľudí.

V roku 2002 bola dokončená prvá verzia prototypu ambientného (ďalej AmI Ambient Intelligence) systému RUDO. AmI systém RUDO bol inštalovaný v priestoroch budovy, kde je v súčasnosti testovaný vo svojich najnovších verziách.

Súčasťou AmI systému RUDO je modul ROWS, ktorý môže fungovať na počítači oddelene. V prípade takejto oddelenej prevádzky vytvorí modul ROWS z počítača bežnú kompenzačnú pomôcku pre nevidiacich.

Ak sa počítač vybavený softvérovou vrstvou modulu ROWS pripojí cez WiFi k počítačovej sieti, na ktorej je nainštalovaný AmI systém RUDO, pomôže nevidiacemu obsluhovať dôležité zariadenia v domácnosti, ako je napríklad vykurovací systém a zónová regulácia.

Vyvinutá softvérová vrstva modulu ROWS ponúka širokú zostavu programov a skriptov, ktoré sa môžu použiť dvomi spôsobmi:

  1. ako jednoduché príkazy používané na príkazovom riadku operačného systému LINUX Debian,
  2. ako softvérová vrstva používaná semigrafickým používateľským rozhraním pre nevidiacich.

Nevidiacemu používateľovi sa takto môže ponúkať práca s počítačom na administrátorskej úrovni na príkazovom riadku, pričom môžu byť používané príkazy sprostredkované aj iným používateľským rozhraním. Návrh uvádzanej softvérovej vrstvy je zameraný:

  1. na bežnú prácu s počítačom,
  2. na administrátorskú prácu s počítačom,
  3. na odbornú prácu v oblasti informatiky,
  4. na bežnú obsluhu zariadení ambientného systému RUDO,
  5. na administrátorskú obsluhu ambientného systému RUDO.

 

1 AmI systém RUDO

Prototyp AmI systému RUDO, ktorý bol vyvinutý na akademickej pôde Univerzity Mateja Bela v Banskej Bystrici, je špecifický svojim zameraním na asistenciu pri bývaní pre nevidiacich ľudí bez vekového obmedzenia. Pre toto svoje špecifikum sa odlišuje od súčasných AAL. Využíva vo väčšej miere klasické ponímanie systémov domácej automatizácie, ktoré sprístupňuje nevidiacim pomocou špeciálneho používateľského rozhrania.

Taxonómiu nevyužíva na klasifikáciu nevidiacich, ale naopak na klasifikáciu zvyšných členov domácnosti a hostí. Na základe vyhodnocovania a hlásení pomocou umelo produkovanej reči sa nevidiacim ľuďom čiastočne nahrádza zrak.

Pri vytváraní prototypu AmI systému RUDO bol vývoj asistenčných technológií zameraný na pomoc nevidiacim ľuďom bez vekového obmedzenia. Jedná sa hlavne o asistenciu:

  1. pri obsluhe vykurovacieho systému,
  2. pri úspore energií,
  3. pri rodičovskom dohľade na deti,
  4. pri učení sa do školy a vyhotovovaní dokumentov,
  5. pri rozpoznávaní prichádzajúcich osôb,
  6. pri odbornej práci v oblasti informatiky a elektroniky.

 

2 Architektúra systému RUDO

Prototyp ambientného systému – RUDO v. 4.0, 2016 – je implementovaný na operačnej platforme Linux Debian. RUDO je sieťovo orientovaný produkt pracujúci v rámci lokálnej počítačovej siete. Obsahuje jedenásť nižšie uvedených základných skupín hardvérových a softvérových komponentov.

I. Domový miniserver a router

Na počítači “HP Pro-Liant microserver G7” je nainštalovaný operačný systém Linux Debian.

Výkon – AMD TURION II neo N54 dual core 2.2 GHz.

Výbava – RAM 2 GB, HDD 250, 6 x USB, 1 x LAN, graphics adapter.

Počítač je dovybavený zvukovým zariadením, ktoré je kompatibilné s ovládačom ALSA pre Linux Debian.

Miniserver je obsluhovateľný štandardným spôsobom pomocou klávesnice a displeja. Pri realizácii prototypu AmI systému RUDO bol však umiestnený mimo obytných priestorov. Preto nebol vybavený klávesnicou a displejom. Je obsluhovateľný len cez vzdialenú správu z klientských počítačových staníc.

Domový miniserver realizuje všetky výpočty, ktoré softvérové servre systému RUDO ponúkajú ako svoje služby.

Súčasťou služieb je aj minimalizačný proces genetického algoritmu, pomocou ktorého sa adaptuje neurónová sieť taxonomického rozpoznávania. Z tohoto dôvodu nie je odporúčaný nižší výkon tohoto počítača.

Pripojenie domového miniservra k routru a ďalším zariadeniam pomocou LAN, USB a audio výstupov je ukázané na blokovej schéme 2-1.

 

2-1 Bloková schéma AmI systému RUDO

2-1_blokova_schema_ami_systemu_rudo

 

II. Hardvérové V/V zariadenie pripájajúce na lokálnu

počítačovú sieť pohybové senzory a domové zvončeky

Elektronika tohoto zariadenia bola navrhnutá špeciálne pre potreby systému RUDO. Zariadenie má svoju IP adresu a je pomocou LAN pripojené k routru (viď 2-1).

Softvérový server komunikuje s týmto zariadením cez sieťové programové rozhranie MODBUS.

Vstupom servra je zber údajov z pohybových senzorov a tlačítok domových zvončekov.

Výstupom servra je podnet na prepínanie domových reproduktorov, pomocou ktorých sa realizujú hlásenia (viď 1.4). Systém RUDO si takto volí lokalitu pre dané hlásenie.

 

III. Hardvérové V/V zariadenie pripájajúce na lokálnu počítačovú sieť teplotné senzory, elektromotorické ventily, pákový ovládač ekvitermického ventila a ovládače čerpadiel v kotolni

Elektronika tohoto zariadenia bola navrhnutá špeciálne pre potreby systému RUDO. Zariadenie má svoju IP adresu a je pomocou LAN pripojené k routru (viď 2-1).

Softvérový server komunikuje s týmto zariadením cez sieťové programové rozhranie MODBUS.

Vstupmi servra sú:

  • zber dát z teplotných senzorov,
  • zber dát stavu ventilov.

Výstupmi servra sú:

  • ovládanie dvoch elektromotorických ventilov,
  • ovládanie čerpadiel,
  • ovládanie ekvitermického ventilu.

 

IV. Z-Wave kontrolér

Súčasťou systému RUDO je zónová teplotná regulácia. Teplotná regulácia v jednotlivých zónach sa realizuje pomocou termostatických Z-Wave radiátorových hlavíc. Radiátorové hlavice komunikujú bezdrôtovo so Z-Wave kontrolérom, ktorý je cez USB pripojený k domovému miniservru (viď 2-1).

Softvérový server zónovej teplotnej regulácie, ktorý je nainštalovaný na domovom miniservri, komunikuje s radiátorovými hlavicami cez Z-Wave kontrolér.

 

V. Koncové zariadenia systému RUDO

Na hardvérové V/V zariadenia a Z-Wave kontrolér (viď II., III. a IV.) sú pripojené koncové zariadenia systému RUDO (viď 2-1), ide o:

  • Osem pohybových senzorov,
  • dverový spínač,
  • 2 x relé na domové zvončeky,
  • pákový servoregulátor ekvitermického ventilu,
  • dva elektromotorické ventily,
  • dve čerpadlá,
  • plynový kotol,
  • sedem teplotných senzorov,
  • 17 termostatických Z-Wave radiátorových hlavíc.

 

VI. Zariadenia používané na kontrolu detí v exteriéri

Súčasťou systému RUDO je audiotechnika prispôsobená na kontrolu malých detí v exteriéri pomocou sluchu. Audiotechnika sa zároveň používa na reprodukciu počítačového zvukového výstupu. Táto audio-zostava obsahuje:

– päť kondenzátorových mikrofónov,

– štyri parametrické predzosilovače (spektrálna filtrácia),

– mini mixážne zariadenie,

– zosiľovač,

– reprodukčná sústava.

 

VII. Softvérový server syntézy hlasu a orientačných zvukov

Dôležitou súčasťou používateľského rozhrania pre nevidiacich je umelá produkcia reči. AmI systém RUDO používa svoj vlastný syntetizér – GOBLIN, ktorý je vyvíjaný špeciálne pre potreby nevidiacich ľudí (viď 2-2, 3.2 a 3.3). Obsahuje šesť dôležitých súčastí:

  • syntéza “text to speech”,
  • možnosť viacerých druhov hláskovania,
  • označovanie veľkých písmen,
  • voľba rýchlosti rozprávania,
  • možnosť generovania orientačných a emočných zvukov,
  • kompatibilita so softvérovým asistentom pri čítaní.

Syntetizér GOBLIN je nainštalovaný na domovom miniservri a tiež na každom klientskom počítači. Prepojenie softvérových servrov a poskytovanie ich služieb klientským aplikáciám je zobrazené na blokovej schéme 2-2.

 

2-2 Bloková schéma softvérových servrov

2-2_blokova_schema_softverovych_servrov

 

VIII. Softvérový server asistencie pri čítaní

Súčasťou používateľského rozhrania pre nevidiacich je softvérový asistent pri čítaní. Automaticky vyberá z plochy displeja informácie, ktoré majú byť čítané prioritne a ktoré čítané byť nemajú (viď 2-2).

Zároveň ponúka nástroje na imperatívny výber textu z plochy displeja na čítanie pomocou syntetického hlasu. Imperatívny výber sa vykonáva pomocou klávesnice alebo na základe požiadavky klientskej aplikácie (viď 2-2).

 

IX. Softvérový server zabezpečenia a taxonometrie

Táto služba informuje nevidiaceho o pohybe pomocou orientačných zvukov. Upozorňuje na únik tepla, ak neboli zatvorené dvere smerom do exteriéru.

Dôležitou súčasťou je rozpoznávanie známych prichádzajúcich ľudí a identifikácia neznámych pomocou pohybových senzorov. Taxonometriu a rozpoznávanie vykonáva neurónová sieť (viď 2-2).

 

X. Softvérový server obsluhy zariadení kotolne

Systém RUDO obsahuje softvérový automat, ktorý realizuje vykurovací proces a ohrev vody v bojleri (viď 2-2). Dôraz pri návrhu automatizácie vykurovania bol daný na dve dôležité potreby nevidiaceho človeka:

  • úspora energií,
  • plná obsluhovateľnosť vykurovania pomocou špeciálneho používateľského rozhrania pre nevidiacich.

V súčasnosti sa totiž nevyrábajú vykurovacie systémy, ktoré môžu byť obsluhované bez potreby zraku.

 

XI. Softvérový server teplotnej zónovej regulácie

Systém zónovej regulácie umožňuje nevidiacemu zorientovať sa v teplotách jednotlivých miestností – zón. Ponúka prostriedky na nastavenie požadovaných teplôt (viď 2-2).

Dôležitou súčasťou tejto služby sú časové harmonogramy, pomocou ktorých je možné nastaviť vykurovanie v zónach a časoch tak, aby sa kúrilo len v práve používaných miestnostiach. Vytvára sa tak ilúzia celoplošného vykurovania, ktorá bez straty komfortu výrazne šetrí energie.

V nasledujúcej podkapitole sú podrobnejšie opísané technológie špeciálneho používateľského rozhrania pre nevidiacich. Systém RUDO využíva toto rozhranie dvomi spôsobmi:

  • na osobnú komunikáciu s používateľom pri práci na klientskej počítačovej stanici,
  • na verejnú komunikáciu pomocou domových reproduktorov.

 

3 Používateľské rozhranie pre nevidiacich

Prvotný rozvoj informatiky priniesol nové možnosti v oblasti kompenzácie zrakového hendikepu. Najnovší vývoj prináša výrobky s dotykovými displejmi, ktoré zväčša neumožňujú inštaláciu asistenčných technológií.

S takýmito bariérami sa používateľ môže stretnúť pri úplne bežných výrobkoch ako tlačiarne, rádiá, DVD prehrávače, televízory, plynové a elektrické vykurovacie kotle, práčky a mnoho iných výrobkov. Nevidiaci opäť zostáva so svojim hendikepom bezradný a často neschopný integrácie do takého života, aký prináša súčasnosť.

RUDO komunikuje v rámci lokálnej počítačovej siete a WiFi na princípe server/klient. Preto je obsluhovateľný pomocou klientských aplikácií nainštalovaných na počítačoch pripojených metalicky alebo cez WiFi.

Obsluha je tiež možná pomocou vzdialenej správy cez internet.

Klientské aplikácie sú vybavené asistenčnými technológiami pre nevidiacich, ktoré sprostredkujú informácie pomocou syntetického hlasu a hmatového displeja.

Používateľské rozhranie je prispôsobené tak, aby nevidiacim obyvateľom nahrádzalo pohľad na displej. Hlasový výstup sa preto nerealizuje len cez reproduktory klientskej počítačovej stanice. V byte sú nainštalované navyše dva reproduktory, cez ktoré server ohlasuje dôležité udalosti.

Napríklad ak sa vybíjajú batérie v niektorej zo Z-Wave hlavíc, systém RUDO zahlási v bytovom reproduktore stav batérie a umiestnenie radiátora v budove. Hlásenie sa realizuje asi týždeň pred úplným vybitím a opakuje sa viackrát denne. Po jednoduchej výmene batérií sa hlásenie automaticky zruší.

Nevidiaci je takto včas informovaný s presnou špecifikáciou umiestnenia danej hlavice, čím nedôjde k výpadku vykurovania na danom radiátore.

Energia batérií pokryje čas od polovice až po celú vykurovaciu sezónu. Ich spotreba je daná početnosťou automatických teplotných korekcií, teda závisí od polohy daného radiátora v budove.

Vysielanie Z-Wave signálu nie je energeticky zaťažujúce, lebo hlavice pracujú v spiacom režime. Čas pravidelného prebúdzania je daný tzv. wakeup intervalom, ktorý je nastavený na päť minút. Systém RUDO umožňuje tento interval prestaviť až do 30 minút, čím sa spotreba batérií ešte zníži. Teplotné korekcie sa totiž vykonajú vždy pri prebudení hlavice.

V testovacom prototype bol zvolený najkratší interval prebúdzania z dôvodov empirického otestovania najväčšej spotreby.

Kratší interval prebúdzania zvyšuje rýchlosť reakcie hlavice na podnet používateľa z klientskej aplikácie alebo na automatický podnet zo servra zónovej regulácie.

 

3.1 Špeciálny vstup pre nevidiacich

Aby mohol nevidiaci používateľ ovládať AmI systém, je potrebné prispôsobiť vstup z bežnej klávesnice na vstup v Braillovom – bodovom písme.

Softvér, ktorý túto funkciu zabezpečuje, číta udalosti bežnej klávesnice zo zariadenia /dev/input/eventX, pričom toto zariadenie zakáže pre iné procesy. Zároveň otvorí zariadenie emulácie klávesnice /dev/uinput na zápis.

Takouto filtráciou udalostí bežnej klávesnice rozšíri jej funkciu aj na zápis v Braillovom písme pre nevidiacich (viď 3.1-1, 3.1-2 a 3.1-3). Rozšírená funkcia klávesnice sa ľahko používateľsky zapína alebo vypína, čo spôsobuje, že táto úprava neobmedzuje vidiacich používateľov.

Pri rozšírenej funkcii klávesnice sú znaky “asdfjkl;” vnímané ako body Braillovho písma. Preto sa musia tieto klávesy stláčať naraz v príslušných kombináciách (viď 3.1-1, 3.1-2 a 3.1-3).

Takýto filtračný softvér sa inštaluje na klientské počítače, ale aj na domový miniserver. Nevidiaci tak môže vykonávať bežnú obsluhu, ale aj celkovú údržbu systému domácej automatizácie.

Pri programovaní filtra pre nevidiacich pre bežné klávesnice bola zistená ich hardvérová nespôsobilosť pri väčšine výrobcov a typov klávesníc.

Pri klávesniciach je uvádzaný parameter KRO-n (Key RollOver), ktorý určuje, koľko klávesov môže byť naraz stlačených. Pre počítačové Braillove písmo sa vyžaduje KRO-8, avšak väčšina klávesníc sa pohybuje od KRO-3 až po KRO-6.

V zmysle humanizácie informatiky sa v tejto veci žiada zaviesť nový štandard pre klávesnice. Môžu mať zabudovaný hardvérový prepínač alebo možnosť výberu v BIOSe, ktorý umožní KRO-8, na prácu v Braillovom písme pre nevidiacich. Takýmto systematickým krokom sa môže podporiť gramotnosť nevidiacich ľudí v bodovom – Braillovom písme, ktorá je pre nich veľmi dôležitá.

Test klávesnice na parameter KRO-n je veľmi jednoduchý. V akomkoľvek editore sa naraz stlačia klávesy “asdfjkl;”. V editore sa zobrazia buď všetky špecifikované znaky, alebo len ich obmedzený počet.

 

3.1-1 Braillove písmo pre nevidiacich

3-1-1_braillove_pismo_pre_nevidiacich6a8

 

Prvých desať znakov neobsahuje body s indexami 3 a 6. Druhá desiatka je podobná prvej, ale obsahuje navyše bod s indexom 3. Tretia desiatka je neúplná a podobná druhej, obsahuje navyše bod s indexom 6. Výnimkou je znak “w”.

Čísla sú veľmi podobné prvej desiatke znakov, lebo sú v nich body znížené o jeden bodový riadok nadol, ako je vidieť v 3.1-2. Základné Braillove písmo sa preto veľmi ľahko zapamätá. Je potrebné pamätať si len prvých desať písmen abecedy podľa 3.1-1.

 

3.1-2 Číselné a nealfanumerické Braillove znaky

3-1-2_cislne_nealfanumericke_braillove_znaky

 

Braillove znaky v 3.1-2 sú kódované podľa štandardu amerického počítačového bodového písma. Kombinácia slovenského Braillovho písma s americkým počítačovým bodovým písmom umožňuje pomocou jedného stlačenia klávesov zápis všetkých znakov – bežné, znaky s diakritikou, číselné znaky, počítačové programátorské znaky.

Navyše umožňuje pri čítaní na hmatovom displeji použitie 6-bodového módu, čím sa enormne urýchli čítanie pomocou hmatu. V 3.1-3 sú ukázané Braillove znaky s diakritikou, ktoré sú používané v slovenskom a českom jazyku. V znakoch s diakritikou je použitý navyše bod s indexom 8.

Ak chce nevidiaci používateľ zapísať veľké písmeno, pridá ku kombinácii bodov navyše aj kláves medzerník. Znaky s diakritikou budú mať potom navyše body s indexom 7 a 8.

 

3.1-3 Braillove znaky s diakritikou

3-1-3_braillove_znaky_sdiakritikou

 

3.2 Špeciálny výstup pre nevidiacich

AmI systém RUDO má implementovaný syntetizér GOBLIN (viď 2-2), ktorý môže spolupracovať s filtrom klávesnice pre nevidiacich, s hmatovým – bodovým displejom alebo sa môže použiť pri bežnom sprostredkovaní informácií.

Pri sprostredkovaní informácií z bežného displeja GOBLIN spolupracuje s navigačným – asistenčným softvérovým servrom, ktorý pomáha nevidiacemu orientovať sa na obrazovke a čítať tie informácie, ktoré sú pre neho v danej chvíli dôležité.

GOBLIN je nainštalovaný na klientských počítačoch, kde využíva zvukové zariadenie príslušných počítačov.

Zároveň je tiež nainštalovaný na domovom miniservri (viď 2-2). Táto implementácia realizuje hlásenia v bytových reproduktoroch. Je ale možné použiť ju aj na bežné sprostredkovanie informácií v prípade, že klientský počítač nemá k dispozícii zvukové zariadenie alebo sa toto zariadenie používa na iné účely.

GOBLIN ponúka niekoľko režimov a rýchlostí rozprávania, medzi ktorými je aj niekoľko typov hláskovaní, ktoré sa používajú na spätnú opravu napísaných textov.

V inteligentných budovách môžu bývať napríklad aj rodičia s nevidiacim dieťaťom, ktoré potrebuje asistenciu pri výučbe do školy, pri písaní domácich úloh a podobne.

 

3.3 Syntetizér GOBLIN

Pri vývoji technológie syntézy pre AmI systém RUDO boli stanovené dva ciele, ktoré ovplyvnili výber metodiky a priorít.

1.

Syntetizér musí byť navrhnutý výslovne pre potreby nevidiacich používateľov počítačov. Znamená to naplnenie šiestich nižšie uvedených bodov:

  • syntéza “text to speech”,
  • možnosť viacerých druhov hláskovania,
  • označovanie veľkých písmen,
  • voľba rýchlosti rozprávania,
  • možnosť generovania orientačných a emočných zvukov,
  • kompatibilita so softvérovým asistentom pri čítaní.

Dôraz na hláskovanie a označovanie veľkých písmen je pre nevidiaceho veľmi dôležitý pri spracovaní textov a ich spätných opravách.

Nastavenie rýchlosti rozprávania a zručnosť pri využívaní softvérového asistenta pri čítaní dominantne ovplyvňuje konečnú produktivitu nevidiaceho používateľa.

Orientačné a emočné zvuky používateľa informujú o udalostiach, ktoré sú v danej chvíli pre neho dôležité. Špecifické zvuky sú pritom priradené konkrétnym udalostiam.

 

2.

Druhým cieľom bolo, aby si mohol nevidiaci sám laicky a pomerne rýchlo vytvoriť hlasový korpus. Prakticky to znamená, naučiť počítač rozprávať hlasom napr. svojej manželky alebo dcéry. Zachovanie hlasu blízkeho človeka je zaujímavou náhradou fotografie, ktorú nevidiaci vidieť nemôže.

Pretože vývoj syntézy bol pre systém RUDO dominantný, rozhodujúca bola aj rýchlosť prípravy prvej verzie syntetizéra GOBLIN.

Hlasový korpus bol preto minimalizovaný, pre slovenský jazyk obsahuje 102 častíc hlasu a približne 100 navigačných zvukov.

Takáto syntéza nie je veľmi kvalitná, jadro syntetizéra musí obsahovať generátor koartikulačných prechodov, ktoré sa v hlasovom korpuse priamo nenachádzajú.

V druhej verzii, ktorá je v súčasnosti vyvíjaná, sa vychádza z technológie “text to speech” – tzv. “unit selection”. Keďže ku každej hlasovej vzorke bol priradený jej popisný vektor tak, aby mohla byť dodatočne modifikovaná, rozšírenie bolo nazvané “object selection” – vzorka a jej vektor vytvárajú objekt.

Aby mohol byť hlasový korpus minimalizovaný, pri syntéze prebieha rozdeľovanie textu na tzv. slabú, strednú a silnú syntézu.

V texte so slabou syntézou sú potlačené koartikulácie.

V texte so strednou syntézou sú dominantné koartikulácie.

V texte so silnou syntézou sú dominantné mikrokoartikulačné javy.

Podľa druhu syntézy sa volia na kompozíciu buď fonémy a koartikulačné prechody sa umelo generujú alebo sa volia difóny alebo pri silnej syntéze trifóny.

Pre slovenský jazyk je navrhnutý hlasový korpus, ktorý má niečo vyše 500 hlasových objektov.

Automatické vytváranie hlasového korpusu prechádza jednotlivými vzorkami a nastavuje vhodne ich popisné vektory. Využíva sa pritom spektrálna a kepstrálna analýza vzoriek.

Pretože do vytvárania hlasového korpusu vstupuje automat, čas prípravy sa skráti na niekoľko minút. Používateľ – laik – nahrá do mikrofónu asi tri strany A4 špeciálne pripraveného textu, čo trvá približne 1.5 hodiny.

Druhá verzia syntetizéra GOBLIn je vo vývoji. empirické testovanie na čiastkovej verzii hlasového korpusu je však veľmi uspokojivé. Kvalitou sa dostáva niekde medzi kvalitu syntézy difónov a trifónov.

Posted in SYSTÉM ROWS and tagged , , , , , , , , .