Vystupy a etapy projektu¶

Výstupy projektu
hlavní - 2xR(SW), vedlejší - 2xJ(článek v odb. časopise), 14xD(článek v časopise, konf. 2017-2019)
LSSDD - lingvisticky strukturovaná softwarová databáze pro zaznamenávání a zveřejňování dotazů jazykové poradny ÚJČ
SADA - systém pro poloautomatickou analýzu dat pro usnadnění předzpracování dat pro LSSDD
Budoucí uživatelé: LSSDD - FF MUNI, PF MUNI, PF TUL, JÚLŠ SAV a SADA - MFF UK

Etapy projektu
01 - Nová strukturace poradenských hovorů – návrh automatické segmentace (zač.2016-03-01 - kon. 2018-12-31 - odevzdání výsledku 2018-12-31)
Součinnost ZČU a ÚJČ: Návrh klíčových orientačních výrazů ve vedení dialogu pracovníků poradny s tazateli pro podporu automatické segmentace a klasifikace částí hovoru, algoritmy porozumění jazyku, zpracování modelů pro segmentaci dotazu, zapracování do modulu porozumění jazyku (součást systému SADA).
výstup: KKY-D – článek ve sborníku (plán TSD 2017/2018)

02 - Kategorizace dat (2018-01-01 - 2019-12-31 - 2019-12-31)
ÚJČ: Tvorba kategorií dotazů, vytvoření trénovacích dat, zpětná vazba k poloautomatické kategorizaci.
ZČU: Zpracování modelů pro kategorizaci dotazu – úprava algoritmů pro identifikaci tématu v dotazu, zapracování do modulu porozumění jazyku (součást systému SADA).
výstupy: KKY-D - článek ve sborníku (plán Interspeech 2018/2019), UJC-J - článek v časopisu (plán Naše řeč 2018)

03 - Tvorba databáze (2016-03-01 - 2018-12-31 - 2019-12-31)
ÚJČ: Vytvořit základní návrh struktury databáze – veřejné i neveřejné části – a propracovávat jej, a to tak aby co nejlépe vyhovovala potřebám uživatelů (bude odvozeno od toho, na jaké jevy se tazatelé ptají a co konkrétně o nich chtějí vědět), charakteru a objemu dat a způsobům práce zadavatelů dat.
ZČU-KIV: Vytvořit programový návrh databáze LSSDD.
výstup: 7*D - 6*UJC-článek ve sborníku (plán konference 2016-2019) + 1*KIV (plán databázová konference 2019)

04 - Průběžné zadávání dat do databáze (2017-01-01 - 2019-12-31 - 2019-12-31)
ÚJČ: V průběhu celé etapy bude probíhat zadávání dotazů (archivní dotazy i dotazy pořízené v průběhu trvání projektu) do LSSDD.
výstup: J - článek v časopisu (plán Naše řeč 2019)

05 - Tvorba jazykového modelu (2016-03-01 - 2018-12-31)
ZČU: Příprava dat pro jazykový model – přepis nahrávek poradny pořízených v době před započetím prací na projektu a jejich úprava pro trénování jazykového modelu systému automatického přepisu řeči, zapracování do modulu automatického rozpoznávání řeči (součást systému SADA).
ÚJČ: Připraví podkladová data.

06 - Tvorba nového akustického modelu (2017-01-01 - 2019-12-31)
ZČU: Příprava dat pro akustický model – z nahrávek poradenských hovorů pořízených v průběhu trvání projektu natrénovat nový akustický model, zapracování do modulu automatického rozpoznávání řeči (součást systému SADA).
ÚJČ: Připraví podkladová data.

07 - Programový návrh systému SADA (2016-03-01 - 2019-12-31 - 2019-12-31)
ZČU: Vytvořit programový návrh systému SADA.
ÚJČ: Součinnost při návrhu rozhraní systému SADA.
výstup: D – článek ve sborníku (plán TSD 2019), R – SW systém SADA pro poloautomatické zpracování dat pro vložení do databáze

08 - Webové rozhraní přístupu do databáze LSSDD (2017-03-01 - 2019-12-31 - 2019-12-31)
ZČU: Vytvořit webové rozhraní přístupu do databáze LSSDD.
ÚJČ: Součinnost při návrhu rozhraní databáze LSSDD, rozdělení privátní a veřejné části databáze.
výstup: R – softwarová databáze LSSDD s rozhraním pro přístup k datům (čtení /zápis/ různá úroveň práv)

Files (0)

Project

General

Profile

NAKI-II-UJC-UKONCENE

Wiki

Vystupy a etapy projektu¶