Contact
Institutionen för tal, musik och hörsel
Talteknologi och talkommunikation, tal

Talet som kommunikationsmedium

Forskningen inom avdelningen är tvärvetenskapligt med kontakter inom många ämnesområden som till exempel lingvistik, fonetik, psykologi och medicin förutom den rent tekniska inriktningen. Arbetet inom avdelningen rör alla aspekter av talad kommunikation mellan människor och mellan människor och datorer. Det innebär att vi studerar hur människan talar med hjälp av stämband, käke, tunga och läppar.

Akustiska modeller av talet bildar grunden för hur vi kan skapa konstgjort tal - talsyntes. Talsyntes kan även genereras med hjälp av bearbetat inspelat tal som sätts ihop på ett intelligent sätt. I båda fallen fordras modeller för relationen stavning och uttal liksom modeller för hur yttrandet är beroende av det som sagts tidigare, yttrandets grammatik och dess semantik.

Talförståelse är det omvända problemet - att låta en dator känna igen vad som sägs. Metoderna inom detta område är i hög grad baserade på en statisk beskrivning av stora mängder inspelat tal. Det är dock även av intresse att studera hur vår kunskap om det talade språkets underliggande egenskaper skall kunna utnyttjas och kombineras med de statiska metoderna.

I talbaserade dialogsystem integreras talteknologin i fullständiga system där modeller för dialoghantering måste utnyttjas. Inom detta område ingår inte bara hantering av enkla dialoger utan även studier av hur systemet skall vara robust på alla nivåer och hur fel skall hanteras.

För multimodala tillämpningar har den akustiska talsyntesen kompletterats med animerade talande ansikten. Med hjälp av animerade talande agenter kan dialogsystemen ges nya viktiga kanaler för informationsöverföring. Visuell och akustisk syntes kan skapa nya robusta system som kan användas i störda miljöer och även som hjälpmedel för personer med hörselnedsättning.

Ett speciellt forskningsområde inom avdelningen rör talarbeskrivning. Området har tillämpningar inom både talsyntes, som till exempel syntes av olika röster, taligenkänning, som speciella personanpassade system, och talarverifikation. Talarverifiering kommer att få stor betydelse för säkerhetkontroll inom till exempel framtida banktjänster. En grupp inom avdelningen har fokuserat sitt arbete på hur tal- och språkteknologi skall kunna tillämpas inom handikappområdet. Som exempel på ett sådant hjälpmedel som vi arbetar med är ett system som snabbar upp skrivandet, vilket kan vara till stor hjälp för talskadade med rörelsehinder.

ForskningsprojektPublished by: TMH, Speech, Music and Hearing
Webmaster, webmaster@speech.kth.se

Last updated: Monday, 30-Aug-2004 11:47:42 MEST