Contact





TMH / Education

Fördjupningsblock

TAL- OCH LJUDINFORMATIK

Beskrivning av fördjupningsblock

Blocket ger kunskaper om överföring av information med tal och musik som medium. Människa-dator- interaktion med tal är en central del av blockinnehållet. Sålunda avhandlas begrepp inom tal, språk, hörsel och perception samt användning av digital signalbehandling och statistiska metoder för analys och klassificering av ljud. Registrering, lagring, kodning och återgivning av tal och musik med digitala och analoga metoder ingår också. Hur tal- och musikljud bildas och formas och de informationsbärande delarna av signalen diskuteras.

 Tillämpningar inom talteknologi är exempelvis talande och talförstående datorer, sofistikerade talkodningsmetoder, dialogsystem, handikapphjälpmedel, inom musikakustik datorgenererad sång och musik, detaljerad beskrivning av ett visst instruments funktion och registrering och återgivning av tal och musik. 

Mål

De mål som anges i de olika kursbeskrivningarna och fördjupade kunskaper inom det speciella området som definieras av examensarbetet.

 Förkunskapskrav

 Se de olika kurserna. Valet av ämnesområde för examensarbetet påverkar också förkunskapskraven Rekommenderade förkunskaper Kunskaper i digital signalbehandling kan vara intressanta liksom filterkunskap, lingvistik, artificiell intelligens, neuronnät, osv.. Detta är beroende på examensarbetets inriktning.

Yrkeslivet

Talteknologi väcker ett allt större intresse, både inom forskning som industri. Det totala behovet av talforskare kan förutses få en stark tillväxt i samband med utvecklingen av nya tettjänster och röstbaserade gränssnitt till datorer och allmänna databaser. 

KORTFATTAD BESKRIVNING AV FORSKNINGSOMRÅDET

Talteknologi

Talteknologi håller på att växa fram som ett nytt tvärvetenskapligt forskningsområde och har sina rötter framför allt i lingvistik, talkommunikationsforskning och datalogi. Exempel på olika delområden för forskningen inom området är talkodning, text-till-talsyntes, automatisk taligenkänning, talförståelse, talarverifiering och dialogsystem baserade på talad kommunikation.

Talteknologi har i många forskningsprogram identifierats som en nyckelteknologi för att förenkla och effektivisera datoranvändning och därmed skapa helt nya vägar till det framtida informationssamhället. Betydande teknologiska genombrott är att vänta de närmaste åren. Stora satsningar görs nu framförallt i Japan, USA och inom EU. Området har redan idag en industriell förankring i Sverige, speciellt vad gäller den mångspråkiga talsyntes som utvecklats vid KTH. Förutsättningarna för en fortsatt lyckad industriell exploatering i Sverige måste bedömas som mycket goda.

Ett genombrott för allmän användning av talteknologi i bland annat informationssystem kommer att kräva ökade och bättre organiserade insatser inom utbildning, forskning och industriell utveckling. I Sverige finns både akademisk forskning och industriell FoU av hög internationell klass. Aktiviteten på området har ökat markant den senaste tiden. Ett Kompetenscentrum för talteknologi, CTT, har etablerats vid KTH, på initiativ av Institutionen för tal, musik och hörsel (KTH), Språkteknologiprogrammet (HSFR / NUTEK) och de tunga industriella aktörerna på detta område i Sverige, Telia och Ericsson. Industriell verksamhet har också kommit igång.
 

Hörselteknik

Baserat på kunskaper om talet pågår forskning och utvecklingsarbete huvudsakligen koncentrerat kring problem för gravt hörselskadade och döva.

Auditiv och audiovisuell talperception studeras och relateras till det patologiska örats ljudanalytiska förmåga, frekvens- och tidsupplösning, förmågan att identifiera prosodiska element, fonem- och talförståelseförmåga.

Tekniska (läpp)-avläsehjälpmedel för gravt hörselskadade och döva personer där stödsignalen som kompletterar avläsebilden kan överföras som en omkodad auditiv signal simuleras och utvärderas. Omkodningen syftar till anpassning; a) till en liten hörselrest, b) till känselsinnet (vibrationsmönster, taktil signal), c) till direkt stimulering av hörselnerven (cochlea-implantat) och d) till visuell stimulering med hjälp av lysdioder monterade i glasögon. Syftet är att få fram användbara hjälpmedel för kommunikation med tal.

Kompetensutveckling och processorteknologi ger också intressanta möjligheter att utveckla nya avancerade programmerbara/adaptiva hörapparater för personer med lindriga hörselskador.

Talförståelse mäts interaktivt med auditiv, visuell och audio-visuell presentation. Interaktiv datorteknik används också för att utvärdera olika typer av avläsehjälpmedel. Samarbetet med andra institutioner inom EG:s ram är intensivt.

Döva talares förråd av talljud (fonetiska system) och realiseringen av dessa i en språklig omgivning (fonologiska system) studeras. Dessutom pågår utveckling och utvärdering av datoriserade hjälpmedel för talinlärning, talträning och talkorrektion.

Musikakustik

Musikakustiken studerar musiken i dess ljudande form, framför allt hur ljuden bildas i instrumenten och hur de sammansätts till strukturer. Studiet av musikinstrumentens akustiska funktionssätt innebär fysikalisk grundforskning. Samtidigt ger forskningsverksamheten insyn i hur människan uppfattar ljud och ljudföljder och resultaten bidrar till en bättre förståelse för den musikaliska kommunikationsprocessen.

Tillämpningarna ligger inom flera vitt skilda fält på musikkulturens områden som musikinstrumentbyggeri, musikteori, musikpedagogik, musikpsykologi, elektroakustiskt musikskapande och annat slags komposition. Den inom musikkulturen unika kombinationen av musikforskning vid teknisk högskola gör det angeläget för gruppen att dessutom pröva hur ny teknik kan utnyttjas i musikens tjänst. 

Röstforskning

Människans röst är såväl vårt främsta kommunikationsmedel som det mest uttrycksfulla musikinstrumentet. På TMH sker en mycket livaktig forskning vad gäller hur rösten fungerar och vad som händer när den inte fungerar. Vi har också ett mångårigt samarbete med Karolinska Institutet och flera utländska institutioner när det gäller teknisk röstvetenskap. Intresserade studenter välkomnas till examensarbeten, även om vi för närvarande inte har några röstkurser på grundutbildningsnivå.

Elektroakustik

Ingen forskning inom elektroakustik sker för närvarande på institutionen men det finns utrymme för intressanta examensarbeten inom elektroakustik och audioteknik. 







Published by: TMH, Speech, Music and Hearing
Webmaster, webmaster@speech.kth.se

Last updated: Wednesday, 14-Apr-2010 13:43:18 MEST