Bootstrapping Language Description [Elektronisk resurs] The case of Mpiemo (Bantu A, Central African Republic)
-
Hammarström, Harald 1977- (författare)
-
Sixth international conference on Language Resources and Evaluation, LREC 2008, 28-30 May 2008, Marrakech
-
Thornell, Christina (författare)
-
Petzell, Malin 1972- (författare)
-
Westerlund, Torbjörn 1971- (författare)
-
Uppsala universitet Humanistisk-samhällsvetenskapliga vetenskapsområdet (utgivare)
- 2008
- Engelska.
-
Läs hela texten
-
Läs hela texten
-
Läs hela texten
Sammanfattning
Ämnesord
Stäng
- Linguists have long been producing grammatical decriptions of yet undescribed languages. This is a time-consuming process, which has already adapted to improved technology for recording and storage. We present here a novel application of NLP techniques to bootstrap analysis of collected data and speed-up manual selection work. To be more precise, we argue that unsupervised induction of morphology and part-of-speech analysis from raw text data is mature enough to produce useful results. Experiments with Latent Semantic Analysis were less fruitful. We exemplify this on Mpiemo, a so-far essentially undescribed Bantu language of the Central African Republic, for which raw text data was available.
Ämnesord
- Humanities and the Arts (hsv)
- Languages and Literature (hsv)
- Specific Languages (hsv)
- Humaniora och konst (hsv)
- Språk och litteratur (hsv)
- Studier av enskilda språk (hsv)
- Natural Sciences (hsv)
- Computer and Information Sciences (hsv)
- Language Technology (Computational Linguistics) (hsv)
- Naturvetenskap (hsv)
- Data- och informationsvetenskap (hsv)
- Språkteknologi (språkvetenskaplig databehandling) (hsv)
- HUMANITIES and RELIGION (svep)
- Languages and linguistics (svep)
- Other languages (svep)
- African languages (svep)
- HUMANIORA och RELIGIONSVETENSKAP (svep)
- Språkvetenskap (svep)
- Övriga språk (svep)
- Afrikanska språk (svep)
- HUMANITIES and RELIGION (svep)
- Languages and linguistics (svep)
- Linguistic subjects (svep)
- Computational linguistics (svep)
- HUMANIORA och RELIGIONSVETENSKAP (svep)
- Språkvetenskap (svep)
- Lingvistikämnen (svep)
- Datorlingvistik (svep)
Indexterm och SAB-rubrik
- Mpiemo
- Bantu A
- Central African Republic
- NLP
- Latent Semantic Analysis
- bootstrapping
Inställningar
Hjälp
Uppgift om bibliotek saknas i LIBRIS
Kontakta ditt bibliotek, eller sök utanför LIBRIS. Se högermenyn.