Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
TED Multilingual Discourse Bank (TED-MDB): a parallel corpus annotated in the PDTB style
Stockholms universitet, Humanistiska fakulteten, Institutionen för lingvistik, Avdelningen för datorlingvistik. Middle East Technical University, Turkey.
Visa övriga samt affilieringar
2019 (Engelska)Ingår i: Language resources and evaluation, ISSN 1574-020X, E-ISSN 1574-0218Artikel i tidskrift (Refereegranskat) Epub ahead of print
Abstract [en]

TED-Multilingual Discourse Bank, or TED-MDB, is a multilingual resource where TED-talks are annotated at the discourse level in 6 languages (English, Polish, German, Russian, European Portuguese, and Turkish) following the aims and principles of PDTB. We explain the corpus design criteria, which has three main features: the linguistic characteristics of the languages involved, the interactive nature of TED talks—which led us to annotate Hypophora, and the decision to avoid projection. We report our annotation consistency, and post-annotation alignment experiments, and provide a cross-lingual comparison based on corpus statistics.

Ort, förlag, år, upplaga, sidor
2019.
Nyckelord [en]
Discourse, Discourse relations, Corpus creation, Annotation, Multilingual corpus
Nationell ämneskategori
Jämförande språkvetenskap och allmän lingvistik
Forskningsämne
lingvistik
Identifikatorer
URN: urn:nbn:se:su:diva-173474DOI: 10.1007/s10579-019-09445-9OAI: oai:DiVA.org:su-173474DiVA, id: diva2:1354083
Tillgänglig från: 2019-09-24 Skapad: 2019-09-24 Senast uppdaterad: 2019-09-25

Open Access i DiVA

Fulltext saknas i DiVA

Övriga länkar

Förlagets fulltext

Sök vidare i DiVA

Av författaren/redaktören
Kurfali, Murathan
Av organisationen
Avdelningen för datorlingvistik
I samma tidskrift
Language resources and evaluation
Jämförande språkvetenskap och allmän lingvistik

Sök vidare utanför DiVA

GoogleGoogle Scholar

doi
urn-nbn

Altmetricpoäng

doi
urn-nbn
Totalt: 66 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf