Endre søk
RefereraExporteraLink to record
Permanent link

Direct link
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annet format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annet språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
SWORD: Towards Cutting-Edge Swedish Word Processing
Vise andre og tillknytning
2016 (engelsk)Inngår i: Proceedings of SLTC 2016, 2016Konferansepaper, Publicerat paper (Fagfellevurdert)
Abstract [en]

Despite many years of research on Swedish language technology, there is still no well-documented standard for Swedish word processing covering the whole spectrum from low-level tokenization to morphological analysis and disambiguation. SWORD is a new initiative within the SWE-CLARIN consortium aiming to develop documented standards for Swedish word processing. In this paper, we report on a pilot study of Swedish tokenization, where we compare the output of six different tokenizers on four different text types. For one text type (Wikipedia articles), we also compare to the tokenization produced by six manual annotators.

sted, utgiver, år, opplag, sider
2016.
Emneord [en]
Tokenization, morphological analysis
HSV kategori
Forskningsprogram
datorlingvistik
Identifikatorer
URN: urn:nbn:se:su:diva-137054OAI: oai:DiVA.org:su-137054DiVA, id: diva2:1058883
Konferanse
SLTC 2016 - The Sixth Swedish Language Technology Conference (SLTC) Umeå, Sweden, 17-18 November, 2016
Prosjekter
SWE-CLARIN
Forskningsfinansiär
Swedish Research Council, 821-2013-2003Tilgjengelig fra: 2016-12-21 Laget: 2016-12-21 Sist oppdatert: 2019-11-28bibliografisk kontrollert

Open Access i DiVA

fulltext(114 kB)91 nedlastinger
Filinformasjon
Fil FULLTEXT01.pdfFilstørrelse 114 kBChecksum SHA-512
28a70446eabd18e2afad1a9ff7d1d016e3c796bc421d08e99e7f52880f57c9c4e66f62c2af68520d2fad65950f644b95f7e3df95ff21313c91952e0b22e696d4
Type fulltextMimetype application/pdf

Søk i DiVA

Av forfatter/redaktør
Adesam, YvonneAhrenberg, LarsBorin, LarsBouma, GerlofKann, ViggoÖstling, RobertSmith, AaronWirén, MatsNivre, Joakim
Av organisasjonen

Søk utenfor DiVA

GoogleGoogle Scholar
Totalt: 91 nedlastinger
Antall nedlastinger er summen av alle nedlastinger av alle fulltekster. Det kan for eksempel være tidligere versjoner som er ikke lenger tilgjengelige

urn-nbn

Altmetric

urn-nbn
Totalt: 743 treff
RefereraExporteraLink to record
Permanent link

Direct link
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annet format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annet språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf