Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Prevalence Estimation of Protected Health Information in Swedish Clinical Text
Stockholms universitet, Samhällsvetenskapliga fakulteten, Institutionen för data- och systemvetenskap.
Stockholms universitet, Samhällsvetenskapliga fakulteten, Institutionen för data- och systemvetenskap. Karolinska Institutet, Sweden.ORCID-id: 0000-0002-5780-0063
Stockholms universitet, Samhällsvetenskapliga fakulteten, Institutionen för data- och systemvetenskap.
2017 (Engelska)Ingår i: Informatics for Health: Connected Citizen-Led Wellness and Population Health / [ed] Rebecca Randell, Ronald Cornet, Colin McCowan, Niels Peek, Philip J. Scott, IOS Press, 2017, s. 216-220Konferensbidrag, Publicerat paper (Refereegranskat)
Abstract [en]

Obscuring protected health information (PHI) in the clinical text of health records facilitates the secondary use of healthcare data in a privacy-preserving manner. Although automatic de-identification of clinical text using machine learning holds much promise, little is known about the relative prevalence of PHI in different types of clinical text and whether there is a need for domain adaptation when learning predictive models from one particular domain and applying it to another. In this study, we address these questions by training a predictive model and using it to estimate the prevalence of PHI in clinical text written (1) in different clinical specialties, (2) in different types of notes (i.e., under different headings), and (3) by persons in different professional roles. It is demonstrated that the overall PHI density is 1.57%; however, substantial differences exist across domains.

Ort, förlag, år, upplaga, sidor
IOS Press, 2017. s. 216-220
Serie
Studies in Health Technology and Informatics, ISSN 0926-9630, E-ISSN 1879-8365 ; 235
Nyckelord [en]
electronic health records, protected health information, de-identification, natural language processing, predictive modeling
Nationell ämneskategori
Språkbehandling och datorlingvistik
Forskningsämne
data- och systemvetenskap
Identifikatorer
URN: urn:nbn:se:su:diva-149433DOI: 10.3233/978-1-61499-753-5-216ISBN: 978-1-61499-752-8 (tryckt)ISBN: 978-1-61499-753-5 (digital)OAI: oai:DiVA.org:su-149433DiVA, id: diva2:1161601
Konferens
The Medical Informatics Europe (MIE) Conference, Manchester, UK, 24-26 April, 2017
Tillgänglig från: 2017-11-30 Skapad: 2017-11-30 Senast uppdaterad: 2025-02-07Bibliografiskt granskad

Open Access i DiVA

Fulltext saknas i DiVA

Övriga länkar

Förlagets fulltext

Person

Henriksson, AronKvist, MariaDalianis, Hercules

Sök vidare i DiVA

Av författaren/redaktören
Henriksson, AronKvist, MariaDalianis, Hercules
Av organisationen
Institutionen för data- och systemvetenskap
Språkbehandling och datorlingvistik

Sök vidare utanför DiVA

GoogleGoogle Scholar

doi
isbn
urn-nbn

Altmetricpoäng

doi
isbn
urn-nbn
Totalt: 216 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf