CD: Word index (CD_Ordliste)
This page is not translated to English
If the information on this page seems important, please contact PolSys
-----------------------------------------
CD: Ordliste (CD_Ordliste)
Ord i partidokumentene er indeksert ved at feltet Ord inneholder alle partidokumentenes ord.
Ord i tekstform (Ord)
I dette feltet er hvert enkelt ord i partidokumentene lagret. Et ord i dette feltet består av karakterene A-Å, a-å og 0-9; alle andre karaktertegn er erstattet med blank (" ") før lagring.
F eks vil ordet/sekvensen "Nato-medlemskap" i et partidokument bli lagret i dette feltet som to poster: "Nato" og "medlemskap".
Dokumentnummer (Nummer)
Fortløpende ordteller innenfor dokument (Nummer) (Ordteller)
Karakterposisjon i tekstdokumentet - fra (Fra)
Karakterposisjon i orginalt tekstdokument (*.txt).
Karakterposisjon i tekstdokumentet - til (Til)
Karakterposisjon i orginalt tekstdokument (*.txt).
Frase (Frase)
Dette feltet inneholder feltet Ord pluss de fire forregående ord; altså en frase på fem ord.
Hensikten med feltet er forenkle uttak av fraser fra partidokumenter.
Setningsnummer (Setningsteller)
Refererer til setningsnummeret ordet tilhører.
Avsnittsnummer (Avsnittsteller)
Refererer til avsnittsnummeret ordet tilhører.
Copyright © Sikt – Kunnskapssektorens tjenesteleverandør • Kontakt SIKT • Personvernerklæring Versjon 1.1 • Tilgjengelighetserklæring