COR-logo

Velkommen til det Centrale Ordregister!

Det Centrale Ordregister (COR) er et register over det danske ordforråds lemmaer og ordformer specielt udviklet til at understøtte sprogteknologiske projekter.

På denne side kan du finde forskellige COR-resurser, samt en manual. Det er også muligt at afprøve COR og gå på opdagelse i hvordan registeret er opbygget.

God fornøjelse!



Den udgave af COR som ligger her på ordregister.dk, svarer til Retskrivningsordbogens 4. udgave fra 2012 (med opdateringer til 2023). Retskrivningsordbogen er nu udkommet i 5. udgave, og vi lægger snarest en ny version af COR op.



COR 1.02

COR 1.02 er grundresursen i COR. Registeret er baseret på Retskrivningsordbogen og indeholder information om ordklasser og bøjningsformer for alle lemmaer i ordbogen.

Download den aktuelle version, COR 1.02, som en tab-separeret liste her: cor1.02.tsv

Download CORdiff-1.01b-1.02, der indeholder ændringer v1.01b -> v1.02 her: COR-1.01b-1.02.cordiff

Download CORdiff-1.00-1.02, der indeholder ændringer v1.00 -> v1.02 her: COR-1.00-1.02.cordiff


Download bix2bform_UTF8_01.tsv, der indeholder morfologiske oplysninger om COR 1.x (se afsnit om bøjningsinformation i manualen) her: bix2bform_UTF8_01.tsv


Manual kan findes her.

Teknisk Specifikation kan findes her.


Historiske versioner af COR kan downloades nedenunder:

Download COR 1.01b som en tab-separeret liste her: cor1.01b.tsv

Download COR 1.0 som en tab-separeret liste her: cor1.00.tsv

Download CORdiff-0.9-1.0 her: COR-0.9-1.0.cordiff


Licens: CC0

COR.EXT 1.0

COR.EXT 1.0 indeholder over 25.000 lemmaer fra Den Danske Ordbog som ikke findes i COR 1.0. COR.EXT 1.0 indeholder ordklasser og de fleste bøjningsformer.

Teknisk Specifikation kan findes her

Download COR.EXT 1.0 som en tab-separeret liste her: corext1.0.tsv

Licens: CC0

COR.SOEGEHJAELP 1.0

COR.SOEGEHJAELP 1.0 er en liste med en række stavefejl og alternative stavemåder (både officielle og uofficielle), samt angivelse af korrekt form.

Listen trækker på oplysninger der bruges i søgealgoritmen på Den Danske Ordbogs hjemmeside (ordnet.dk) for at hjælpe brugeren til at finde det ønskede opslagsord.

Teknisk Specifikation kan findes her

Download COR.SOEGEHJAELP 1.0 som en tab-separeret liste her: corsoegehjaelp1.0.tsv

Licens: CC0

COR.SEM 1.0

COR.SEM 1.0 er en leksikalsk semantisk resurse der er koblet til enten grundresursen COR eller COR.EXT. COR.SEM-resursen beskriver 34.000 danske lemmaers almensproglige betydninger, udtrykt ved hjælp af formaliserede værdier. Resursen er udarbejdet med udgangspunkt i en række oplysninger fra andre ordbøger: DanNet, Den Danske Ordbog, Det Danske FrameNet-leksikon, Det Danske Sentiment-leksikon samt Den Danske Begrebsordbog.

Dansk Sprog- og Litteraturselskab har udarbejdet en brugervenlig visning af COR.SEM-data på sitet corsem.dsl.dk. Der er mulighed for at få en ordbogsvisning af brugervalgte ord og mulighed for en visning med brugervalgte oplysningstyper samt udtræk af skræddersyede data.

Download COR.SEM 1.0 som en tab-separeret liste her: cor.sem.1.0.tsv

Beskrivelse: En detaljeret beskrivelse af resursen findes her.

COR.SEM er udviklet af Det Danske Sprog- og Litteraturselskab og Center for Sprogteknologi, Københavns Universitet.

Teknisk Specifikation kan findes her

Licens: CC0

Kontakt: Henvendelser vedr. COR.SEM kan stiles til:

Sanni Nimb (sn snabel-a dsl.dk), Bolette S. Pedersen (bspedersen snabel-a hum.ku.dk)

COR.SEM.EXT 1.0

COR.SEM.EXT 1.0 er en supplerende resurse til COR.SEM.

COR.SEM.EXT indeholder betydningsforklaringer for alle betydninger i COR.SEM. For de fleste betydninger er der desuden et eller flere brugseksempler fra Den Danske Ordbog.

COR.SEM.EXT er udviklet af Det Danske Sprog- og Litteraturselskab (DSL) og Center for Sprogteknologi, Københavns Universitet (CST).

Download COR.SEM.EXT 1.0 som en tab-separeret liste her: cor.sem.ext.1.0.tsv

Beskrivelse: En detaljeret beskrivelse af hovedresursen COR.SEM inkl. oplysningerne i den supplerende resurse COR.SEM.EXT findes her.

Teknisk Specifikation kan findes her

Licens: CC BY-NC-ND

COR.SEM.EXT udgives under en mere lukket licens end COR.SEM, CC BY-NC-ND. Det Danske Sprog- og Litteraturselskab (DSL) og Center for Sprogteknologi, Københavns Universitet (CST) skal krediteres i publikationer og produkter der helt eller delvist er baseret på COR.SEM.EXT.

Kontakt: Henvendelser vedr. COR.SEM.EXT kan stiles til:

Sanni Nimb (sn snabel-a dsl.dk), Thomas Troelsgård (tt snabel-a dsl.dk)

Webservice

Data returneres som html, json eller csv, afhængigt af hvorledes webservicen kaldes.

For at søge på et id kan man lave opslag som følgende:

https://ordregister.dk/id/COR.98891
https://ordregister.dk/id/COR.98891.json
https://ordregister.dk/id/COR.98891.csv

Webservicen er også implementeret så det kan lade sig gøre at søge på valgfrie kolonner i det pågældende register. Vær dog opmærksom på at der maksimalt returneres 100 resultater - har du brug for mere, kan du hente filerne der refereres til ovenfor, og slå op i dem.

En generel søgning ser ud som følgende:
https://ordregister.dk/KOLONNE/REGISTER/RETURDATAFORMAT/SØGETERM

For at søge på lemmaet ”hest” i COR med json som returdataformat skal man således lave et opslag på:
https://ordregister.dk/lemma/COR/json/hest

For at søge på fuldformen ”have” i COR med csv som returdataformat laves der et opslag på:
https://ordregister.dk/fuldform/COR/csv/have

Det er også muligt at bruge html som returdatatype, så får man læselig data direkte i browseren:
https://ordregister.dk/lemma/COR/html/miks

Hvis en søgning ingen resultater returnerer, eller der søges på en ikke eksisterende kolonne, vises der i json en fejlmeddelelse:
https://ordregister.dk/lemma/COR/json/heeest


Kontakt COR-administrationen

Du kan skrive til os på følgende email-adresse: cor.adm snabel-a dsn.dk

Webtilgængelighed

Se webtilgængelighedserklæringen for ordregister.dk her