Danish semantic analysis.
Get nouns from Dannet and Wiktionary:
from dasem.wiktionary import get_nouns
from dasem.dannet import Dannet
wiktionary_nouns = get_nouns()
dannet = Dannet()
query = "select w.form from words w where w.pos = 'Noun'"
dannet_nouns = set(dannet.db.query(query).form)
nouns = dannet_nouns.union(wiktionary_nouns)
Get similar words based on a word2vec model on the Danish part of the Project Gutenberg corpus:
$ python -m dasem.gutenberg most-similar mand
kvinde
dame
pige
kone
fyr
dreng
præst
profet
hund
person
Get first two sentences from Dannet synsets examples:
$ python -m dasem.dannet get-all-sentences | head -n 2
I september måned var jeg sammen med en dansk gruppe af unge bøsser og lesbiske i Moskva
Til en gruppe på 10 børn i alderen 0-3 år søges pr. 1.3.83 en pædagog 40 timer ugentligt
- Finn Årup Nielsen, Lars Kai Hansen. Open semantic analysis: The case of word level semantics in Danish. 8th Language and Technology Conference (LTC2017), november 2017. <http://www2.compute.dtu.dk/pubdb/views/edoc_download.php/7029/pdf/imm7029.pdf>