-
Notifications
You must be signed in to change notification settings - Fork 0
/
dictionary.Rmd
43 lines (29 loc) · 1.66 KB
/
dictionary.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
---
title: "Sanakirja"
output: html_document
editor_options:
chunk_output_type: console
---
```{r, echo=FALSE, warning=FALSE, message=FALSE}
library(tidyverse)
library(DT)
dictionary <- read_csv("data/NM_Lexikon.csv", col_names = c("id", "lemma", "en", "type", "pos", "de", "note"), skip = 1) %>%
select(lemma, type, pos, en, de, pos)
lexemes <- dictionary %>% filter(type == 'stem')
suffixes <- dictionary %>% filter(type != 'stem') %>%
select(lemma, type, pos, en) %>%
rename(gloss = en)
```
Tässä toistetun sanakirjan aineisto on peräisin projektien Ob-Ugric languages ja Ob-Ugric database [verkkosivuilta](http://www.babel.gwi.uni-muenchen.de/). Tällä sivulla on käytettävissä projektien [lataussivulla](http://www.babel.gwi.uni-muenchen.de/index.php?abfrage=download) olevan tiedoston [FLEx_Lexica_Mansi_08-2017_lift](http://babel.gwi.uni-muenchen.de/media/archive/flex_lexika_mansi_08-2017.zip) pohjoismansin osuuden taulukkomuotoon viety versio.
Sivuston ohjeiden mukainen viittaus on esitetty alla, ja pyydämme toistamaan sen aina myös tätä taulukkoversiota käytettäessä.
> Data from Ob-Ugric database: analysed text corpora and dictionaries for less described Ob-Ugric dialects. [www.oudb.gwi.uni-muenchen.de](www.oudb.gwi.uni-muenchen.de)
Sanasto on jaettu kahteen osaan, vartaloiden ja erilaisten päätteiden mukaan.
## Sanakirja -- vartalot
```{r, echo=FALSE, warning=FALSE, message=FALSE}
datatable(lexemes %>%
filter(en != '_'), filter = "top", options = list(dom = 't'))
```
## Sanakirja -- päätteet
```{r, echo=FALSE, warning=FALSE, message=FALSE}
datatable(distinct(suffixes), filter = "top", options = list(dom = 't'))
```