POS
- part-of-speech
POS tag
- POS tag, part-of-speech tag, morphological tag
- označení přiřazené každému tokenu (slovu, číslici, interpunkci) textu, které udává typ tokenu – slovní druh a případně další gramatické označení jako čas, číslo (jednotné, množné) apod.
POS tagger
- nástroj pro anotaci textu
POS tagset
- sada POS tagů
- český tagset – morphological analyzer Majka
POS tagset
- sada všech POS tagů použitých v korpusu
- různé pro různé jazyky
- různé podrobnosti
- základní tagset může obsahovat pouze slovní druhy (N – noun, V – verb, A – adjective apod.)
-
more common to go into more detail and distinguish between nouns in singular and plural, verbal conjugations, tenses, aspect, voice and much more. Individual researchers might even develop their own very specialized tagsets to accommodate their research needs.
https://www.sketchengine.eu/blog/pos-tags/
morphological analyzer Majka
https://nlp.fi.muni.cz/polish-morphology-analyser/
- celý tag je složen z párů:
- atribut
- jedno malé písmeno
(např.n
pro číslo)
- jedno malé písmeno
- hodnota
- jedno velké písmeno
(capř.P
pro množné číslo)
- jedno velké písmeno
- atribut