POS: Part of speech

POS

  • part-of-speech

POS tag

  • POS tag, part-of-speech tag, morphological tag
  • označení přiřazené každému tokenu (slovu, číslici, interpunkci) textu, které udává typ tokenu – slovní druh a případně další gramatické označení jako čas, číslo (jednotné, množné) apod.

POS tagger

  • nástroj pro anotaci textu

POS tagset

 

POS tagset

  • sada všech POS tagů použitých v korpusu
  • různé pro různé jazyky
  • různé podrobnosti
    • základní tagset může obsahovat pouze slovní druhy (N – noun, V – verb, A – adjective apod.)
    • more common to go into more detail and distinguish between nouns in singular and plural, verbal conjugations, tenses, aspect, voice and much more. Individual researchers might even develop their own very specialized tagsets to accommodate their research needs. 
      https://www.sketchengine.eu/blog/pos-tags/

morphological analyzer Majka

https://nlp.fi.muni.cz/polish-morphology-analyser/

  • celý tag je složen z párů:
    • atribut
      • jedno malé písmeno
        (např. n pro číslo)
    • hodnota
      • jedno velké písmeno
        (capř. P pro množné číslo)

 

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *