Analýza textu
(text analysis, content analysis, text analytics)
Metoda pro analýzu (většinou nestrukturovaného) textu za účelem získání informací o textu. Výsledkem jsou strukturovaná data.
Základní nástroje se skládají především ze frekvenčních statistik.
Seznamy slov
(wordlists)
word or lemma frequency, part-of-speech frequency
n-gram tool
bigram, trigram, n-gram frequencies
Analýza sentimentu
(sentiment analysis)
Analýza emocionality textů.
Morfologie (slovní tvary, základní tvary slova, slovní druhy)
- word classes
- Categorizing and Tagging Words
- text tagging
- Part-Of-Speech (POS) Tagger – implies labelling words with their appropriate Part-Of-Speech (Noun, Verb, Adjective, Adverb, Pronoun
Nástroje
- sketchengine.eu
- https://nlp.fi.muni.cz/cs/LangToolsLinks