Analýza textu – Základní přehled

Analýza textu

(text analysis, content analysis, text analytics)

Metoda pro analýzu (většinou nestrukturovaného) textu za účelem získání informací o textu. Výsledkem jsou strukturovaná data.

Základní nástroje se skládají především ze frekvenčních statistik.

Seznamy slov

(wordlists)

word or lemma frequency, part-of-speech frequency

n-gram tool

bigram, trigram, n-gram frequencies

Analýza sentimentu

(sentiment analysis)

Analýza emocionality textů.

Morfologie (slovní tvary, základní tvary slova, slovní druhy)

  • word classes
    • Categorizing and Tagging Words
    • text tagging
  • Part-Of-Speech (POS) Tagger – implies labelling words with their appropriate Part-Of-Speech (Noun, Verb, Adjective, Adverb, Pronoun

Nástroje

  • sketchengine.eu
  • https://nlp.fi.muni.cz/cs/LangToolsLinks
  •  

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *