====== Projektprotokolle Politische Sprache ====== zum Projekt [[ws2425:politischesprache|Politische Sprache]] ==== 28.11.2024 ==== === gemacht === * Kennenlernen von möglichen Wegen zur Sprachanalyse (NLTK + text2vec/word2vec) * Aufstellen der Projektbeschreibung, Zielidentifikation * Projektplan/-schritte für die Recherchephase aufgestellt * Recherche: Textvektorisierung https://okan.cloud/posts/2021-04-08-text-vectorization-using-python-term-document-matrix/ === gelernt === * natürliche Sprache lässt sich in numerische Formate umwandeln = Textvektorisierung (wichtig: das sollte effektiv und effizient erfolgen) * semantische Struktur des Textes als ein Ansatz === offene/neue Fragen=== * Sind Kosinus-Ähnlichkeitsindizes (mittels Term-Document-Matrix: Häufigkeit von Antworten) für die Idee der thematischen Nähe nützlich? Jedoch werden dabei keine Synonyme berücksichtigt.