Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen gezeigt.

--- ws2425:politischesprache_protokoll [2024/11/28 15:47]
gadetmers
+++ ws2425:politischesprache_protokoll [2024/11/28 17:20] (aktuell)
gadetmers
@@ Zeile 4: / Zeile 4: @@
 ==== 28.11.2024 ====
+=== gemacht ===
   * Kennenlernen von möglichen Wegen zur Sprachanalyse (NLTK + text2vec/word2vec)
   * Aufstellen der Projektbeschreibung, Zielidentifikation
   * Projektplan/-schritte für die Recherchephase aufgestellt
+  * Recherche: Textvektorisierung https://okan.cloud/posts/2021-04-08-text-vectorization-using-python-term-document-matrix/
+=== gelernt ===
+  * natürliche Sprache lässt sich in numerische Formate umwandeln = Textvektorisierung (wichtig: das sollte effektiv und effizient erfolgen)
+  * semantische Struktur des Textes als ein Ansatz
+=== offene/neue Fragen===
+  * Sind Kosinus-Ähnlichkeitsindizes (mittels Term-Document-Matrix: Häufigkeit von Antworten) für die Idee der thematischen Nähe nützlich? Jedoch werden dabei keine Synonyme berücksichtigt.

Mathesis Wiki