Hier werden die Unterschiede zwischen zwei Versionen gezeigt.
Beide Seiten der vorigen Revision Vorhergehende Überarbeitung Nächste Überarbeitung | Vorhergehende Überarbeitung | ||
ws2425:politischesprache_protokoll [2024/11/28 15:47] gadetmers |
ws2425:politischesprache_protokoll [2024/11/28 17:20] (aktuell) gadetmers |
||
---|---|---|---|
Zeile 4: | Zeile 4: | ||
==== 28.11.2024 ==== | ==== 28.11.2024 ==== | ||
+ | |||
+ | === gemacht === | ||
* Kennenlernen von möglichen Wegen zur Sprachanalyse (NLTK + text2vec/word2vec) | * Kennenlernen von möglichen Wegen zur Sprachanalyse (NLTK + text2vec/word2vec) | ||
* Aufstellen der Projektbeschreibung, Zielidentifikation | * Aufstellen der Projektbeschreibung, Zielidentifikation | ||
* Projektplan/-schritte für die Recherchephase aufgestellt | * Projektplan/-schritte für die Recherchephase aufgestellt | ||
+ | * Recherche: Textvektorisierung https://okan.cloud/posts/2021-04-08-text-vectorization-using-python-term-document-matrix/ | ||
+ | |||
+ | === gelernt === | ||
+ | * natürliche Sprache lässt sich in numerische Formate umwandeln = Textvektorisierung (wichtig: das sollte effektiv und effizient erfolgen) | ||
+ | * semantische Struktur des Textes als ein Ansatz | ||
+ | |||
+ | === offene/neue Fragen=== | ||
+ | * Sind Kosinus-Ähnlichkeitsindizes (mittels Term-Document-Matrix: Häufigkeit von Antworten) für die Idee der thematischen Nähe nützlich? Jedoch werden dabei keine Synonyme berücksichtigt. | ||