Hier werden die Unterschiede zwischen zwei Versionen gezeigt.
Beide Seiten der vorigen Revision Vorhergehende Überarbeitung Nächste Überarbeitung | Vorhergehende Überarbeitung | ||
ws2425:politischesprache_protokoll [2024/11/28 17:02] gadetmers |
ws2425:politischesprache_protokoll [2024/11/28 17:20] (aktuell) gadetmers |
||
---|---|---|---|
Zeile 10: | Zeile 10: | ||
* Aufstellen der Projektbeschreibung, Zielidentifikation | * Aufstellen der Projektbeschreibung, Zielidentifikation | ||
* Projektplan/-schritte für die Recherchephase aufgestellt | * Projektplan/-schritte für die Recherchephase aufgestellt | ||
+ | * Recherche: Textvektorisierung https://okan.cloud/posts/2021-04-08-text-vectorization-using-python-term-document-matrix/ | ||
- | === gelernt=== | + | === gelernt === |
* natürliche Sprache lässt sich in numerische Formate umwandeln = Textvektorisierung (wichtig: das sollte effektiv und effizient erfolgen) | * natürliche Sprache lässt sich in numerische Formate umwandeln = Textvektorisierung (wichtig: das sollte effektiv und effizient erfolgen) | ||
+ | * semantische Struktur des Textes als ein Ansatz | ||
=== offene/neue Fragen=== | === offene/neue Fragen=== | ||
+ | |||
+ | * Sind Kosinus-Ähnlichkeitsindizes (mittels Term-Document-Matrix: Häufigkeit von Antworten) für die Idee der thematischen Nähe nützlich? Jedoch werden dabei keine Synonyme berücksichtigt. | ||