Mathesis Wiki

Dies ist eine alte Version des Dokuments!

Inhaltsverzeichnis

Logbuch

Logbuch

Eintrag 26/05/16

Vorläufige Definition der Meilensteine:

Eingangssignal aufnehmen und Datensatz erstellen
Verarbeitung des Datensatzes mit Hilfe von Fourier-Analysis
Abgleich der verarbeiteten Daten mit einer Datenbank (ggf. eigene Erstellung oder Verwendung von Beispieldaten )
Ausgabe

Erweiterung der Erweiterungen:

Nachträgliche Evaluation des Nutzers, ob Musik-Erkennung erfolgreich war (+ crappy yay animation?)
Reflektion des Programms für eigene Fehlerkorrektur
machine learning - Genauigkeit und Trefferquote verbessern, Störgeräusche filtern
… tbc

Eintrag 02/06/2016

Nachvollziehen Audiobeispiel pdf-Datei
Fourier-Fingerabdruck verstehen, evtl. erstellen
Aufgabenverteilung bis nächste Woche: B: Aufnahme von Sound & Speichern in Array N: FFT evtl. Fingerprint

Eintrag 09/06/2016

Programm für Fourieranalyse und anschließendem Spektrogramm funktioniert
Programm zum Einlesen von Audio in Echtzeit über das Mikrofon des Laptops funktioniert, die Dateien werden in ein Array geschrieben und können so für die Fourieranalyse genutzt werden

Einlesen von Audio-Dateien

# -*- coding: utf8 -*-
import pyaudio
import numpy as np
import matplotlib.pyplot as plt
 
 
CHUNKSIZE = 1024  #festgelegte Chunksize
 
#den Audioeingang initialisieren
p = pyaudio.PyAudio()
stream = p.open(format=pyaudio.paInt16, channels=1, rate=44100, input=True, frames_per_buffer=CHUNKSIZE)
 
#Daten schreiben
frames = [] #Liste von Chunks(Blöcken)
for i in range(0, int(44100 / CHUNKSIZE*5)):
	data = stream.read(CHUNKSIZE)
	frames.append(np.fromstring(data, dtype=np.int16))#evtl nur normal int? Datengröße müssen wir wohl später abschätzen was sinnvoll ist
 
#Liste der numpy-arrays in 1D-array konvertieren
numpydata = np.hstack(frames)
 
print numpydata
 
#Daten plotten
plt.plot(numpydata)
plt.show()
 
 
#stream schließen
stream.stop_stream()
stream.close()
p.terminate

Eintrag 16/06/2016

Zusammenführen der beiden Programme und Beginn der Optimierung: statt dem Frequenzbereich von ca 22.000 Hz wollen wir auf 4000 Hz reduzieren
das Programm ist auf das wesentlichste reduziert und zeigt nach der Aufnahmezeit sehr schnell das Spektogramm

Mathesis Wiki

Seitenleiste

Navigation

Inhaltsverzeichnis

Logbuch

Eintrag 26/05/16

Eintrag 02/06/2016

Eintrag 09/06/2016

Einlesen von Audio-Dateien

Eintrag 16/06/2016

Eintrag 23/06/2016

Mathesis Wiki

Benutzer-Werkzeuge

Webseiten-Werkzeuge

Seitenleiste

Navigation

Inhaltsverzeichnis

Logbuch

Eintrag 26/05/16

Eintrag 02/06/2016

Eintrag 09/06/2016

Einlesen von Audio-Dateien

Eintrag 16/06/2016

Eintrag 23/06/2016

Seiten-Werkzeuge