Inhaltsverzeichnis

BEMERKUNGEN ZUR VERBESSERUNG

Die Darstellung gefällt mir gut, in diesem Fall finde ich es überzeugend, die Erzählung vom Projektverlauf nicht von der Darstellung zu trennen. Die Darstellung der Dateiformat- Entwicklung, der Wegfinde-Algorithmen und der Optimierung sind durchweg erfreulich

Zweierlei würde ich mir noch wünschen:

Radwege

Gruppe

Motivation

Volksentscheid Fahrrad: Die Medien berichten täglich über ihn. die ganze Stadt spricht darüber und er sorgt regelmäßig für lebhafte Debatten im Senat. Fakt ist: Das Radwegenetz ist in einem miserablen Zustand, wie wir es jeden Tag erneut spüren dürfen. Ein Ausbau ist dringend erforderlich. Für eine moderne, mobile Stadt ohne Verkehrsprobleme und mit gesunden Bürgern. Dies wäre eine zukunftsorientierte Investition in die Infrastruktur, die u. a. schon in Kopenhagen auf Wunsch der Bürger höchst erfolgreich vollzogen wurde und dort nun den Haushalt und die Menschen entlastet. Doch wie soll der Ausbau vonstatten gehen? Berliner Infrastrukturprojekte sind schließlich derzeit gemeinhin nicht für angemessene Planung bekannt. Deshalb haben wir uns zum Ziel gesetzt, das Problem zu simulieren und eine möglichst optimale Lösung zu finden.

Projektidee

Ziel des Projekts ist es, eine möglichst optimale Verkehrswegeplanung zu erstellen. Dies kann für Radwege geschehen, aber auch auf Straßen, Wasserrohre Datenleitungen o. Ä. verallgemeinert werden. Hierfür müssen vielerlei Kriterien beachtet werden. Außerdem sind mehrere Varianten der Optimierung denkbar: auf Kosten, Verfügbarkeit, Kapazität, „Geschwindigkeit“, ebenso sind auch Mischkriterien denkbar.

Möglichkeiten der Realisierung

Wichtige Themenfelder für das Projekt sind: verschiedene Formen der Optimierung, Graphentheorie, objektorientierte Programmierung sowie die Einbindung von Kartendaten.

Erlangen und Bearbeiten der Verkehrsnetzdaten

Der Grunddatensatz für das Berliner Verkehrsnetz ließ sich recht einfach von openstreetmap.org herunterladen. Leider belief sich der ausgewählte Bereich auf eine Dateiengröße von ~1.6 GB, was eine Weile braucht, um es in Python zu laden. Deshalb wurde der Datensatz in zwei Schritten verkleinert. Erst wurden durch das Kommandozeilen-tool Osmosis (ebenfalls von openstreetmap) alle Straßen und Standpunkte, die nicht mit dem Fahrrad befahrbar sind, (Autobahn, Flughafen, etc.) gelöscht. Beim zweiten Schritt wurden nicht brauchbare Meta-Informationen und unnötige Tags mit eigenen python-Skripten entfernt. Im Laufe dessen ergab es sich, ein eigenes Dateiformat zu erstellen um die Daten einfacher und schneller lesen/schreiben zu können, da Python-eigene Funktionen, wie pickle zum Speichern unbrauchbar waren. Die Datei im eigenen Dateiformat hatte am Ende dann nur noch eine Größe von ~67 MB.
Dateiformat-Entwicklung

Python Dateistruktur

Um mit den Daten einfach arbeiten zu können, wurden diese als Graph gespeichert. Dafür wurden 3 Objektklassen erstellt: die Node-Klasse (Knoten), die Edge-Klasse (Kante), und die Graph-Klasse. Ein Graph besteht aus Knoten und Kanten, wobei Kanten die Verbindungen zwischen Knoten darstellen. Im Fall des Verkehrsnetzes wäre das dann z.B. eine Straße als Verbindung zwischen zwei Kreuzungen. Mit diesen drei Klassen konnten dann die Daten eingelesen und damit gearbeitet werden.
Dateistruktur-Dokumentation

Wegfinde-Algorithmen

Der Dijkstra-Algorithmus ist möglicherweise der grundlegendste Algorithmus in der Graphentheorie. Er berechnet von einem Knoten aus über die Kanten die jeweils kürzeste Weglänge zu allen anderen (erreichbaren) Knoten aus. Dies macht er, indem die Nachbarn vom aktuellen Knoten anhand der Kantenentfernung in eine Liste einordnet (kürzeste=Vorne, längste=Hinten). Nachdem er alle Nachbarn in die Liste eingefügt hat, wird der erste Knoten der Liste als aktuelles Element herausgenommen und das ganze geschieht von vorne. Wenn ein Zielknoten gegeben ist, läuft der Algorithmus bis er den Zielknoten als Nachbarn findet, wenn nicht läuft er bis allen (erreichbaren) Knoten ihre Entfernung zugewiesen wurde. (Code-Schnipsel vom Dijkstra-Algorithmus einfügen?)
Die erwähnte Liste der Knoten war schwierig zu realisieren. Zwischenzeitlich haben wir auch eine eigene Schlange-Klasse entwickelt. Diese war jedoch im Vergleich zu der Python-eigenen PriorityQueue deutlich langsamer und so implementierten wir schlussendlich doch die vorgefertigte Variante als Liste für Dijkstra.

Der A*-Algorithmus

Wie man sich vorstellen kann, muss der Algorithmus gegebenfalls sehr viele Knoten durchlaufen bis er das Ziel erreicht, was zu einer recht hohen Laufzeit führen kann. Deswegen wurde der A*-Algorithmus in betracht bezogen, der eine Erweiterung des Dijkstra-Algorithmus ist. Beim A* wird beim einordnen in die Liste noch die abgeschätzte Distanz von aktuellem Knoten zu Ziel mit einberechnet. In diesem Fall ist die abgeschätzte Distanz die Länge der Fluglinie zwischen Knoten und Ziel. Das heißt im Grunde, dass sich der A*-Algorithmus schneller in die Richtung des Ziels geht und somit eine schnellere Laufzeit hat.

Hier ist der gleiche Pfad in einem Gittergraph einmal mit Dijkstra (links) und einmal mit A*(rechts). Die grauen Pixel sind die besuchten Knoten und die roten Pixel ergeben den gefundenen Pfad.
Dijkstra-ErgebnisA*-Ergebnis
Wie man sehen kann, besucht A* sehr viel weniger Knoten als Dijkstra und hat somit eine sehr viel kleinere Laufzeit. Bei Graphen in denen die Knoten nicht so ein homogenes Gitter sind (wie zum Beispiel ein Verkehrsnetz) kann diese geringe Anzahl der besuchten Knoten dazu führen, das nicht der kürzeste Weg gefunden wird. Deswegen wurde eine weight-Variable eingefügt, die bestimmt wie groß der Einfluss der abgeschätzen Distanz auf die Einordung in die Liste ist (0.0-1.0).
A* mit weight=0.5:

Bei den Tests wurden zufällige Knotenpaare ausgewählt und dann die gefundene Distanz von Dijkstra mit der gefundenen Distanz von A* (mit verschiedenen Gewichtungen) vergleicht. Bei den folgenden Graphen ist die x-Achse der Wert der weight-Variable. Der rote Strich ist die gefundene Weglänge relativ zu Dijkstra (1.0 → Dijkstra=A*) und der blaue Strich ist die Anzahl der besuchten Nodes (auch relativ zu Dijkstra) was proportional der Laufzeit entspricht.

Mit einigen weiteren Test (die sich auf das kritische Gebiet konzentrierten aber keine hübschen Graphen lieferten) ließ sich schließen, dass alle Weglängenunterschiede unter einem Gewicht von 0.1 vernachlässigbar sind (<1m) und dieser Wert gut für diese Situation gewählt ist.

Bewertung und Optimierung des Netzes

Zur Bewertung eines Graphen wurde folgendes System herangezogen:

Mithilfe dieses Bewertungssystems konnte nun eine mehrstufige Optimierung des Graphen vorgenommen werden. Diese sollte in Abhängigkeit eines vorgebenen maximalen Kostenbetrags einen möglichst guten Ausbau des Radwegenetzes bestimmen. Hierbei wurde wie folgt vorgegangen:

Dieser Ausbau kann vollzogen werden solange noch genügend Geld hierfür vorhanden ist. Danach kann die Güte des Netzes erneut bewertet werden und so können benötigten Kosten eine zu erwartetende Zeitersparnis zugeordnet werden. Nach dem Ausbau kann das ausgebaute Netz mittels Maperitive veranschaulicht werden

Bestimmung der Kosten

Da die Kosten für einen Ausbau eines Fahrradweges je nach Quelle variieren, nahmen wir zunächst fiktive Daten für die Bestimmung der Einheitskosten für die verschiedenen Stufen des Ausbaus. Die Kosten für den Ausbau einer Teilstrecke ergaben sich dann als Produkt von Länge und Einheitskosten sowie eventuell einem „Anfangssummanden“, falls die Teilstrecke am Anfang oder Ende einer ausgebauten Strecke liegt. Dies verhindert das Zersplittern der ausgebauten Teile und sorgt für eher zusammenhängende ausgebaute Strecken, welche die Kosten reduzieren.

Zusammenfassung, Ausblick

Mit Fertigstellung des Projekts lässt sich nun ungefähr abschätzen, welche Verbesserung durch welchen benötigten Kapitalbetrag erreicht werden kann. Die tatsächlich entstehenden Kosten hängen jedoch auch stark von den jeweiligen lokalen Gegebenheiten ab und somit sind die verwendeten Werte nur als Schätzwerte zu betrachten und das Ergebnis kann mit anderen vermuteten Kosten auch erheblich unterschiedlich ausfallen. Ebenso varriiert zum Teil auch der Grad des bisherigen Ausbaus von den Schätzungen.
Eine Verschnellerung des Optimierungsverfahrens könnte eine Planung für größere Netze ermöglichen, eventuelle spezielle geographische Gegebenheiten berücksichtigen und ein besseres Ergebnis erzielen. Denkbar wäre es auch, beispielsweise durch die Einbindung des öffentlichen Nahverkehrs ein realitätsnäheres Geschwindigkeitsoptimierungsproblem darzustellen. Auch durch Einbindung von Wartezeiten an Kreuzungen, sowie der (in Berlin eher vernachlässigbaren) Beeinflussung der Geschwindigkeit durch Steigungen oder Kurven kann eine wahrheitsgemäßere Einschätzung der Fahrtzeiten ermöglicht werden. Nicht berücksichtigt wurde die Entwicklung des Netzes bei eventuellen Ausfällen einzelner oder mehrerer Teilabschnitte, wie sie beispielsweise durch Baustellen oder Großveranstaltungen entstehen könnten. Ebenso wurden eventuelle Kapazitätsproblematiken vernachlässigt. Eine Betrachtung dieser ist jedoch insbesondere dann empfehlenswert, wenn das Programm für andere Optimierungszwecke verwendet werden sollte.

Aus theoretischer Sicht bleibt jedoch auch noch die Betrachtung des funktionalen Zusammenhangs zwischen Kosten und Nutzen interessant. Eine Untersuchung dessen könnte zukünftig Aufschluss darüber geben, welcher Investitionsbetrag das ideale Verhältnis herstellt.

Ebenso bleibt zu betrachten, wieweit die gewählten Parameter und Verfahren (Kostenverhältnisse, Knoten zur Ermittlung der Qualität des Netzes, Bewertungs- und Optimierungsverfahren sowie einige absoluten Zahlen im Optimierungsprozess) das Ergebnis beeinflussen und unter welchen Bedingungen das aussagekräftigste Ergebnis zu erwarten ist.

Protokoll

* Protokoll 1 (26.05.2016)
* Protokoll 2 (02.06.2016)
* Protokoll 3 (09.06.2016)
* Protokoll 4 (16.06.2016)
* Protokoll 5 (23.06.2016)
* Protokoll 6 (30.06.2016)
* Protokoll 7 (07.07.2016)
* Protokoll 8 (14.07.2016)
* Protokoll 9 (21.07.2016)
* Protokoll 10 (31.08.2016)
* Protokoll 11 (01.09.2016)
* Protokoll 12 (02.09.2016)