Wie viele Projekte brauche ich, um Interviews zu bekommen?

Drei bis fünf polierte Projekte reichen aus, wenn jedes ein klares Problem, sauberen Code und ein entscheidungsreifes Ergebnis zeigt. Tiefe ist wichtiger als Masse.

Sollte ich Projekte in einem oder in vielen Repos hosten?

Nutze ein Repo pro Projekt und einen kurzen Portfolio-Index im Root. So bleiben Issues, Tests und READMEs übersichtlich und leicht prüfbar.

Was ist, wenn ich keine realen Unternehmensdaten habe?

Verwende öffentliche Datensätze oder synthetische Daten. Dokumentiere, wie du sie erstellt hast und warum sie ein reales Szenario nachbilden. Transparenz schafft Vertrauen.

Python Portfolio für Data-Rollen: 9 Projekte mit Datensätzen

Aktualisiert am November 08, 2025 Lesedauer: 4 Minuten

Entwickler:in überprüft Python-Notebooks und Executive-KPI-Diagramme auf zwei Bildschirmen – veranschaulicht ein jobtaugliches Python-Portfolio für Data-Rollen.

Ein starkes Python-Portfolio zeigt, dass du Daten finden, bereinigen, analysieren oder modellieren und die Geschäftsrelevanz klar erklären kannst.
Wenn du Interviews für Analyst-, Scientist- oder Engineer-Rollen willst, baue kompakte Projekte, die Entscheidungen erleichtern.

Dieser Leitfaden gibt dir neun Portfolio-Projekte mit realen Datensätzen, klaren Ergebnissen und einer README-Checkliste.

Wonach Hiring-Manager suchen

Teams überfliegen auf Impact, Klarheit und Reproduzierbarkeit.
Ein poliertes Projekt mit Tests, kurzem Demo-Video und einfacher Einrichtung schlägt oft ein überfülltes Repo.

Schreibe wie ein Problemlöser. Starte mit der Frage, zeige das Ergebnis und schließe mit der nächsten Aktion.
Halte Visualisierungen lesbar und die Schlussfolgerungen knapp.

1) Executive-KPI-Dashboard

Verwandle Rohdaten in Entscheidungen. Nutze Retail- oder Analytics-Daten für Umsatz, Bestellungen, Conversion, durchschnittlichen Bestellwert (AOV).
Fasse zusammen, was sich geändert hat und warum, und schlage einen nächsten Schritt vor.

Definiere in der README jede Metrik und liste die beantworteten Fragen auf.
Füge einen Absatz mit sofort umsetzbaren Erkenntnissen hinzu.

2) Kohorten- und Trichteranalyse (Funnel)

Zeige, dass du Retention verstehst. Baue Kohorten nach Anmeldemonat und visualisiere die Rückkehr über die Zeit.
Erstelle eine Trichteranalyse, die Drop-offs sichtbar macht und Gegenmaßnahmen zeigt.

Nutze SQL für Kohortentabellen und ein Notebook für Diagramme.
Beende mit einer Notiz zu Onboarding- oder Marketing-Änderungen.

3) Preis-Test oder A/B-Ergebnisbericht

Führe ein Experiment durch oder simuliere eines und erkläre den Entscheidungsweg.
Prüfe Stichprobengröße, miss Lift und bewerte Signifikanz.

Schließe mit einer kurzen Entscheidungsnotiz.
Sage, ob die Variante ausgerollt werden sollte und welches Risiko zu überwachen ist.

4) Nachfrageprognose

Wähle wöchentliche Verkäufe oder Energiedaten und baue eine Basisprognose.
Vergleiche ein klassisches Modell mit einem baumbasierten Regressor. Zeige Prognoseintervalle und erkläre Entscheidungen.

Lege eine Fehleraufschlüsselung nach Segment und einen Plan für Wochen mit geringer Konfidenz bei.
So wird aus einem Modell ein operatives Werkzeug.

5) Churn-Modell mit Aktionsplan

Trainiere einen einfachen Klassifikator auf Churn-Daten und erkläre deine Features.
Zeige die Leistung pro Segment und Schwächen des Modells.

Schreibe eine Seite zur Nutzung der Scores.
Empfiehl passende Stupser und persönliche Ansprache für hohes Risiko.

6) NLP-Ticket- oder Review-Klassifizierer

Klassifiziere Support-Tickets, Bewertungen oder News-Überschriften.
Starte mit einer sauberen Baseline und tracke Precision/Recall pro Klasse.

Erkläre, wie dies die Reaktionszeit reduziert oder die Ticket-Zuweisung verbessert.
Kleine Gewinne sparen Stunden.

7) Modernes ELT mit dbt

Lade einen öffentlichen Datensatz ins Warehouse und modelliere ihn mit dbt.
Füge Tests hinzu, setze Quellenaktualität und veröffentliche Doku.

Zeige ein Vorher-/Nachher-Schema und wie Modelle Dashboards schützen.
Zuverlässigkeit fällt auf.

8) Orchestrierte Pipelines mit Airflow

Verwandle einen täglichen Job in einen DAG mit Retries und Alarmen.
Füge einen Data-Quality-Schritt hinzu, der früh scheitert. Erkläre Latenz und Fehlerhandling.

Ergänze eine kurze Notiz zu Kosten.
Abwägungen zeigen Ownership.

9) Streaming ins Warehouse mit Kafka

Simuliere Clickstream- oder IoT-Daten und streame sie ins Warehouse.
Tracke Lag und Durchsatz und erkläre, wann Streaming Batch schlägt.

Schließe mit einem Absatz zu Entscheidungen, die frische Daten brauchen.
Halte das System klein und die Story klar.

Datensätze, die immer funktionieren

Öffentliche Retail-Transaktionen, Bike-Sharing-Fahrten, Taxifahrten, Energieverbrauch, Support-Tickets und App-Events sind bewährte Quellen.
Wenn du Daten synthetisch erzeugst, dokumentiere Realitätsbezug und Annahmen.

So paketierst du Projekte, die zu Interviews führen

Erstelle ein Repo pro Projekt mit README im Story-First-Ansatz.
Starte mit Problem, Vorgehen, Ergebnis und Schritten zur Reproduktion.

Nimm eine 60-Sekunden-Demo auf und verlinke sie.
Lege im GitHub-Root einen Portfolio-Index an.

So können Recruiter schnell zum Ziel springen.

Ein 12-Wochen-Plan, der in deinen Alltag passt

Woche 1–2: Fokus auf Python und SQL, dann erstes Analystenprojekt.
Woche 3–4: Prognose oder Churn mit Ergebnisbericht; Woche 5–6: dbt-Modelle.

Woche 7–8: Airflow-Pipeline mit Quality-Checks.
Woche 9–10: Streaming-Dem; Woche 11–12: READMEs, Demos, Scheininterviews.

Für einen geführten Weg mit Mentoring: Data Science & KI Bootcamp.

Was auf CV und LinkedIn zeigen

Beginne Bullet Points mit Auswirkungen.
Beispiel: „Dashboard-Aktualisierung von drei Stunden auf 30 Minuten durch Caching.“

Liste einen fokussierten Stapel: Python, pandas, scikit-learn, SQL, dbt, Airflow, BI-Tool.
Pinne deine zwei besten Projekte an und verlinke Demos.

Häufige Fehler vermeiden

Vermeide Projekt-Wildwuchs. Tiefe schlägt Masse.
Gib immer Business-Kontext und nächste Schritte; keine Black-Box-Modelle.

Zeige, wie Inputs die Ausgänge beeinflussen, und füge eine kleine Fehleranalyse hinzu.
Behandle jedes Projekt wie ein Produkt.

Schneller lernen mit geführten Projekten

Wenn du Rückmeldung und Community willst, bietet unser Bootcamp Mentor-Sessions, Sprechstunden und Portfolio-Reviews.
Entdecke das Data Science & KI Bootcamp und Anwendung planen.

Dein nächster Hiring-Manager wird sich an ein sauberes Portfolio erinnern, das echte Fragen beantwortet.
Starte heute ein Projekt, erzähle eine klare Story – und bleib dran.