Mittlerweile ist jeden bewusst: Daten sind das Gold des digitalen Zeitalters. Jedes Unternehmen, welches schlau Daten sammelt, kann aus diesem wertvollen Wissen ziehen!
Meistere die Grundlagen von Data Science in Python mit den beliebten NumPy & Pandas-Bibliotheken.
Fortgeschritten
05:47 Stunden
Python
Dr. -Ing. Soner Emec
Bei der täglichen Nutzung von Instagram, Twitter, TikTok, YouTube oder Google Maps werden gigantische Datenmengen produziert. Die Datenmenge nimmt von Jahr zu Jahr exponentiell zu. Anhand dieser Daten treffen Unternehmen jeden Tag Entscheidungen, beispielsweise welche personalisierte Werbung jemand erhält oder für wie teuer täglich die Produkte auf E-Commerce Plattformen, wie Amazon und Ebay verkauft werden.
Lerne zusammen mit Dr.-Ing. Soner Emec in 33 Einheiten und 22 interaktiven Programmierübungen die Data Science Grundlagen kennen!
Tauch mit uns ein in die spannende Welt von NumPy. Gemeinsam installieren und importieren wir diese mächtige Python-Bibliothek und entdecken, warum NumPy-Arrays das Zeug haben, deine Datenbearbeitung auf das nächste Level zu heben.
Komm, wir tauchen tiefer in die Welt der Vektoren ein. Zusammen erstellen wir Arrays, spielen mit zeros, ones und leeren Arrays und entdecken die Funktionen von arange und linspace. Und um den Bogen zu schließen, sehen wir uns an, wie Schleifen und Vektoren Hand in Hand gehen, um unsere Datenbearbeitung zu optimieren.
Jetzt wird's noch spannender, wir steigen auf Matrizen um! Lass uns gemeinsam Matrizen mit vorhandenen Daten erstellen, uns mit den Funktionen zeros und ones vertraut machen und dann ins Auge des Sturms blicken mit eye und diag. Und weil wir schon dabei sind, nehmen wir uns auch das Transponieren und die Spur einer Matrix vor. Zum Abschluss schauen wir uns an, wie Schleifen unsere Arbeit mit Matrizen noch weiter erleichtern können.
Jetzt wo wir die Grundlagen drauf haben, wenden wir unser Wissen auf echte Daten an! Zusammen importieren wir CSV-Daten, lernen, wie wir mit Pandas umgehen, um die Daten noch effizienter zu bearbeiten und am Ende zeigen wir dir, wie du deine bearbeiteten Daten als CSV wieder exportieren kannst.
Nun wird's Zeit, die wahre Gestalt unserer Arrays zu erforschen! Mit den Methoden shape und size zeigen wir dir, wie du die Dimensionen deines Arrays im Blick behältst und effizient damit arbeiten kannst.
In diesem Kapitel zeigen wir dir, wie flexibel Arrays wirklich sind. Zusammen lernen wir, wie wir die Form unserer Arrays verändern können, um sie genau an unsere Bedürfnisse anzupassen.
Hier geht's ans Eingemachte. Wir lernen, wie wir in Vektoren und Matrizen genau die Daten finden und auswählen, die wir brauchen. Von der Indexierung bis zum Slicing - nach diesem Kapitel bist du ein Meister im Umgang mit Datenstrukturen.
Lass uns die Ärmel hochkrempeln und unsere Arrays in Schwung bringen. Wir zeigen dir, wie man Arrays addiert und subtrahiert, und dann heben wir das Ganze auf eine neue Ebene mit Broadcasting. Nach diesem Kapitel wirst du in der Lage sein, Operationen auf deinen Daten durchzuführen wie ein Profi.
Pack deine Sachen, wir gehen auf Safari in den Dschungel von Pandas! Gemeinsam entdecken wir, was Pandas ist und warum es unser neuer bester Freund bei der Datenanalyse wird. Nach der Installation und dem Import zeigen wir dir die Grundlagen von Pandas Datenstrukturen - Series und DataFrame.
Jetzt, wo wir Pandas kennen, lassen wir es auf die freie Wildbahn los und laden Daten aus CSV-Dateien. In diesem Kapitel lernst du, wie du echte Daten in deine Pandas-Umgebung bringst und sie bereit machst für die Analyse.
Daten sind toll, saubere Daten sind besser. In diesem Kapitel lernst du, wie du einen ersten Blick auf deine Daten wirfst, die Struktur deines DataFrames kennst, mehr über dein DataFrame erfährst und unerwünschte Überraschungen wie fehlende Werte oder Duplikate beseitigst. Nach diesem Kapitel sind deine Daten bereit für die große Show!
Du hast die Daten geladen und gereinigt, aber was nun? In diesem Kapitel zeigen wir dir, wie du deine Daten in eine CSV-Datei exportierst, damit du sie teilen oder später weiter bearbeiten kannst.
Jetzt, wo deine Daten bereit sind, wird es Zeit, ein wenig Magie zu wirken. Zusammen suchen wir nach spezifischen Datensätzen, filtern sie nach Bedingungen, fügen neue Daten hinzu und entfernen nicht benötigte. Und weil Ordnung das halbe Leben ist, sortieren wir auch noch unser DataFrame.
Wir haben die Grundlagen gemeistert, jetzt steigen wir auf das nächste Level. Gemeinsam fügen wir DataFrames mit merge() und join() zusammen, lernen, wie man Daten gruppiert und aggregiert, und führen arithmetische Operationen auf unseren DataFrames durch.
Jetzt, wo du ein Pandas-Profi bist, lass uns dein Wissen auf die Probe stellen. Wir zeigen dir Best-Practices, effizienten Zugriff, wie man Duplikate vermeidet und den Typ konvertiert, und wie man richtig mit großen Datenmengen arbeitet. Nach diesem Kapitel bist du bereit, die Datenwelt zu erobern!
Bei codegree hast du den Vorteil, dass du bei jedem Kurs Schritt-für-Schritt ein größeres Praxisprojekt aufbaust! Also, lass uns mal reinschauen, was du in diesem Kurs zum Thema Data Science mit Python, Pandas & NumPy bauen wirst!
In diesem großen Lernpfad wirst du mit Kryptopreisen arbeiten. Du erhältst Preisdaten der größten Kryptowährungen der Welt und musst diese analysiere. Es geht um bares Geld, also pass auf das du keine Fehler machst!
Du verstehst die Aufgabe & Rolle als Data-Scientist und kennst die gängigsten Begriffe.
Du weißt wie du mit NumPy und den NumPy-Arrays effizient arbeiten kannst.
Du kannst mit Series & DataFrames problemlos arbeiten und Daten effizient visualisieren und analysieren.
Mitgründer von codegree & Leiter KISZ am HPI (Hasso-Plattner-Institut)
Der Schwierigkeitsgrad eines Data Science-Studiums kann variieren, je nachdem, wie vertraut du mit Mathematik und Programmieren bist. Es erfordert eine solide Grundlage in Statistik und Maschinellem Lernen sowie die Fähigkeit, komplexe Datenstrukturen zu verarbeiten und zu analysieren.
Ein Data Analyst konzentriert sich in der Regel auf das Extrahieren von Erkenntnissen aus Datenbeständen, während ein Data Scientist zusätzlich fortgeschrittene statistische und maschinelle Lernmodelle entwickelt, um zukünftige Ereignisse vorherzusagen oder tiefergehende Erkenntnisse zu gewinnen.
Das Gehalt eines Data Scientists kann stark variieren, abhängig von Faktoren wie Erfahrung, Standort, und der Größe des Unternehmens. In Deutschland liegt das durchschnittliche Jahresgehalt eines Data Scientists laut Gehaltsstudien zwischen 60.000 und 100.000 Euro.
Data Scientists finden Arbeit in einer Vielzahl von Branchen, darunter Technologieunternehmen, Beratungsfirmen, Finanzinstitutionen, Gesundheitswesen, E-Commerce und viele mehr. Praktisch jede Branche, die Daten sammelt, kann von den Fähigkeiten eines Data Scientists profitieren.
Python ist für Data Science beliebt, weil es eine einfache Syntax hat, die das Schreiben und Lesen von Code erleichtert. Darüber hinaus bietet es eine Fülle von Bibliotheken wie Pandas, NumPy und SciKit-Learn, die speziell für Datenanalyse und maschinelles Lernen entwickelt wurden.
Nahezu jede Branche kann von Big Data profitieren. Es kann Unternehmen dabei helfen, bessere Entscheidungen zu treffen, Prozesse zu optimieren, Trends vorherzusagen, das Kundenerlebnis zu verbessern und vieles mehr.
Python und R sind die beiden am häufigsten verwendeten Programmiersprachen in der Data Science. Python ist aufgrund seiner Einfachheit und der breiten Palette an Data Science-Bibliotheken besonders populär.
Ein Data Scientist studiert in der Regel Fachgebiete wie Statistik, Informatik, maschinelles Lernen und Datenanalyse. Darüber hinaus sind Fähigkeiten in Programmiersprachen wie Python oder R oft wesentliche Bestandteile des Studiums.
Die genaue Anzahl von Data Scientists in Deutschland ist schwer zu bestimmen, da es auf die spezifische Definition und das jeweilige Berufsfeld ankommt. Es ist jedoch sicher, dass der Bedarf an Data Scientists in den letzten Jahren stark gestiegen ist.
Data Science ist ein interdisziplinäres Feld, das Aspekte der Informatik, Statistik und Geschäftsanalyse vereint. Während Informatik-Kenntnisse wichtig sind, spielen auch andere Fähigkeiten und Kenntnisse eine wesentliche Rolle im Bereich Data Science.
Data-Scientist im Jobprofil:
11.450 (05/2023)
60.000€ - 80.000€
Nein
Sehr gut
🧪 Starte deine Karriere als Data-Scientist!
Lerne spielerisch Data Science und komme deiner gutbezahlten (und an der 🌴 liegenden) Traumkarriere einen Schritt weiter.
100% kostenlos registrieren · keine Kreditkarte notwendig
Im Gegensatz zu der Abendschule oder der alteingesessenen Uni lernst du bei codegree die Sprachen & Pakete, die wirklich im Jobmarkt gesucht werden.
100% kostenlos registrieren · keine Zahlungsdaten notwendig