Du bist auf einen Begriff gestoßen, der Dir nichts sagt oder wo Du nicht sicher bist, was er bedeutet. Dann bist Du hier im Data Science Lexikon richtig, denn hier findest Du Erklärungen zu den wichtigsten Fachbegriffen aus dem Bereich Maschinelles Lernen, Künstliche Intelligenz und Data Science.

Fehlt hier etwa noch ein wichtiger Begriff? Schreib mir und ich ergänze die Definition.

AJAX progress indicator
(Löschen)
  • a

  • Anaconda
    Anaconda ist eine kostenlose Python Distribution, die insbesondere im Data Science Bereich weit verbreitet ist. Neben Python und vielen Packages ist das Package Management System conda, die Möglichkeit virtuelle environments zu erzeugen sowie die IDE Spyder mit dabei. Anaconda ist für Windows,(...) - mehr
  • c

  • CI/CD
    CI steht für continuous integration und CD für continuous deployment bzw. delivery, beides Schlüsseltätigkeiten im Bereich DevOps. Mit CI/CD ist die Automatisierung von Build-Prozessen (z.B. Kompilierung), Tests und Produktivsetzen gemeint, um die Lücke zwischen Entwicklung und einsatzfähigem(...) - mehr
  • d

  • Data Lake
    Ein Data Lake (Datensee) ist eine unstrukturierte Ansammlung von Daten, welche meist in Rohdatenformaten gespeichert werden. Data Lakes sind häufig die Speicherlösung für Big Data. - mehr
  • Deep Learning
    Deep Learning bedeutet, dass ein neuronales Netz mit relativ vielen Zwischenschichten als Machine Learning Algorithmus einsetzt wird. Deep, also tief, bezieht sich eben auf die Anzahl Zwischenschichten. Eine gewisse Anzahl Schichten, ab wann ein neuronales Netz tief ist, gibt es aber nicht. - mehr
  • h

  • Hyperparameter
    Hyperparameter sind die Parameter eines Machine Learning Algorithmus, die nicht direkt durch die Trainingsdaten angepasst werden bzw. vor dem Training gesetzt werden, zum Beispiel die Anzahl Knoten eines neuronalen Netzes. - mehr
  • k

  • Key-Value-Stores
    In Key-Value-Stores besteht ein Datensatz aus einem Schlüssel (Key) und einem oder mehreren Werten (Value), ähnlich zu einem Lexikon. - mehr
  • m

  • Maschinelles Lernen
    Maschinelles Lernen (engl. machine learning, Abk. ML) bezeichnet den Prozess, aus einem Trainingsdatensatz Regeln abzuleiten und diese dann auf neue Daten anzuwenden. - mehr
  • n

  • Neuronales Netz
    Neuronale Netze sind eine Modellklasse im Bereich Maschinelles Lernen, welche aus Knoten und Verbindungen dazwischen bestehen. Dabei geht es nicht um die exakte Nachbildung der Neuronen im Gehirn, sondern z.B. um eine gute Performance bei der Bilderkennung. - mehr
  • NoSQL
    NoSQL steht für „not only SQL“ und ist ein Sammelbegriff für Datenbanken, welche nicht nach dem tabellenbasierten Ansatz relationaler Datenbanken arbeiten. - mehr
  • p

  • Pytorch
    Pytorch ist neben Tensorflow das bekannteste Neuronale Netze-Framework. Pytorch ist eine open-source Library für Python und wird von namhaften Unternehmen verwendet. - mehr
  • r

  • R (Programmiersprache)
    R ist eine Interpreter-Programmiersprache, die im Data Science Umfeld neben Python die größte Verbreitung hat. Ursprünglich von und für Statistikern entwickelt, hat R seine Stärken in der Datenanalyse und -Datenvisualisierung. Durch zahlreiche Erweiterungen (Packages) kann R mittlerweile(...) - mehr
  • reinforcement learning
    Reinforcement Learning ist ein Teilgebiet des Maschinellen Lernens, bei dem ein Agent selbstständig lernt, indem er in einer Umgebung (engl. environment) so agiert, dass er ein Belohnungssystem maximiert. - mehr
  • RStudio
    RStudio ist die wohl am weitesten verbreitete integrierte Entwicklungsumgebung (IDE) für die Programmiersprache R. D.h. RStudio ist eine Software, welche das Programmieren in R deutlich komfortabler, schneller und einfacher macht, z.B. durch Autovervollständigung, einem Variablen-Fenster usw. - mehr
  • s

  • Spaltenorientierte Datenbanken
    Spaltenorientierte Datenbanken speichern die Spalten einer Tabelle separat voneinander, während relationale Datenbanken zeilenweise vorgehen. - mehr
  • t

  • Tensorflow
    Tensorflow ist mit eines der populärsten Frameworks für künstliche neuronale Netze. Tensorflow ist mittlerweile open source. Besonders häufig wird Tensorflow zusammen mit dem high-level Interface Keras verwendet, um maschinelles Lernen mittels neuronaler Netze durchzuführen. Viele große Firmen(...) - mehr
  • Turing-Test
    Der Turing-Test ist ein Szenario, um die Intelligenz von Computern zu testen. Zur Durchführung führt ein Mensch zwei Gespräche per Tastatur. Der eine Gesprächspartner ist eine "künstliche Intelligenz", der andere ein Mensch. Kann nach einer gewissen Zeit nicht zwischen Mensch und künstlicher(...) - mehr
  • u

  • überwachtes Lernen
    Überwachtes Lernen (engl. supervised learning) bezeichnet das Lernen einer Funktion mit definierten Inputs und Outputs anhand von Trainingsdaten. D.h. anhand eines Trainingsdatensatzes, der aus Paaren von Inputs und Outputs besteht (labeled dataset), lernt der Algorithmus, zu beliebigen(...) - mehr