Logo
Unionpedia
Kommunikation
Jetzt bei Google Play
Neu! Laden Sie Unionpedia auf Ihrem Android™-Gerät herunter!
Herunterladen
Schneller Zugriff als Browser!
 

Bestärkendes Lernen

Index Bestärkendes Lernen

Bestärkendes Lernen oder verstärkendes Lernen (RL) steht für eine Reihe von Methoden des maschinellen Lernens, bei denen ein Software-Agent selbständig eine Strategie erlernt, um erhaltene Belohnungen zu maximieren.

26 Beziehungen: Abzinsung und Aufzinsung, Ökonometrie, DeepMind, Dynamische Programmierung, Erwartungstreue, Fourierreihe, Gradientenverfahren, Künstliches neuronales Netz, Kybernetik, Logarithmus, Markow-Entscheidungsproblem, Marvin Minsky, Maschinelles Lernen, Medizin, Menge (Mathematik), Monte-Carlo-Algorithmus, Optimale Steuerung, Parameterintegral, Policy, Reelle Zahl, Reinforcement learning from human feedback, Richard S. Sutton, Software-Agent, Sozialwissenschaften, Temporal Difference Learning, Wahrscheinlichkeitsmaß.

Abzinsung und Aufzinsung

Abzinsung zur Ermittlung des Kapitalwerts (Beispielhafte Übersicht) Jährliche Abzinsung mit Abzinsungsfaktoren als Diagramm Die Abzinsung (auch Diskontierung, engl. discounting; oft auch Abdiskontierung genannt) ist eine Rechenoperation aus der Finanzmathematik.

Neu!!: Bestärkendes Lernen und Abzinsung und Aufzinsung · Mehr sehen »

Ökonometrie

Die Ökonometrie ist ein Teilgebiet der Wirtschaftswissenschaften, das die ökonomische Theorie sowie mathematische Methoden und statistische Daten zusammenführt, um wirtschaftstheoretische Modelle empirisch zu überprüfen und ökonomische Phänomene quantitativ zu analysieren.

Neu!!: Bestärkendes Lernen und Ökonometrie · Mehr sehen »

DeepMind

Google DeepMind (früher DeepMind Technologies) ist ein Unternehmen, das sich auf die Programmierung einer künstlichen Intelligenz (KI) spezialisiert hat.

Neu!!: Bestärkendes Lernen und DeepMind · Mehr sehen »

Dynamische Programmierung

Dynamische Programmierung ist eine Methode zum algorithmischen Lösen eines Optimierungsproblems durch Aufteilung in Teilprobleme und systematische Speicherung von Zwischenresultaten.

Neu!!: Bestärkendes Lernen und Dynamische Programmierung · Mehr sehen »

Erwartungstreue

Erwartungstreue (oft auch Unverzerrtheit) bezeichnet in der mathematischen Statistik eine Eigenschaft einer Schätzfunktion (kurz: eines Schätzers).

Neu!!: Bestärkendes Lernen und Erwartungstreue · Mehr sehen »

Fourierreihe

Joseph Fourier Als Fourierreihe, nach Joseph Fourier (1768–1830), bezeichnet man die Reihenentwicklung einer periodischen, abschnittsweise stetigen Funktion in eine Funktionenreihe aus Sinus- und Kosinusfunktionen.

Neu!!: Bestärkendes Lernen und Fourierreihe · Mehr sehen »

Gradientenverfahren

Das Gradientenverfahren wird in der Numerik eingesetzt, um allgemeine Optimierungsprobleme zu lösen.

Neu!!: Bestärkendes Lernen und Gradientenverfahren · Mehr sehen »

Künstliches neuronales Netz

Künstliche neuronale Netze, auch künstliche neuronale Netzwerke, kurz: KNN (englisch artificial neural network, ANN), sind Netze aus künstlichen Neuronen.

Neu!!: Bestärkendes Lernen und Künstliches neuronales Netz · Mehr sehen »

Kybernetik

Norbert Wiener, der Begründer der Kybernetik Kybernetik ist nach ihrem Begründer Norbert Wiener die Wissenschaft der Steuerung und Regelung von Maschinen und deren Analogie zur Handlungsweise von lebenden Organismen (aufgrund der Rückkopplung durch Sinnesorgane) und sozialen Organisationen (aufgrund der Rückkopplung durch Kommunikation und Beobachtung).

Neu!!: Bestärkendes Lernen und Kybernetik · Mehr sehen »

Logarithmus

Logarithmische Skaleneinteilung eines Rechenschiebers (Detail) e (rot) und 1/2 (blau) Logarithmus zur Basis 10. Als Logarithmus (Plural: Logarithmen; von, „Verständnis, Lehre, Verhältnis“, und ἀριθμός, arithmós, „Zahl“) einer Zahl bezeichnet man den Exponenten, mit dem eine vorher festgelegte Zahl, die Basis, potenziert werden muss, um die gegebene Zahl, den Numerus, zu erhalten.

Neu!!: Bestärkendes Lernen und Logarithmus · Mehr sehen »

Markow-Entscheidungsproblem

Bei dem Markow-Entscheidungsproblem (MEP, auch Markow-Entscheidungsprozess oder MDP für Markov decision process) handelt es sich um ein nach dem russischen Mathematiker Andrei Andrejewitsch Markow benanntes Modell von Entscheidungsproblemen, bei denen der Nutzen eines Agenten von einer Folge von Entscheidungen abhängig ist.

Neu!!: Bestärkendes Lernen und Markow-Entscheidungsproblem · Mehr sehen »

Marvin Minsky

Marvin Minsky (2008) Mit einem Konfokalmikroskop gemessenes 3D-Oberflächenprofil einer 1-Euro-Münze (Ausschnitt) Marvin Lee Minsky (* 9. August 1927 in New York; † 24. Januar 2016 in Boston, Massachusetts) war ein amerikanischer Forscher auf dem Gebiet der künstlichen Intelligenz (KI).

Neu!!: Bestärkendes Lernen und Marvin Minsky · Mehr sehen »

Maschinelles Lernen

Maschinelles Lernen (ML) ist ein Oberbegriff für die „künstliche“ Generierung von Wissen aus Erfahrung: Ein künstliches System lernt aus Beispielen und kann diese nach Beendigung der Lernphase verallgemeinern.

Neu!!: Bestärkendes Lernen und Maschinelles Lernen · Mehr sehen »

Medizin

Asklepiosstab mit seiner gewundenen Schlange hält Die Medizin (von lateinisch medicina) ist die Wissenschaft der Vorbeugung, Erkennung und Behandlung von Krankheiten oder Verletzungen bei Menschen und Tieren.

Neu!!: Bestärkendes Lernen und Medizin · Mehr sehen »

Menge (Mathematik)

Symbolische Darstellung einer Menge von Vielecken leer. Als Menge wird in der Mathematik ein abstraktes Objekt bezeichnet, das aus der Zusammenfassung einer Anzahl einzelner Objekte hervorgeht.

Neu!!: Bestärkendes Lernen und Menge (Mathematik) · Mehr sehen »

Monte-Carlo-Algorithmus

Monte-Carlo-Algorithmen sind randomisierte Algorithmen, die mit einer nichttrivial nach oben beschränkten Wahrscheinlichkeit ein falsches Ergebnis liefern.

Neu!!: Bestärkendes Lernen und Monte-Carlo-Algorithmus · Mehr sehen »

Optimale Steuerung

Die Theorie der optimalen Steuerungen ist eng verwandt mit der Variationsrechnung und der Optimierung.

Neu!!: Bestärkendes Lernen und Optimale Steuerung · Mehr sehen »

Parameterintegral

Als Parameterintegral wird in der Analysis ein Integral bezeichnet, dessen Integrand von einem Parameter abhängt.

Neu!!: Bestärkendes Lernen und Parameterintegral · Mehr sehen »

Policy

Policy (Plural: Policies) bezeichnet in der Politikwissenschaft neben Polity und Politics eine der drei Dimensionen von Politik.

Neu!!: Bestärkendes Lernen und Policy · Mehr sehen »

Reelle Zahl

natürlichen Zahlen (ℕ) gehören Die reellen Zahlen bilden einen in der Mathematik bedeutenden Zahlenbereich.

Neu!!: Bestärkendes Lernen und Reelle Zahl · Mehr sehen »

Reinforcement learning from human feedback

Reinforcement learning from human feedback (RLHF) steht für maschinelles Lernen, bei dem ein Software-Agent selbständig eine Strategie (Policy) erlernt, um erhaltene Belohnungen zu maximieren.

Neu!!: Bestärkendes Lernen und Reinforcement learning from human feedback · Mehr sehen »

Richard S. Sutton

Richard S. Sutton 2016 Richard S. Sutton (* in Ohio) ist ein US-amerikanischer Informatiker.

Neu!!: Bestärkendes Lernen und Richard S. Sutton · Mehr sehen »

Software-Agent

Als Software-Agent (auch Agent oder Softbot) bezeichnet man ein Computerprogramm, das zu gewissem (wohl spezifiziertem) eigenständigem und eigendynamischem (autonomem) Verhalten fähig ist.

Neu!!: Bestärkendes Lernen und Software-Agent · Mehr sehen »

Sozialwissenschaften

Die Elite-Hochschule École des hautes études en sciences sociales (EHESS) in Paris versucht die unterschiedlichen Disziplinen der Sozialwissenschaften miteinander zu verbinden Die Sozialwissenschaften (auch Gesellschaftswissenschaften) untersuchen Phänomene des gesellschaftlichen Zusammenlebens der Menschen.

Neu!!: Bestärkendes Lernen und Sozialwissenschaften · Mehr sehen »

Temporal Difference Learning

Temporal Difference Learning (auch TD-Learning) ist eine Methode des bestärkenden Lernens.

Neu!!: Bestärkendes Lernen und Temporal Difference Learning · Mehr sehen »

Wahrscheinlichkeitsmaß

Ein Wahrscheinlichkeitsmaß dient dazu, den Begriff der Wahrscheinlichkeit zu quantifizieren und Ereignissen, die durch Mengen modelliert werden, eine Zahl im Intervall zuzuordnen.

Neu!!: Bestärkendes Lernen und Wahrscheinlichkeitsmaß · Mehr sehen »

Leitet hier um:

Reinforcement Learning, Verstärkendes Lernen.

AusgehendeEingehende
Hallo! Wir sind auf Facebook! »