[강화학습] Reinforcement Learning 기초 요약 기본개념 https://keraskorea.github.io/posts/2018-10-25-Keras%EB%A5%BC%20%ED%99%9C%EC%9A%A9%ED%95%9C%20%EC%A3%BC%EC%8B%9D%20%EA%B0%80%EA%B2%A9%20%EC%98%88%EC%B8%A1/ A) 기초통계¶ A-4) 조건부 확률¶P(Y|X)=P(X)∩P(Y)P(X)P(Y,X)=P(Y|X)P(Y)응용 P(Y|X,Z)=P(Y,X|Z)P(Y|Z)P(Y,X|Z)=P(Y|X,Z)P(Y|Z)A-2)조건부 기대값¶E[Y|X=x]=∑ip(Y=yi|X=x)yi설명 : 각 사건이 일어날 확률과 각 사건의.. Deep Learning/강화학습 2021.05.13