'ai' 카테고리의 글 목록

ai 3

강화학습개론 HW2-1 [Bellman Expectation Equation]

State Value Function Vp(s) = E[Gt | St = s] = E[ Rt+1 + rRt+2 + r^2... + |St = s ] = Ep[Rt+1 + rVp(St+1)| St = s] 우선 State Value Function 은 episode를 state-s, time- t 에서 시작하며 policy pi를 따를 때, 이 episode 가 끝날 때 까지의 총 discounted reward의 평균을 의미한다. 이때 policy pi 이외에도 확률적 요소를 가지고 있는 것이 두 가지가 있다. dynamics = P(s', r | s, a) 이다. time- t에서 time - t+1이 되려면 action을 취해야하는데, action을 취할 때, 위 두 가지 요소가 확률을 만들어낸다..

ai/강화학습 2024.10.09

GA- 12-24

# import import random import pandas as pd import openpyxl import numpy as np import matplotlib.pyplot as plt import copy # calling the data Parameter=pd.read_csv(r"C:\Users\user\Desktop\Parameter.csv") Test_Data_Q=pd.read_csv(r"C:\Users\user\Desktop\Test_Data_Q.csv") Test_Data_Q=Test_Data_Q.iloc[:36,:20] # number of row and column people_row=len(Test_Data_Q) #36 people_column=len(Test_Data_Q.co..

ai 2023.12.24

GA-1208

# import import random import pandas as pd import openpyxl import numpy as np import matplotlib.pyplot as plt import copy # calling the data Parameter=pd.read_csv(r"C:\Users\user\Desktop\Parameter.csv") Test_50_Data=pd.read_csv(r"C:\Users\user\Desktop\Test_50_Data.csv") Test_50_Data = Test_50_Data.iloc[1:,1:] # 여기서 행이 16개만 뽑힘 Test_50_Data.head() # number of row and column people_row=len(Test_50_..

ai 2023.12.08

통계가 좋아 ^ㅅ^

부산대학교 산업공학과 20학번입니다. 저는 통계를 좋아하고 하나하나 증명하며 의미를 파악하는 과정을 즐깁니다~~ ^ㅅ^,,

Today :
Yesterday :

일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

ai 3

티스토리툴바