KT_Q_Table/usecases/calculate_reward_usecase.py

17 lines
515 B
Python

from negotiation_agent.environment import NegotiationEnv
def calculate_reward_usecase(env: NegotiationEnv, state, terminated: bool) -> float:
"""
현재 상태와 종료 여부에 따른 보상을 계산하는 유스케이스
Args:
env (NegotiationEnv): 협상 환경 인스턴스
state: 현재 상태
terminated (bool): 에피소드 종료 여부
Returns:
float: 계산된 보상값
"""
reward = env._calculate_reward(state, terminated)
return reward