17 lines
515 B
Python
17 lines
515 B
Python
from negotiation_agent.environment import NegotiationEnv
|
|
|
|
def calculate_reward_usecase(env: NegotiationEnv, state, terminated: bool) -> float:
|
|
"""
|
|
현재 상태와 종료 여부에 따른 보상을 계산하는 유스케이스
|
|
|
|
Args:
|
|
env (NegotiationEnv): 협상 환경 인스턴스
|
|
state: 현재 상태
|
|
terminated (bool): 에피소드 종료 여부
|
|
|
|
Returns:
|
|
float: 계산된 보상값
|
|
"""
|
|
reward = env._calculate_reward(state, terminated)
|
|
return reward
|