Commit Graph

2 Commits (main)

Author SHA1 Message Date
mgjeon 6de135680e feat: Enhance action selection and Q-table initialization
Key changes:
- Add random Q-table initialization with small values (0-0.1)
- Implement action masking mechanism to prevent repeated actions
- Add debug information to show available actions and Q-values
- Add epsilon-greedy selection with action masking
- Add tests for policy and agent behavior
2025-09-24 16:51:44 +09:00
mgjeon 1bf179bbaa feat: 협상 에이전트 구현 개선
- action_space.py: 행동 공간 관리 로직 추가
- constants.py: 상수값 분리 및 관리
- spaces.py: 상태 및 행동 공간 정의 추가
- environment.py: 협상 환경 구현 개선
2025-09-22 16:35:43 +09:00