Commit Graph

7 Commits (main)

Author SHA1 Message Date
mgjeon 6de135680e feat: Enhance action selection and Q-table initialization
Key changes:
- Add random Q-table initialization with small values (0-0.1)
- Implement action masking mechanism to prevent repeated actions
- Add debug information to show available actions and Q-values
- Add epsilon-greedy selection with action masking
- Add tests for policy and agent behavior
2025-09-24 16:51:44 +09:00
mgjeon 0ade7cec61 docs: README 전면 개선
- 프로젝트 구조 상세 설명 추가
- 주요 컴포넌트 설명 추가
- 실행 방법 가이드 추가
- 설정 파일 설명 추가
- 학습 결과 및 확장 방향 문서화
2025-09-22 16:36:25 +09:00
mgjeon a81e1d4232 feat: 학습 및 평가 프로세스 개선
- data_collector.py: JSON 형식 로깅 추가
- train_offline.py: Q-table 저장 형식 개선
- evaluate.py: 평가 지표 상세화
- usecases/: 평가 로직 개선
- tests/: 테스트 케이스 업데이트
2025-09-22 16:36:07 +09:00
mgjeon e85490e0ab feat: 데이터 관리 및 설정 개선
- configs/actions.json: 행동 정의 파일 추가
- configs/offline_env_config.yaml: 환경 설정 파일 개선
- saved_models/: Q-table JSON 형식 추가
- logs/: 데이터 수집 로그 기능 추가
2025-09-22 16:35:52 +09:00
mgjeon 1bf179bbaa feat: 협상 에이전트 구현 개선
- action_space.py: 행동 공간 관리 로직 추가
- constants.py: 상수값 분리 및 관리
- spaces.py: 상태 및 행동 공간 정의 추가
- environment.py: 협상 환경 구현 개선
2025-09-22 16:35:43 +09:00
mgjeon 26442ca9c1 refactor: 프로젝트 구조 개선
- 기존 envs/ 디렉토리를 negotiation_agent/로 이동 및 리팩토링
- config.py를 configs/ 디렉토리로 이동 및 yaml 형식으로 변경
- Offline_RL.md를 README.md로 통합
- 불필요한 train.py 제거
2025-09-22 16:35:29 +09:00
mgjeon 0c2ec47c6b Initial commit 2025-09-18 08:46:44 +09:00