KT_Q_Table

Commit Graph

Author	SHA1	Message	Date
mgjeon	6de135680e	feat: Enhance action selection and Q-table initialization Key changes: - Add random Q-table initialization with small values (0-0.1) - Implement action masking mechanism to prevent repeated actions - Add debug information to show available actions and Q-values - Add epsilon-greedy selection with action masking - Add tests for policy and agent behavior	2025-09-24 16:51:44 +09:00
mgjeon	0ade7cec61	docs: README 전면 개선 - 프로젝트 구조 상세 설명 추가 - 주요 컴포넌트 설명 추가 - 실행 방법 가이드 추가 - 설정 파일 설명 추가 - 학습 결과 및 확장 방향 문서화	2025-09-22 16:36:25 +09:00
mgjeon	a81e1d4232	feat: 학습 및 평가 프로세스 개선 - data_collector.py: JSON 형식 로깅 추가 - train_offline.py: Q-table 저장 형식 개선 - evaluate.py: 평가 지표 상세화 - usecases/: 평가 로직 개선 - tests/: 테스트 케이스 업데이트	2025-09-22 16:36:07 +09:00
mgjeon	e85490e0ab	feat: 데이터 관리 및 설정 개선 - configs/actions.json: 행동 정의 파일 추가 - configs/offline_env_config.yaml: 환경 설정 파일 개선 - saved_models/: Q-table JSON 형식 추가 - logs/: 데이터 수집 로그 기능 추가	2025-09-22 16:35:52 +09:00
mgjeon	1bf179bbaa	feat: 협상 에이전트 구현 개선 - action_space.py: 행동 공간 관리 로직 추가 - constants.py: 상수값 분리 및 관리 - spaces.py: 상태 및 행동 공간 정의 추가 - environment.py: 협상 환경 구현 개선	2025-09-22 16:35:43 +09:00
mgjeon	26442ca9c1	refactor: 프로젝트 구조 개선 - 기존 envs/ 디렉토리를 negotiation_agent/로 이동 및 리팩토링 - config.py를 configs/ 디렉토리로 이동 및 yaml 형식으로 변경 - Offline_RL.md를 README.md로 통합 - 불필요한 train.py 제거	2025-09-22 16:35:29 +09:00
mgjeon	0c2ec47c6b	Initial commit	2025-09-18 08:46:44 +09:00

7 Commits (main) All Branches Search

7 Commits (main)

All Branches