{ "metadata": { "state_size": 36, "action_size": 9, "timestamp": "2025-09-22T16:20:10.539545", "training_episodes": 10 }, "q_values": [ { "state_idx": 0, "state_desc": "State(scenario=높은 구매 의지, price_zone=목표가격 이하, acceptance_rate=낮음 (<10%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.08795120152833774 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.07980060621013178 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.06578247676712926 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.05640440663220407 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.08343614486312115 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.07708021145254244 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.06649834752893999 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0483122563738206 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.07784918257350587 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.08795120152833774 } }, { "state_idx": 1, "state_desc": "State(scenario=높은 구매 의지, price_zone=목표가격 이하, acceptance_rate=중간 (10-25%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.04181960568421511 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.01650653844752281 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.02224513478479088 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.04105294727331152 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.05931104531941931 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.04004415229683608 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.02881340637109566 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.033459877776815736 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.05507207930384824 } ], "optimal_action": { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.05931104531941931 } }, { "state_idx": 2, "state_desc": "State(scenario=높은 구매 의지, price_zone=목표가격 이하, acceptance_rate=높음 (>25%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.07486255107754664 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.07980060621013178 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.05926445786066637 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.04275562307545951 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.04916661909531326 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.07053122078911914 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.04567119680331397 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.04118128186893584 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0647616644539918 } ], "optimal_action": { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.07980060621013178 } }, { "state_idx": 3, "state_desc": "State(scenario=높은 구매 의지, price_zone=목표가격~임계가격, acceptance_rate=낮음 (<10%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 4, "state_desc": "State(scenario=높은 구매 의지, price_zone=목표가격~임계가격, acceptance_rate=중간 (10-25%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 5, "state_desc": "State(scenario=높은 구매 의지, price_zone=목표가격~임계가격, acceptance_rate=높음 (>25%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 6, "state_desc": "State(scenario=높은 구매 의지, price_zone=임계가격 초과, acceptance_rate=낮음 (<10%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 7, "state_desc": "State(scenario=높은 구매 의지, price_zone=임계가격 초과, acceptance_rate=중간 (10-25%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 8, "state_desc": "State(scenario=높은 구매 의지, price_zone=임계가격 초과, acceptance_rate=높음 (>25%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 9, "state_desc": "State(scenario=중간 구매 의지, price_zone=목표가격 이하, acceptance_rate=낮음 (<10%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 10, "state_desc": "State(scenario=중간 구매 의지, price_zone=목표가격 이하, acceptance_rate=중간 (10-25%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 11, "state_desc": "State(scenario=중간 구매 의지, price_zone=목표가격 이하, acceptance_rate=높음 (>25%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 12, "state_desc": "State(scenario=중간 구매 의지, price_zone=목표가격~임계가격, acceptance_rate=낮음 (<10%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 13, "state_desc": "State(scenario=중간 구매 의지, price_zone=목표가격~임계가격, acceptance_rate=중간 (10-25%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 14, "state_desc": "State(scenario=중간 구매 의지, price_zone=목표가격~임계가격, acceptance_rate=높음 (>25%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 15, "state_desc": "State(scenario=중간 구매 의지, price_zone=임계가격 초과, acceptance_rate=낮음 (<10%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 16, "state_desc": "State(scenario=중간 구매 의지, price_zone=임계가격 초과, acceptance_rate=중간 (10-25%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 17, "state_desc": "State(scenario=중간 구매 의지, price_zone=임계가격 초과, acceptance_rate=높음 (>25%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 18, "state_desc": "State(scenario=낮은 구매 의지, price_zone=목표가격 이하, acceptance_rate=낮음 (<10%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 19, "state_desc": "State(scenario=낮은 구매 의지, price_zone=목표가격 이하, acceptance_rate=중간 (10-25%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 20, "state_desc": "State(scenario=낮은 구매 의지, price_zone=목표가격 이하, acceptance_rate=높음 (>25%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 21, "state_desc": "State(scenario=낮은 구매 의지, price_zone=목표가격~임계가격, acceptance_rate=낮음 (<10%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 22, "state_desc": "State(scenario=낮은 구매 의지, price_zone=목표가격~임계가격, acceptance_rate=중간 (10-25%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 23, "state_desc": "State(scenario=낮은 구매 의지, price_zone=목표가격~임계가격, acceptance_rate=높음 (>25%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 24, "state_desc": "State(scenario=낮은 구매 의지, price_zone=임계가격 초과, acceptance_rate=낮음 (<10%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 25, "state_desc": "State(scenario=낮은 구매 의지, price_zone=임계가격 초과, acceptance_rate=중간 (10-25%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 26, "state_desc": "State(scenario=낮은 구매 의지, price_zone=임계가격 초과, acceptance_rate=높음 (>25%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 27, "state_desc": "State(scenario=매우 낮은 구매 의지, price_zone=목표가격 이하, acceptance_rate=낮음 (<10%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 28, "state_desc": "State(scenario=매우 낮은 구매 의지, price_zone=목표가격 이하, acceptance_rate=중간 (10-25%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 29, "state_desc": "State(scenario=매우 낮은 구매 의지, price_zone=목표가격 이하, acceptance_rate=높음 (>25%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 30, "state_desc": "State(scenario=매우 낮은 구매 의지, price_zone=목표가격~임계가격, acceptance_rate=낮음 (<10%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 31, "state_desc": "State(scenario=매우 낮은 구매 의지, price_zone=목표가격~임계가격, acceptance_rate=중간 (10-25%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 32, "state_desc": "State(scenario=매우 낮은 구매 의지, price_zone=목표가격~임계가격, acceptance_rate=높음 (>25%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 33, "state_desc": "State(scenario=매우 낮은 구매 의지, price_zone=임계가격 초과, acceptance_rate=낮음 (<10%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 34, "state_desc": "State(scenario=매우 낮은 구매 의지, price_zone=임계가격 초과, acceptance_rate=중간 (10-25%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } }, { "state_idx": 35, "state_desc": "State(scenario=매우 낮은 구매 의지, price_zone=임계가격 초과, acceptance_rate=높음 (>25%))", "actions": [ { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 }, { "action_idx": 1, "action_desc": "중간 수락", "q_value": 0.0 }, { "action_idx": 2, "action_desc": "약한 수락", "q_value": 0.0 }, { "action_idx": 3, "action_desc": "강한 거절", "q_value": 0.0 }, { "action_idx": 4, "action_desc": "중간 거절", "q_value": 0.0 }, { "action_idx": 5, "action_desc": "약한 거절", "q_value": 0.0 }, { "action_idx": 6, "action_desc": "강한 가격 제안", "q_value": 0.0 }, { "action_idx": 7, "action_desc": "중간 가격 제안", "q_value": 0.0 }, { "action_idx": 8, "action_desc": "약한 가격 제안", "q_value": 0.0 } ], "optimal_action": { "action_idx": 0, "action_desc": "강한 수락", "q_value": 0.0 } } ] }