บทความที่แล้วเรารู้จักเรื่อง Deep Q Network (DQN) http://cakeknowledgeblogs.blogspot.com/2020/09/deep-q-network.html กันไปแล้ว ครั้งนี้เลยจะมาแชร์เรื่อง Policy Gradient (PG) และความตากแตกต่างระหว่าง PG และ DQN กัน
ไม่มีความคิดเห็น:
แสดงความคิดเห็น