Skip to content

Latest commit

 

History

History
67 lines (56 loc) · 2.37 KB

README.md

File metadata and controls

67 lines (56 loc) · 2.37 KB

Trường Đại học Công nghệ Thông tin | University of Information Technology

CS115 - TOÁN CHO KHOA HỌC MÁY TÍNH

MATH FOR COMPUTER SCIENCE

Status GitHub contributors Status

BẢNG MỤC LỤC

GIỚI THIỆU MÔN HỌC

  • Tên môn học: TOÁN CHO KHOA HỌC MÁY TÍNH - MATH FOR CS
  • Mã môn học: CS115
  • Mã lớp: CS115.P11
  • Năm học: HK1 (2024 - 2025)
  • Giảng viên: TS. Dương Việt Hằng - hangvd@uit.edu.vn

GIỚI THIỆU NHÓM

STT Họ tên MSSV Vai trò Email
1 Võ Anh Kiệt 23520825 Thành viên 23520825@gm.uit.edu.vn
2 Lê Phú Quý 23521316 Thành viên 23521316@gm.uit.edu.vn
3 Trần Tuấn Kiệt 23520822 Thành viên 23520822@gm.uit.edu.vn
4 Phạm Tài Lộc 23520865 Thành viên 23520865@gm.uit.edu.vn

GIỚI THIỆU ĐỀ TÀI

  • Tên đề tài: Policy Gradient For Reinforcement Learning
  • Mô tả đề tài: Xây dựng một mô hình Reinforcement Learning với cách tiếp cận Policy-based là Policy Gradient Method.

Requirements

  • Language: Python 3
  • Library:
gym
pytorch
numpy
itertools

Installation

git clone https://github.com/ToiLaKiet/UIT-CS115.git
cd UIT-CS115
pip install -r requirements.txt

Usage

  • Huấn luyện Model chơi game Cart Pole

DEMO

Full demo: https://shorturl.at/5AGUW