| PERPUSTAKAAN UNIVERSITAS KATOLIK PARAHYANGAN

This paper revisits the temporal difference (TD) learning algorithm for the policy evaluation tasks in reinforcement learning. Typically, the performance of TD(0) and TD( λ ) is very sensitive to …

Ketersediaan1

Tambahkan ke dalam keranjang

Tampilkan Detail Sitasi

Hasil Pencarian

Ditemukan 1 dari pencarian Anda melalui kata kunci: Pengarang : Li, Dongsheng

Permintaan membutuhkan 0,28467 detik untuk selesai

XML Result JSON Result

Saran

Adat istiadat daerah Sulawesi Tengah

INDONESIA DEPARTEMEN PENDIDIKAN & KEBUDAYAAN - PUSAT PENELITIAN SEJARAH DAN BUDAYA

Mixers : Four Innovations Worth a Closer Look

Banaszek, Christine

Lesson from Both Sides of the Interviewing Desk

Carpenter, Jenna - Deaett, Louis - Stob, Michael

Usulan peramalan permintaan produk tangga di CV. Sigma Steel Manufacturing

Addison, Valencia Sani - Jaya, Vellin Dwi - Nathania, Meliana

Narrowband Dual-Wavelength Silicon Waveguide Bragg Reflectors

Yen, Tzu-Hsiang - Hung, Yung-Jr

Adaptive Temporal Difference Learning With Linear Function Approximation

Hasil Pencarian

Saran