This package is considered a duplicate. The official version of this package is found at:https://yuki-961004.r-universe.dev/multiRL

Package: multiRL 0.4.5

YuKi

multiRL: Reinforcement Learning Tools for Multi-Armed Bandit

A flexible general-purpose toolbox for implementing Rescorla-Wagner models in multi-armed bandit tasks. As the successor and functional extension of the 'binaryRL' package, 'multiRL' modularizes the Markov Decision Process (MDP) into six core components. This framework enables users to construct custom models via intuitive if-else syntax and define latent learning rules for agents. For parameter estimation, it provides both likelihood-based inference (MLE and MAP) and simulation-based inference (ABC and RNN), with full support for parallel processing across subjects. The workflow is highly standardized, featuring four main functions that strictly follow the four-step protocol (and ten rules) proposed by Wilson & Collins (2019) <doi:10.7554/eLife.49547>. Beyond the three built-in models (TD, RSTD, and Utility), users can easily derive new variants by declaring which variables are treated as free parameters.

Authors:YuKi [aut, cre], Xinyu [aut]

multiRL_0.4.5.tar.gz
multiRL_0.4.5.tar.gz(r-4.7-arm64)multiRL_0.4.5.tar.gz(r-4.7-x86_64)multiRL_0.4.5.tar.gz(r-4.6-arm64)multiRL_0.4.5.tar.gz(r-4.6-x86_64)
multiRL_0.4.5.tgz(r-4.6-emscripten)
manual.pdf |manual.html✨
card.svg |card.png
multiRL/json (API)

# Install 'multiRL' in R:

install.packages('multiRL', repos = c('https://cran.r-universe.dev', 'https://cloud.r-project.org'))

Bug tracker:https://github.com/yuki-961004/multirl/issues

Pkgdown/docs site:https://yuki-961004.github.io

Uses libs:

c++– GNU Standard C++ Library v3

Datasets:

MAB - Simulated Multi-Arm Bandit Dataset
TAB - Group 2 from Mason et al.
WMT - Data from Collins and Frank

On CRAN:

cpp

1.48 score 2 scripts 158 downloads 31 exports 31 dependencies

Last updated from:6810622e23. Checks:6 OK. Indexed: no.

Target	Result	Time
linux-devel-arm64	OK	144
linux-devel-x86_64	OK	150
source / vignettes	OK	209
linux-release-arm64	OK	159
linux-release-x86_64	OK	167
wasm-release	OK	133

Exports:engine_ABC engine_RNN engine_RNN3 estimate_0_ENV estimate_1_LBI estimate_1_MAP estimate_1_MLE estimate_2_ABC estimate_2_RNN estimate_2_SBI estimation_methods fit_p func_alpha func_beta func_delta func_epsilon func_gamma func_zeta process_1_input process_2_behrule process_3_record process_4_output_cpp process_4_output_r process_5_metric rcv_d rpl_e RSTD run_m summary TD Utility

Dependencies:cli codetools cpp11 digest doFuture doRNG farver foreach future future.apply ggplot2 globals glue gtable isoband iterators labeling lifecycle listenv parallelly progressr R6 RColorBrewer Rcpp rlang rngtools S7 scales vctrs viridisLite withr

Help page	Topics
Algorithm Packages (MLE, MAP)	algorithm
Behavior Rules	behrule
Column Names	colnames
Controls of Estimation Methods	control
Dataset Structure	data
The Engine of Approximate Bayesian Computation (ABC)	engine_ABC
The Engine of Recurrent Neural Network (RNN)	engine_RNN engine_RNN3
Estimate Methods	estimate
Tool for Generating an Environment for Models	estimate_0_ENV
Likelihood-Based Inference (LBI)	estimate_1_LBI
Estimation Method: Maximum A Posteriori (MAP)	estimate_1_MAP
Estimation Method: Maximum Likelihood Estimation (MLE)	estimate_1_MLE
Estimation Method: Approximate Bayesian Computation (ABC)	estimate_2_ABC
Estimation Method: Recurrent Neural Network (RNN)	estimate_2_RNN
Simulated-Based Inference (SBI)	estimate_2_SBI
Estimate Methods	estimation_methods
Step 3: Optimizing parameters to fit real data	fit_p
Function: Learning Rate	func_alpha
Function: Probability	func_beta
Function: Bias	func_delta
Function: Exploration or Exploitation	func_epsilon
Function: Utility	func_gamma
Function: Decay Rate	func_zeta
Core Functions	funcs
Layers and Loss Functions (RNN)	layer
Simulated Multi-Arm Bandit Dataset	MAB
Model Parameters	params
plot.multiRL.replay	plot.multiRL.replay
Policy of Agent	policy
Density and Random Function	priors
multiRL.input	process_1_input
multiRL.behrule	process_2_behrule
multiRL.record	process_3_record
multiRL.output	process_4_output_cpp
multiRL.output	process_4_output_r
multiRL.metric	process_5_metric
Step 2: Generating fake data for parameter and model recovery	rcv_d
Dimension Reduction Methods (ABC)	reduction
Step 4: Replaying the experiment with optimal parameters	rpl_e
Risk Sensitive Model	RSTD
Step 1: Building reinforcement learning model	run_m
Settings of Model	settings
summary	summary,multiRL.model-method
Cognitive Processing System	system
Group 2 from Mason et al. (2024)	TAB
Temporal Differences Model	TD
Utility Model	Utility
Data from Collins and Frank (2012)	WMT

Package: multiRL 0.4.5

multiRL: Reinforcement Learning Tools for Multi-Armed Bandit

Citation

Readme and manuals

Help Manual

Usage by other packages (reverse dependencies)