Table 1 The number of times the robot visits unsafe states during learning.

	maximum times	minimum times
Q-learning without safety values	160,937	157,192
QSQ-learning	2,294	962

Search