{ "cells": [ { "cell_type": "markdown", "metadata": { "toc": true }, "source": [ "
\n", " | r | \n", "e | \n", "random agent avg reward | \n", "
---|---|---|---|
random agent action | \n", "\n", " | \n", " | \n", " |
0 | \n", "273 | \n", "273 | \n", "273 | \n", "
1 | \n", "294 | \n", "294 | \n", "294 | \n", "
2 | \n", "311 | \n", "311 | \n", "311 | \n", "
3 | \n", "289 | \n", "289 | \n", "289 | \n", "
4 | \n", "311 | \n", "311 | \n", "311 | \n", "
5 | \n", "268 | \n", "268 | \n", "268 | \n", "
6 | \n", "321 | \n", "321 | \n", "321 | \n", "
7 | \n", "327 | \n", "327 | \n", "327 | \n", "
8 | \n", "282 | \n", "282 | \n", "282 | \n", "
9 | \n", "324 | \n", "324 | \n", "324 | \n", "