- 博客(3)
- 收藏
- 关注
原创 多臂老虎机
在此问题中,有一个拥有K根拉杆的老虎机。最开始,奖励概率分布未知。(有K种动作,对应K种奖励)用random获取一个随机数,若该随机数小于临界点epision,就进行随机挑选。否则,就选取当前的最优杆。跟基础贪婪算法相比就是设定了一个epision,防止一直停留在局部最优解,也是一种对探索和利用平衡的处理。该方法无论epision设定多少,累积懊悔几乎是线性增长的。但若按时间调节epision,可以使累积懊悔达到次线性增长。2.3.2 上置信界算法。
2025-07-01 01:02:34
521
原创 docker redis部署及可视化工具安装
/这条命令用于启动一个名为 new-redis(自由取名 这里以new-redis为例) 的 Redis 容器,并将容器的 6379 端口映射到主机的 6379 端口。防火墙和网络保护——高级设置——入站规则——右侧新建规则——端口——next——tcp,特定本地端口6379——next——允许连接——next——全选——next——名称一般是Port 6379——完成。//此时相当于用命令行启动了redis功能,类似于启动mysql服务时。//搜索redis相关镜像(这一步可以忽略)
2025-06-25 11:42:34
331
【Docker与Redis部署】基于Docker的Redis容器化部署及可视化管理:从镜像拉取到端口配置与启动操作指南
2025-06-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人