2024.10.27 学习内容
• EM算法的模型参数推导(同时巩固Latex)
• 高斯混合模型参数估计的EM算法
• 隐马尔可夫模型(概率计算算法)
• paper(高效低秩矩阵估计)page5 Algorithm 1
基于LowPopArt方法的低秩bandit算法
◦ 概念理解:
• 低秩矩阵估计(Low-Rank Matrix Estimation):
从部分观测值或有噪声的数据中,恢复或近似一个低秩矩阵(数据矩阵维度过高,有效信息集中在一个较小的子空间)。
• 实验设计(Experimental Design)
在有限的探索资源下,应该优先选择哪一部分臂进行探索,以最小代价获取最大收益。
• 依赖臂集的低秩多臂老虎机(Arm-Set-Dependent Low-Rank Bandits)
考虑一组臂的组合且它们的收益相互依赖,要综合考虑单个臂和组合臂。
◦ 摘要和引言部分
论文主要研究低秩矩阵估计和低秩bandit问题。假设不同臂的回报矩阵具有低秩结构,于是通过少量的探索推测出其他选择方案的回报,提高效率。论...
11 post articles, 2 pages.