Home

2024.10.27 学习内容

• EM算法的模型参数推导(同时巩固Latex) • 高斯混合模型参数估计的EM算法 • 隐马尔可夫模型(概率计算算法) • paper(高效低秩矩阵估计)page5 Algorithm 1

Read more

基于LowPopArt方法的低秩bandit算法

◦ 概念理解: • 低秩矩阵估计(Low-Rank Matrix Estimation): ​ 从部分观测值或有噪声的数据中,恢复或近似一个低秩矩阵(数据矩阵维度过高,有效信息集中在一个较小的子空间)。 • 实验设计(Experimental Design) ​ 在有限的探索资源下,应该优先选择哪一部分臂进行探索,以最小代价获取最大收益。 • 依赖臂集的低秩多臂老虎机(Arm-Set-Dependent Low-Rank Bandits) ​ 考虑一组臂的组合且它们的收益相互依赖,要综合考虑单个臂和组合臂。 ◦  摘要和引言部分 ​ 论文主要研究低秩矩阵估计和低秩bandit问题。假设不同臂的回报矩阵具有低秩结构,于是通过少量的探索推测出其他选择方案的回报,提高效率。论...

Read more