2024.11.11-11.16 学习内容
• 机器学习-主成分分析、潜在语义分析
• 泛函分析-Hilbert 空间上的紧算子(Fredholm理论、谱)
• 近世代数-唯一分解整环、主理想整环、欧几里得整环、域(F-向量空间、域扩张)
• 偏微分方程-热方程、椭圆方程
2024.11.9 学习内容
• 机器学习-维特比算法、无监督学习(聚类方法、奇异值分解)
• 泛函分析-Hilbert 空间上的算子(正交投影算子、同构与等距算子、共轭算子)
• 近世代数-特征,商域,多项式环
2024.11.2 学习内容
• 近世代数-群轮、环论(基本性质、同态基本定理)
• 离散数学-Enumeration计数(整数分拆、集合分拆、杨图、permutation 排列、Young tableaux、the Robinson-Schensted correspondence - 一种将 permutation 转化为标准杨表的算法)
2024.10.30 学习内容
• 机器学习-聚类方法
• 泛函分析-Hilbert空间理论(内积空间,正交性)
• 离散数学-图论基础理论、偏序集
• paper(高效低秩矩阵估计)page6 Algorithm 2
2024.10.27 学习内容
• EM算法的模型参数推导(同时巩固Latex)
• 高斯混合模型参数估计的EM算法
• 隐马尔可夫模型(概率计算算法)
• paper(高效低秩矩阵估计)page5 Algorithm 1
基于LowPopArt方法的低秩bandit算法
◦ 概念理解:
• 低秩矩阵估计(Low-Rank Matrix Estimation):
从部分观测值或有噪声的数据中,恢复或近似一个低秩矩阵(数据矩阵维度过高,有效信息集中在一个较小的子空间)。
• 实验设计(Experimental Design)
在有限的探索资源下,应该优先选择哪一部分臂进行探索,以最小代价获取最大收益。
• 依赖臂集的低秩多臂老虎机(Arm-Set-Dependent Low-Rank Bandits)
考虑一组臂的组合且它们的收益相互依赖,要综合考虑单个臂和组合臂。
◦ 摘要和引言部分
论文主要研究低秩矩阵估计和低秩bandit问题。假设不同臂的回报矩阵具有低秩结构,于是通过少量的探索推测出其他选择方案的回报,提高效率。论...