统计学习理论

2018/12/16
最近,包括上个月,都看了很多统计学习理论的书,他们对这部分知识的讲解角度都是从纯理论的角度,比如从统计学于概率论的角度做基础,来从理论上介绍某机器学习的可靠性。与我最初的疑惑,机器学习为什么能工作,并不匹配。这些材料主要集中在“学习理论”,“计算理论”等。
从这些材料中得到的知识,都是从问题的定义出发, 一步一步缩小相应的假设,然后达到最终的效果。虽然说, 这部分知识解答了我的一些疑惑,但并没有从根本给我一个实际应用的场景。所以,我看的过程很费劲,理解起来也很难受。满篇满篇都是那种不等式,公式等,这种感觉就像是当年学习那个大数定律一样。
不过我比较关心的,就是这部分知识,不说实际应用的作用,就说这个东西它在我运用机器学习算法的时候能给我带来多少理论知识的支撑。不然,感觉我在学习这个东西的时候,就有点得不偿失了。


对于这部分内容,很广泛的内容都涵盖在概率论中,特别是数据分布,特别是条件分布这个地方。但仅仅知道这个部分的内容是不行的,还需要一定程度的统计内容,但我感觉,我差一个材料,来讲这部分给我贯穿起来,可能我已经知道了,但是我没有用起来,所以这部分需要花时间来整理。


正如我曾经在某篇笔记中说,学习问题最终划归到通过数据来得到知识的过程,这个过程需要一系列的理论支撑来达到成熟和完整,这里面就需要利用数据中类似概率论,随机事件这种东西来实现。如果从高的抽象层次来说,我们人类的学习过程,可能跟机器学习的过程也是一样的。

;