网格细分的原理其实并不难理解,它的难点主要在于如何实现。在看过无数有原理无代码的博客后,终于决定写一写我的实现方法,并附上代码供大家参考。c++写的可能比较笨拙,望见谅。
朴素贝叶斯 Naive-Bayes
参考文献
[1] 《统计学习方法(第二版)》李航
k 近邻法 k-NN
近邻法是一种基本分类与回归方法(这里只讨论分类问题)。 近邻法通过训练样本对特征空间进行划分,形成模型,之后对新的实例,根据与其最近的 个实例的类别,通过多数表决等方式进行预测,即这 个实例的多数属于某个类,那么这个新的实例就被分为这个类。
感知机 Perceptron
感知机是二类分类的线性分类模型,即输出为 和 二值,属于判别模型。感知机学习旨在将训练数据进行线性划分,有简单易实现的优点。感知机算法分为原始形式和对偶形式。
ISO 27000
最近打算系统地归纳一下 ISO 27000 中信息安全管理制度(ISMS)系列标准(以下简称 ISMS 系列标准)。这个系列是欧洲的信息安全管理标准,其中 27000 是这个系列的综述(或者前导),里面包含了对系列中各个标准的介绍和对信息安全管理(ISM)中术语的定义;27001 (还有 27006,27009)是这个系列的主要标准,即 requirement standards,可以理解为必须要遵循的标准;27002 ~ 27005 等标准属于 guideline standards,即对一些安全管理方面流程的指导准则;其他就是一些针对特定方面的指导标准。我会主要关注 ISO 27001,27002 和 27005,其他的标准如果以后涉及会再做补充。
数据安全能力建设 Capacity-building for Data Security
在 Freebuf 上看到的一篇文章,作者系统地介绍了数据安全的整体架构与一些细节,从各个方面描述了数据安全需要掌握的能力。我认为对于理解数据安全和规划数据安全的路线很有帮助,所以做了一张思维导图,供学习参考。
Xgboost
Xgboost 是一套提升树可扩展性的机器学习系统,它的算法原理就是将多棵树的预测结果相加得到最终预测结果。之前看了一些博客和视频教程,看完还是一头雾水,最后还是看了原论文才终于有了点头绪。
贝叶斯算法 Bayesian Classfier
贝叶斯算法是一种分类算法,用于解决逆向概率(逆概)的问题。
决策树 Decision Tree
决策树是机器学习中的一个预测模型,它表示对象属性和对象值之间的一种映射。树中的每一个非叶子节点(决策点)表示对象属性的判断条件,其分支表示符合节点条件的对象。树的叶子节点表示对象所属的预测结果。
回归算法 Regression Algorithm
机器学习的一般步骤是:训练样本 - 特征抽取 - 学习函数 - 预测。其中,为了使模型型获得更多训练,预测和学习函数是在不断循环的。
机器学习的问题可以分为两种类型:分类问题和预测问题。分类模型是将数据最终归于某一个类型,而预测模型的结果更多的是一个具体数值。这里先讲一讲机器学习中经典的回归算法。