0%

近邻法是一种基本分类与回归方法(这里只讨论分类问题)。 近邻法通过训练样本对特征空间进行划分,形成模型,之后对新的实例,根据与其最近的 个实例的类别,通过多数表决等方式进行预测,即这 个实例的多数属于某个类,那么这个新的实例就被分为这个类。

阅读全文 »

感知机是二类分类的线性分类模型,即输出为 二值,属于判别模型。感知机学习旨在将训练数据进行线性划分,有简单易实现的优点。感知机算法分为原始形式和对偶形式。

阅读全文 »

最近打算系统地归纳一下 ISO 27000 中信息安全管理制度(ISMS)系列标准(以下简称 ISMS 系列标准)。这个系列是欧洲的信息安全管理标准,其中 27000 是这个系列的综述(或者前导),里面包含了对系列中各个标准的介绍和对信息安全管理(ISM)中术语的定义;27001 (还有 27006,27009)是这个系列的主要标准,即 requirement standards,可以理解为必须要遵循的标准;27002 ~ 27005 等标准属于 guideline standards,即对一些安全管理方面流程的指导准则;其他就是一些针对特定方面的指导标准。我会主要关注 ISO 27001,27002 和 27005,其他的标准如果以后涉及会再做补充。

阅读全文 »

Xgboost 是一套提升树可扩展性的机器学习系统,它的算法原理就是将多棵树的预测结果相加得到最终预测结果。之前看了一些博客和视频教程,看完还是一头雾水,最后还是看了原论文才终于有了点头绪。

阅读全文 »

决策树是机器学习中的一个预测模型,它表示对象属性和对象值之间的一种映射。树中的每一个非叶子节点(决策点)表示对象属性的判断条件,其分支表示符合节点条件的对象。树的叶子节点表示对象所属的预测结果。

阅读全文 »

机器学习的一般步骤是:训练样本 - 特征抽取 - 学习函数 - 预测。其中,为了使模型型获得更多训练,预测和学习函数是在不断循环的。

机器学习的问题可以分为两种类型:分类问题预测问题。分类模型是将数据最终归于某一个类型,而预测模型的结果更多的是一个具体数值。这里先讲一讲机器学习中经典的回归算法。

阅读全文 »