博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
scikit-learn学习日记(2)
阅读量:5019 次
发布时间:2019-06-12

本文共 1711 字,大约阅读时间需要 5 分钟。

忙着看论文好几天没看scikit-learn了,接着看Tutorials

首先是一个KNN分类的例子,KNN思路还是很简单的,是一种不需要建模的算法,就是看离需要预测点最近的k个点,k个点中属于哪类的最多就属于哪类

1 import numpy as np 2 from sklearn import datasets 3 iris = datasets.load_iris() 4 iris_X = iris.data 5 iris_y = iris.target 6 # Split iris data in train and test data 7 # A random permutation, to split the data randomly 8 np.random.seed(0) 9 indices = np.random.permutation(len(iris_X))10 iris_X_train = iris_X[indices[:-10]]11 iris_y_train = iris_y[indices[:-10]]12  iris_X_test = iris_X[indices[-10:]]13 iris_y_test = iris_y[indices[-10:]]14  # Create and fit a nearest-neighbor classifier15 from sklearn.neighbors import KNeighborsClassifier16 knn = KNeighborsClassifier()17 knn.fit(iris_X_train, iris_y_train)18 knn.predict(iris_X_test)19 iris_y_test

接下来是线性回归的模型,线性回归一般都是以均方差为目标函数,使用批梯度下降或者随机梯度下降不断调整参数减小均方差直到误差满足要求,

regr.coef_是线性回归中的参数列表,regr.score计算自变量和因变量的相关程度

1 from sklearn import datasets 2 import numpy as np 3 diabetes = datasets.load_diabetes() 4 diabetes_X_train = diabetes.data[:-20] 5 diabetes_X_test = diabetes.data[-20:] 6 diabetes_y_train = diabetes.target[:-20] 7 diabetes_y_test = diabetes.target[-20:] 8 from sklearn import linear_model 9 regr = linear_model.LinearRegression()10 regr.fit(diabetes_X_train, diabetes_y_train)11 print(regr.coef_)12 # The mean square error13 np.mean((regr.predict(diabetes_X_test)-diabetes_y_test)**214) 14 regr.score(diabetes_X_test, diabetes_y_test)

岭回归是最小二乘法的改良版,具体思路参考:

1 alphas = np.logspace(-4, -1, 6)2 from __future__ import print_function3 print([regr.set_params(alpha=alpha\4 ).fit(diabetes_X_train, diabetes_y_train,\5 ).score(diabetes_X_test, diabetes_y_test) for alpha in alphas])

 

转载于:https://www.cnblogs.com/heyijiang666/p/5034718.html

你可能感兴趣的文章
【软件测试】实现Editing Boxing并测试
查看>>
SQL Server-聚焦NOT EXISTS AND NOT IN性能分析(十五)
查看>>
linux 中 timeval结构体
查看>>
第五周笔记
查看>>
POJ 1815 Friendship(字典序最小的最小割)
查看>>
FZU Super A^B mod C(欧拉函数降幂)
查看>>
【BZOJ1179】 [Apio2009]Atm tarjan缩点+SPFA
查看>>
初步了解Maven
查看>>
WebStorm常用设置和常用快捷键
查看>>
英文词频统计预备,组合数据类型练习
查看>>
hibernate核心思想 体系结构(转)
查看>>
Amazon Route 53 路由到不同资源的配置差异
查看>>
Python 一些有趣的技巧,包括协程例
查看>>
数据持久化
查看>>
Java并发性和多线程介绍目录
查看>>
codeforces #322 div 2 A. Vasya the Hipster(随便搞)
查看>>
Ubuntu下执行mysql的sql文件
查看>>
JavaScript 声明全局变量和局部变量
查看>>
侯捷C++11:一致性初始化
查看>>
UVa 712 - S-Trees
查看>>