导入测试数据集
这里使用scikit-learn自带的鸢尾花数据
import numpy as np
import matplotlib.pyplot as plt
from sklearn import...= shuffle_indexes[:test_size]
train_indexes = shuffle_indexes[test_size:]
# 使用fancy indexing 即可得到训练集和测试集数据...X 和 y 按照test_ratio分割成X_train, X_test, y_train, y_test"""
assert X.shape[0] == y.shape[0], \...2, 2, 1, 1, 1, 1, 1, 2, 2, 1, 0, 2, 1,
# 2, 1, 0, 0, 1, 2, 2, 0])
# 得到y_predict和y_test之后需要对其进行比较...准确率
sum(y_predict == y_test)/len(y_test)
# 1.0
使用scikit-learn中的train_test_split
scikit-learn中为我们封装好了分割数据集的方法