书签分享收藏举报版权申诉 / 10

立即下载加入VIP,免费下载

当前位置：首页 > 农林牧渔 > 林学 > 最新分类KNN近邻法Word下载.docx

最新分类KNN近邻法Word下载.docx

文档编号：14829433
上传时间：2022-10-25
格式：DOCX
页数：10
大小：292.42KB

《最新分类KNN近邻法Word下载.docx》由会员分享，可在线阅读，更多相关《最新分类KNN近邻法Word下载.docx（10页珍藏版）》请在冰豆网上搜索。

最新分类KNN近邻法Word下载.docx

4）确定前k个点所在类别的出现频率；

5）返回前k个点出现频率最高的类别作为当前点的预测分类。

二、Python实现

对于机器学习而已，Python需要额外安装三件宝，分别是Numpy，scipy和Matplotlib。

前两者用于数值计算，后者用于画图。

安装很简单，直接到各自的官网下载回来安装即可。

安装程序会自动搜索我们的python版本和目录，然后安装到python支持的搜索路径下。

反正就python和这三个插件都默认安装就没问题了。

另外，如果我们需要添加我们的脚本目录进Python的目录（这样Python的命令行就可以直接import），可以在系统环境变量中添加：

PYTHONPATH环境变量，值为我们的路径，例如：

E:

\Python\MachineLearninginAction

2.1、kNN基础实践

一般实现一个算法后，我们需要先用一个很小的数据库来测试它的正确性，否则一下子给个大数据给它，它也很难消化，而且还不利于我们分析代码的有效性。

首先，我们新建一个kNN.py脚本文件，文件里面包含两个函数，一个用来生成小数据库，一个实现kNN分类算法。

代码如下：

[python]

1.#########################################

2.#

kNN:

k

Nearest

Neighbors

3.

4.#

Input:

newInput:

vector

to

compare

existing

dataset

（1xN）

5.#

dataSet:

size

m

data

set

of

known

vectors

（NxM）

6.#

labels:

labels

（1xM

vector）

7.#

k:

number

neighbors

use

for

comparison

8.

9.#

Output:

the

most

popular

class

label

10.#########################################

11.

12.from

numpy

import

*

13.import

operator

14.

15.#

create

a

which

contains

4

samples

with

2

classes

16.def

createDataSet（）:

17.

#

matrix:

each

row

as

sample

18.

group

=

array（[[1.0,

0.9],

[1.0,

1.0],

[0.1,

0.2],

[0.0,

0.1]]）

19.

['

A'

'

B'

]

four

and

two

20.

return

group,

21.

22.#

classify

using

kNN

23.def

kNNClassify（newInput,

dataSet,

labels,

k）:

24.

numSamples

dataSet.shape[0]

shape[0]

stands

num

25.

26.

##

step

1:

calculate

Euclidean

distance

27.

tile（A,

reps）:

Construct

an

array

by

repeating

A

reps

times

28.

following

copy

rows

dataSet

29.

diff

tile（newInput,

（numSamples,

1））

-

Subtract

element-wise

30.

squaredDiff

**

squared

subtract

31.

squaredDist

sum（squaredDiff,

axis

1）

sum

is

performed

32.

0.5

33.

34.

2:

sort

35.

argsort（）

returns

indices

that

would

in

ascending

order

36.

sortedDistIndices

argsort（distance）

37.

38.

classCount

{}

define

dictionary

（can

be

append

element）

39.

i

xrange（k）:

40.

3:

choose

min

41.

voteLabel

labels[sortedDistIndices[i]]

42.

43.

4:

count

occur

44.

when

key

not

classCount,

get（）

45.

will

0

46.

classCount[voteLabel]

classCount.get（voteLabel,

0）

+

1

47.

48.

5:

max

voted

49.

maxCount

50.

key,

value

classCount.items（）:

51.

if

>

maxCount:

52.

53.

maxIndex

54.

55.

然后我们在命令行中这样测试即可：

1.import

2.from

4.dataSet,

kNN.createDataSet（）

5.

6.testX

array（[1.2,

1.0]）

7.k

3

8.outputLabel

kNN.kNNClassify（testX,

3）

9.print

"

Your

input

is:

testX,

classified

class:

outputLabel

10.

11.testX

array（[0.1,

0.3]）

12.outputLabel

13.print

这时候会输出：

1.Your

[

1.2

1.0]

2.Your

0.1

0.3]

B

2.2、kNN进阶

这里我们用kNN来分类一个大点的数据库，包括数据维度比较大和样本数比较多的数据库。

这里我们用到一个手写数字的数据库，可以到下载。

这个数据库包括数字0-9的手写体。

每个数字大约有200个样本。

每个样本保持在一个txt文件中。

手写体图像本身的大小是32x32的二值图，转换到txt文件保存后，内容也是32x32个数字，0或者1，如下：

数据库解压后有两个目录：

目录trainingDigits存放的是大约2000个训练数据，testDigits存放大约900个测试数据。

这里我们还是新建一个kNN.py脚本文件，文件里面包含四个

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 最新分类 KNN 近邻

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：最新分类KNN近邻法Word下载.docx
链接地址：https://www.bdocx.com/doc/14829433.html

最新分类KNN近邻法Word下载.docx

热门标签