您当前所在位置: 首页 > 学者

周水庚

  • 9浏览

  • 0点赞

  • 0收藏

  • 0分享

  • 33下载

  • 0评论

  • 引用

期刊论文

一种新的基于kNN和Rocchio的文本分类方法

周水庚张政周傲英

计算机研究与发展,2004,41(S1):226~230,-0001,():

URL:

摘要/描述

自动文本分类技术是一种对电子文档进行管理的有效方法,到现在为止,国内外学者提出了许多文本分类的方法,其中kNN和Rocchio是两种比较常见的方法。kNN的特点是有很好的分类效果,但是分类的效率比较差;而Rocchi。的特点是有很好的分类效率,但是分类效果却不理想。首先对kNN和Rocchio的算法进行深入的研究和比较,然后提出了一种新的基于kNN和Rocchio的文本分类方法,命名为Rocchi>kNN方法。这种分类方法先用Rocchio为测试文档产生候选类别,然后再用kNN从候选类别中为测试文档选择出最终类别。这种方法既有kNN分类效果好的特点,又有接近Rocchio的分类效率。同时,还研究了用两种不同的方法来决定候选类别的数目。在中文文档库上的实验表明,新的文本分类方法的效果比单独的kNN和Rocchio的效果都要好,同时分类效率要比kNN好并且接近Rocchio。

关键词: 文本分类 Rocchio kNN Rocchio-k-NN

版权说明:以下全部内容由周水庚上传于   2010年12月08日 14时53分12秒,版权归本人所有。

我要评论

全部评论 0

本学者其他成果

    同领域成果