您当前所在位置: 首页 > 学者

周水庚

  • 60浏览

  • 0点赞

  • 0收藏

  • 0分享

  • 33下载

  • 0评论

  • 引用

期刊论文

一种新的基于kNN和Rocchio的文本分类方法

周水庚张政周傲英

计算机研究与发展,2004,41(S1):226~230,-0001,():

URL:

摘要/描述

自动文本分类技术是一种对电子文档进行管理的有效方法,到现在为止,国内外学者提出了许多文本分类的方法,其中kNN和Rocchio是两种比较常见的方法。kNN的特点是有很好的分类效果,但是分类的效率比较差;而Rocchi。的特点是有很好的分类效率,但是分类效果却不理想。首先对kNN和Rocchio的算法进行深入的研究和比较,然后提出了一种新的基于kNN和Rocchio的文本分类方法,命名为Rocchi>kNN方法。这种分类方法先用Rocchio为测试文档产生候选类别,然后再用kNN从候选类别中为测试文档选择出最终类别。这种方法既有kNN分类效果好的特点,又有接近Rocchio的分类效率。同时,还研究了用两种不同的方法来决定候选类别的数目。在中文文档库上的实验表明,新的文本分类方法的效果比单独的kNN和Rocchio的效果都要好,同时分类效率要比kNN好并且接近Rocchio。

关键词: 文本分类 Rocchio kNN Rocchio-k-NN

【免责声明】以下全部内容由[周水庚]上传于[2010年12月08日 14时53分12秒],版权归原创者所有。本文仅代表作者本人观点,与本网站无关。本网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

我要评论

全部评论 0

本学者其他成果

    同领域成果