基于Lucene的微博分类和检索系统设计实现
首发时间:2011-09-05
摘要:随着信息技术的不断发展,文本信息正在以越来越快的速度产生和传播,那么对于文本的分类和检索就体现出越来越重要的作用。本文就是利用开源的全文检索引擎工具包Lucene对文本建立索引进行检索,并通过基于特征选择的VSM文本分类法对文本进行有效的分类。使得文本的查询效率和文本的分类准确度达到一个比较好的效果。
For information in English, please click here
Design of Lucene-based microblogging classification and retrieval system
Abstract:As information technology continues to evolve,more and more text messages are fast to produce and disseminate.Thus text classification and retrieval are playing an increasingly important role.This article is the use of open source Lucene search engine tool kit to search for text indexing.It use VSM-based text classification feature selection method for effective classification for text.
Keywords: Lucene Search engine Text Classfication Feature selection
基金:
论文图表:
引用
No.****
同行评议
共计0人参与
勘误表
基于Lucene的微博分类和检索系统设计实现
评论
全部评论0/1000