您当前所在位置: 首页

论文收录信息

论文编号 201710-37
论文题目 基于SolrCloud的新闻事件查询与分析
文献类型
收录期刊

上传封面

中文期刊 英文期刊

期刊名称(中文)

期刊名称(英文)

年, 卷(

上传封面

中文专著 英文专著

书名(中文)

书名(英文)

出版地

出版社

出版年

上传封面

中文译著 英文译著

书名(中文)

书名(英文)

出版地

出版社

出版年

上传封面

中文论文集 英文论文集

编者 . 论文集名称(中文) [c].

出版地 出版社 出版年-

编者 . 论文集名称(英文) [c].

出版地 出版社 出版年-

上传封面

中文文献 英文文献

期刊名称(中文)

期刊名称(英文)

日期--

在线地址http://

上传封面

中文文献 英文文献

文题(中文)

文题(英文)

出版地

出版社, 出版日期--

上传封面

中文文献 英文文献

文题(中文)

文题(英文)

出版地

出版社, 出版日期--

后印本*

(请提交PDF文档)

基于SolrCloud的新闻事件查询与分析

引用

复制文本

导出参考文献

.txt .ris .doc

韩名豪

韩名豪(1991-),男,研究方向:大数据

潘维民

潘维民(1969-),硕导,研究方向:大数据、金融工程、航运信息

发送私信

发送给

北京邮电大学计算机学院,北京100876

摘要:新闻, 作为传播信息与记录社会的知识,一直以来都是人类生活中的重要信息来源。一般来说,过时的新闻便会被人们遗忘在角落。但是随着社会发展,信息量成爆炸式增长,人们不仅仅需要从海量的新闻数据中搜寻到自己感兴趣的信息,还需要从巨大的历史新闻库中发掘新的价值。而本次设计实现的新闻事件分析服务系统正是用来帮助人们做这件事情的,实验数据源来自于 GDELT:一个庞大的新闻事件数据集,迄今为止大约有四亿六千多万条数据。传统的 MySQL体系无法承载如此海量数据的实时存储和搜索,而解决这个难题的办法就是运用Spark、Solr这样的分布式大数据解决方案。

关键词: 新闻事件分析 大数据 分布式存储 Solr搜索引擎

图表:

动态公开评议

评论

评论一下

全部评论
评论