您当前所在位置: 首页 > 首发论文
动态公开评议须知

1. 评议人本着自愿的原则,秉持科学严谨的态度,从论文的科学性、创新性、表述性等方面给予客观公正的学术评价,亦可对研究提出改进方案或下一步发展的建议。

2. 论文若有勘误表、修改稿等更新的版本,建议评议人针对最新版本的论文进行同行评议。

3. 每位评议人对每篇论文有且仅有一次评议机会,评议结果将完全公示于网站上,一旦发布,不可更改、不可撤回,因此,在给予评议时请慎重考虑,认真对待,准确表述。

4. 同行评议仅限于学术范围内的合理讨论,评议人需承诺此次评议不存在利益往来、同行竞争、学术偏见等行为,不可进行任何人身攻击或恶意评价,一旦发现有不当评议的行为,评议结果将被撤销,并收回评审人的权限,此外,本站将保留追究责任的权利。

5. 论文所展示的星级为综合评定结果,是根据多位评议人的同行评议结果进行综合计算而得出的。

勘误表

上传勘误表说明

  • 1. 请按本站示例的“勘误表格式”要求,在文本框中编写勘误表;
  • 2. 本站只保留一版勘误表,每重新上传一次,即会覆盖之前的版本;
  • 3. 本站只针对原稿进行勘误,修改稿发布后,不可对原稿及修改稿再作勘误。

示例:

勘误表

上传勘误表说明

  • 1. 请按本站示例的“勘误表格式”要求,在文本框中编写勘误表;
  • 2. 本站只保留一版勘误表,每重新上传一次,即会覆盖之前的版本;
  • 3. 本站只针对原稿进行勘误,修改稿发布后,不可对原稿及修改稿再作勘误。

示例:

上传后印本

( 请提交PDF文档 )

* 后印本是指作者提交给期刊的预印本,经过同行评议和期刊的编辑后发表在正式期刊上的论文版本。作者自愿上传,上传前请查询出版商所允许的延缓公示的政策,若因此产生纠纷,本站概不负责。

发邮件给 王小芳 *

收件人:

收件人邮箱:

发件人邮箱:

发送内容:

0/300

论文收录信息

论文编号 201904-211
论文题目 基于Faster RCNN的字幕文本检测方法
文献类型
收录
期刊

上传封面

期刊名称(中文)

期刊名称(英文)

年, 卷(

上传封面

书名(中文)

书名(英文)

出版地

出版社

出版年

上传封面

书名(中文)

书名(英文)

出版地

出版社

出版年

上传封面

编者.论文集名称(中文) [c].

出版地 出版社 出版年-

编者.论文集名称(英文) [c].

出版地出版社 出版年-

上传封面

期刊名称(中文)

期刊名称(英文)

日期--

在线地址http://

上传封面

文题(中文)

文题(英文)

出版地

出版社,出版日期--

上传封面

文题(中文)

文题(英文)

出版地

出版社,出版日期--

英文作者写法:

中外文作者均姓前名后,姓大写,名的第一个字母大写,姓全称写出,名可只写第一个字母,其后不加实心圆点“.”,

作者之间用逗号“,”分隔,最后为实心圆点“.”,

示例1:原姓名写法:Albert Einstein,编入参考文献时写法:Einstein A.

示例2:原姓名写法:李时珍;编入参考文献时写法:LI S Z.

示例3:YELLAND R L,JONES S C,EASTON K S,et al.

上传修改稿说明:

1.修改稿的作者顺序及单位须与原文一致;

2.修改稿上传成功后,请勿上传相同内容的论文;

3.修改稿中必须要有相应的修改标记,如高亮修改内容,添加文字说明等,否则将作退稿处理。

4.请选择DOC或Latex中的一种文件格式上传。

上传doc论文   请上传模板编辑的DOC文件

上传latex论文

* 上传模板导出的pdf论文文件(须含页眉)

* 上传模板编辑的tex文件

回复成功!


  • 0

基于Faster RCNN的字幕文本检测方法

首发时间:2019-04-18

陈海鹏 1   

陈海鹏(1993-),男,硕士,模式识别

宋晴 1   

宋晴(1978-),女,副教授,模式识别与计算机视觉

  • 1、北京邮电大学自动化学院,北京 100876

摘要:视频中的字幕往往具有极强的语义信息,能够有效地帮助人们对视频内容进行理解和分析。本文旨在利用深度学习技术对视频图像中的字幕文本进行高速且准确的检测,从而高效地实现视频数据内容信息的获取,辅助从业人员进行海量视频数据的检索和分类。本文首先建立了视频字幕数据集,字符样本包含常用汉字6763类、英文字符26类等,充分考虑了样本的均衡性和泛化能力。之后,针对视频字幕检测的具体场景,选取Faster RCNN 检测框架,引入先验损失函数等方法提高了精度和召回率。最后完成了整体系统的串联与搭建,从视频读取到字幕帧截取,再到字幕文本行定位及文本内容检测,实现了端到端的视频输入到文本字符串输出过程。本文设计并实现了一个兼顾速度与精度的视频字幕检测系统,能够实现对视频字幕文本的实时定位与识别。最终文本检测精度和召回率都达到了99.5%,文本识别准确率为97.5%,整体检测速度达到45fps。

关键词: 人工智能 深度学习 字幕检测 文本定位

For information in English, please click here

Subtitle Text Detection Method based on Faster RCNN

Chen Haipeng 1   

陈海鹏(1993-),男,硕士,模式识别

Song Qing 1   

宋晴(1978-),女,副教授,模式识别与计算机视觉

  • 1、Department of Automation, Beijing University of Posts and Telecommunication, Beijing 100876

Abstract:Subtitles in videos often have strong semantic information, which can effectively help people understand and analyze video content. The purpose of this paper is to use deep learning technology to detect subtitle text in video image quickly and accurately, so as to achieve efficient and fast acquisition of video data content information, and to assist relevant practitioners in the retrieval and classification of massive video data. First, the corresponding video subtitle dataset is established. The character samples of the data set include 6763 common Chinese characters, 26 English characters, etc. The diversity, balance and generalization of the samples are fully considered. Second, aiming at the specific scene of video subtitle text detection, this paper chooses Faster RCNN detection framework, introduces transcendental loss function and other methods to improve accuracy and recall. Finally, the whole system\'s serial connection and construction are completed, from video reading to caption frame interception, then to caption text line positioning, text content detection, the end-to-end process from video input to text string output is achieved. A video subtitle detection system with both speed and accuracy is designed and implemented, which can realize real-time location and recognition of video subtitle text. The accuracy and recall rate of text detection have reached 99.5%, the top-1 accuracy rate of text recognition is 97.5%, and the overall detection speed is 45 fps.

Keywords: artificial intelligence deep learning subtitle detection text localization

Click to fold

点击收起

基金:

论文图表:

引用

导出参考文献

.txt .ris .doc
陈海鹏,宋晴. 基于Faster RCNN的字幕文本检测方法[EB/OL]. 北京:中国科技论文在线 [2019-04-18]. https://www.paper.edu.cn/releasepaper/content/201904-211.

No.****

同行评议

未申请同行评议

评论

全部评论

0/1000

勘误表

基于Faster RCNN的字幕文本检测方法