序列相似性对RNA结合蛋白预测的影响
引用华中科技大学物理学院,武汉,430074
摘要:结合RNA的蛋白质在多种细胞过程中起到重要作用,近些年一些预测RNA结合蛋白的计算方法应运而生。在预测方法中,正负样本的比例和序列相似性和都是众多方法中要考虑和权衡的。在这篇文章中,我们探讨了序列相似性在RNA结合蛋白预测的平衡数据集和非平衡数据集对预测准确性是否有影响。通过在序列相似性阈值分别为35%,30%,25%,20%,15%,10%和5%的平衡数据集和非平衡数据集的测试集上测试,我们的方法得到的ROC曲线下的面积值几乎不变。
同行评议
评论
评论一下
全部评论