蛋白质结构和功能的研究是现代生物信息学中最重要的主题之一,研究蛋白质的结构与功能的关系对工农业和生物医药等领域都具有非常重要的意义。随着后基因组时代的到来,蛋白质的数据量急剧增长,传统的贝叶斯,K近邻,支持向量机(support vector machines,SVM)等预测方法已经不太适用基于神经网络的机器学习模型在大数据的情况下有更好的表现,本文针对蛋白质八类二级结构预测提出了一种Deep-BGRU模型。此模型将采用多层双向门控循环单元网络(gated recurrent unit,GRU)进行深度提取氨基酸的全局特征,然后通过softmax分类器进行蛋白质二级结构预测。较比于当前应用广泛的长短期记忆神经网络(long short-term memory,LSTM)模型和长短期记忆神经网络(long short-term memory,LSTM)的融合模型,Deep-BGRU模型除了改善传统的循环神经网络(recurrent neural network,RNN)的梯度消失无法处理极长依赖性的问题,还在蛋白质二级结构预测速度和预测结果精度上有着明显的提升。最后实验结果表明在基准数据集CB513上的Q8准确度达到了70.9%,与其他模型方法相比,提出的融合模型能够很好的提高蛋白质八类二级结构的预测精度,同时具有很好的扩展性。