看深度学习如何发高分生信文章( 三 )


看深度学习如何发高分生信文章
文章图片
6、具有高归因值的剪接连接的表征
虽然很容易想象基因表达水平的变化如何驱动肿瘤发生 , 但解释剪接变化对疾病的影响并不那么简单 。 因此 , 作者试图预测具有高归因值的可变剪接连接如何影响蛋白质序列和功能 。
作者首先注意到 , 高归因连接被预测会破坏基因的readingframe(阅读框架) 。 先前的研究表明 , 替代剪接可以通过靶向无序区域来调节蛋白质蛋白质相互作用 。 因此 , 作者研究了与可变剪接连接上下游两个外显子相对应的肽序列的预测无序性 , 但发现预测的肽无序水平在高归因连接中与在集合中观察到的无差异 。
然后 , 使用NCBI保守结构域数据库 , 通过预测从高归因连接上游和下游的两个外显子编码的蛋白质结构域 , 评估高归因剪接连接是否会影响已知的蛋白质结构域 。 有趣的是 , 10个基因中的11个剪接连接会影响蛋白激酶C样超家族结构域的一部分转录本匹配序列(Fig.5) 。 作者还发现了额外的高归因剪接点 , 它们影响与癌症信号传导相关的其他结构域 。
看深度学习如何发高分生信文章
文章图片
7、在癌症中具有高正归因值或负归因值的基因的对比功能
对具有高归因值的蛋白质编码基因进行GO分析 , 发现具有高负归因值的蛋白质编码基因富含与转录、有丝分裂、组蛋白修饰、染色质调节和定位到中心体相关的功能 , 符合传统癌症观点 。 而具有高正归因值的蛋白质编码基因在转录后和翻译后修饰方面富集 。 同时 , 具有高归因值的剪接连接点的基因也富含与RNA加工相关的功能 。 另一方面 , 与生物学过程(BP)相关的富集图显示 , 通过表达或剪接的高正归因基因形成高度互连的网络 , 其核心与与RNA生物学相关的功能有关(Fig.6b) 。 与高归因基因相关的分子和细胞功能的IngenuityPathway分析证实 , 高负归因基因的功能与高正归因基因的功能不同 , 转录和RNA加工在两组中分别占据主导地位(Fig.6c) 。
看深度学习如何发高分生信文章
文章图片
最后 , 基因集富集分析揭示了高负归因值的基因富集在KRAS信号通路上 , 而通过表达或剪接具有高正属性的基因没有发现显着的富集(Fig.6d) 。 因此 , 虽然在癌症中具有高负归因值的基因具有已知癌基因和抑癌基因的功能 , 包括它们如何与基因组维持和转录有关 , 但通过表达或剪接具有高正归因的基因具有不同的功能 , 其中一些与RNA调控和RNA处理有关 。
结论
本篇文章通过训练一个深度学习的前馈神经网络 , 以使用转录组特征来区分正常和肿瘤样本 。 同时发现 , 使用lncRNA表达和剪接连接使用与使用蛋白质编码基因的表达数据训练的模型效能一致 。 总之 , 本篇文章为我们的研究提供一个新的思路 , 深度学习模型可以解决传统方法无法解决的问题 。
来源:生信人返回搜狐 , 查看更多
看深度学习如何发高分生信文章】责任编辑: