内容简介:在过去几年里,研究发现LGC基于物种特异性模型和人类模型性能研究
在过去几年里,研究发现 long non-coding RNAs (lncRNAs)
在疾病和生物调控过程中扮演着重要角色。但在大量非模式物种中lncRNA的鉴定仍是一项富有挑战性的工作。该工作需要确定的序列信息,注释信息以及构建物种特有的训练集,但具有lncRNA研究所需的足够完整的序列与注释的物种只占很少数。 LGC是由北京基因组所基于 python 2 ( Python极简教程(一) )开发的一款快速lncRNA预测工具,该 工具 通过 ORF
(开放阅读框)长度和 G
C含量间的关系进行相关运算来鉴定lncRNA。LGC最大特点是能够基于 跨物种策略 进行lncRNA发掘。因此LGC可以支持 有参数据 和 无参数据 ( 无参转录组分析工具评估和流程展示 )进行 lncRNA
鉴定。在区分从植物到哺乳动物的不同物种的lncRNA和蛋白编码RNA方面,LGC鉴定的准确率高达 90% 。
LGC基于物种特异性模型和人类模型性能研究
LGC与现有常见lncRNA鉴定工具准确性敏感性特异性评估
LGC提供了在线服务器版和Linix/Unix本地版 ( 如果您也开发了软件,希望同时做个线上版,欢迎联系我们开发,专业服务,质优价廉,也投个核酸研究 )
Webserver
(http://bigd.big.ac.cn/lgc/calculator)
漂亮简洁的应用页面,只需要 fasta
(无参有参数据都可用)序列就可以进行 lncRNA
鉴定(可以直接粘贴自己感兴趣的序列或上传fasta文件(文件小于100MB)进行批量鉴定)。另外对人类,果蝇,小鼠,斑马鱼四个物种可以通过上传BED(小于3MB)或GTF(小于3MB)格式文件进行lncRNA挖掘。 生信分析过程中这些常见文件的格式以及查看方式你都知道吗?
本地运行
当然,网页版在速度与通量上仍有一定的局限性(对原始fasta数据库的拆分,再逐批上传鉴定真的好麻烦)。如果分析的数据比较多,可以在 linux
服务器搭建本地版本进行全库的LncRNA检索。 (不熟悉Linux,来看看 免费 Linux 系统和生信宝典原创学习教程 )
在构建本地版的LGC时,LGC官网推荐的安装流程是先安装 python2
和 biopython
,但我个人习惯使用 anaconda2
以及其下的 bioconda
( 解决生物软件安装烦恼 ),可以大大简化安装过程和更好的解决依赖性问题(conda install 想补什么补什么, Linux - Conda软件安装方法 )。
命令如下
wget http://bigd.big.ac.cn/biocode/tools/4/releases/1.0/file/download?filename=lgc-1.0.tar.gz tar zxf lgc-1.0.tar.gz chmod 755 lgc-1.0.py #确保conda,lgc-1.0.py在环境变量里 lgc-1.0.py input.fasta output.txt # Or python lgc-1.0.py input.fasta output.txt
结果文件各列的意义
Sequence Name | 序列名称 |
ORF Length | 开放阅读框长度 |
GC Content | GC含量 |
Conding Potential Score | 编码潜在评分:编码转录物的潜在评分,如果大于0,则为蛋白质编码RNA;如果小于0,则为ncRNA。“0”表示mRNA与lncRNA概率相同 |
Coding Label | 编码类别 |
pc | 编码序列的概率 |
pnc | 非编码序列的概率 |
fc | 编码序列的终止密码子概率 |
fnc | 非编码序列的终止密码子概率 |
这样,我们就可以通过设置合理的筛选条件,来筛得感兴趣的lncRNA进行后续的研究,比如:
- DESeq2差异基因分析和批次效应移除
- WGCNA分析,简单全面的最新教程
- 基因共表达聚类分析和可视化
- GO、GSEA富集分析一网打进
- GSEA富集分析 - 界面操作
- 无需写代码的高颜值富集分析神器
- 去东方,最好用的在线 GO 富集分析工具
参考资料:
- Wang G, Yin H, Li B, et al. Characterization and identification of long non-coding RNAs based on feature relationship[J]. bioRxiv, 2018: 327882.
- 生信宝典: Nature Method:Bioconda解决生物软件安装的烦恼
- 生信宝典: Linux学习-环境变量和可执行属性
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- 联想回应“反对预装国产系统”消息:谣言,一直支持国产
- 倪光南:国产不等于落后,国产自主可替代计划切实可行
- 这一年,国产技术不断突破
- 国产化速度加快 安防企业踏上“芯”征程
- 俄致力打造国产神经网络处理器
- 国产开源 GUI 引擎 AWTK 1.1 发布
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Head First Design Patterns
Elisabeth Freeman、Eric Freeman、Bert Bates、Kathy Sierra、Elisabeth Robson / O'Reilly Media / 2004-11-1 / USD 49.99
You're not alone. At any given moment, somewhere in the world someone struggles with the same software design problems you have. You know you don't want to reinvent the wheel (or worse, a flat tire),......一起来看看 《Head First Design Patterns》 这本书的介绍吧!