转录组自动化分析流程搭建及使用

这次分析流程搭建使用基于Nextflow 的 nf-core,该工具可以实现自动化的转录组上游分析。

安装

下载最新版:https://github.com/nextflow-io/nextflow/releases

我安装时最新版为 nextflow-21.04.0-edge-all

wegt https://github.com/nextflow-io/nextflow/releases/download/v21.04.0-edge/nextflow-21.04.0-edge-all
mv nextflow-21.04.0-edge-all nextflow

安装 nf-core rnaseq

可以使用Git clone,也可以下载好解压到流程目录

官网:https://nf-co.re/rnaseq

GitHub:https://github.com/nf-core/rnaseq

安装aws

curl "https://awscli.amazonaws.com/awscli-exe-linux-x86_64.zip" -o "awscliv2.zip"
unzip awscliv2.zip
sudo ./aws/install

下载参考基因组

aws s3 --no-sign-request --region eu-west-1 sync s3://ngi-igenomes/igenomes/Homo_sapiens/Ensembl/GRCh37/Annotation/Genes/ ./references/Homo_sapiens/Ensembl/GRCh37/Annotation/Genes/ --exclude "*" --include "genes.gtf"
aws s3 --no-sign-request --region eu-west-1 sync s3://ngi-igenomes/igenomes/Homo_sapiens/Ensembl/GRCh37/Sequence/WholeGenomeFasta/ ./references/Homo_sapiens/Ensembl/GRCh37/Sequence/WholeGenomeFasta/
aws s3 --no-sign-request --region eu-west-1 sync s3://ngi-igenomes/igenomes/Homo_sapiens/Ensembl/GRCh37/Sequence/STARIndex/ ./references/Homo_sapiens/Ensembl/GRCh37/Sequence/STARIndex/
aws s3 --no-sign-request --region eu-west-1 sync s3://ngi-igenomes/igenomes/Homo_sapiens/Ensembl/GRCh37/Sequence/BWAIndex/ ./references/Homo_sapiens/Ensembl/GRCh37/Sequence/BWAIndex/
aws s3 --no-sign-request --region eu-west-1 sync s3://ngi-igenomes/igenomes/Homo_sapiens/Ensembl/GRCh37/Sequence/Bowtie2Index/ ./references/Homo_sapiens/Ensembl/GRCh37/Sequence/Bowtie2Index/
aws s3 --no-sign-request --region eu-west-1 sync s3://ngi-igenomes/igenomes/Homo_sapiens/Ensembl/GRCh37/Annotation/Genes/ ./references/Homo_sapiens/Ensembl/GRCh37/Annotation/Genes/ --exclude "*" --include "genes.bed"

https://ewels.github.io/AWS-iGenomes/

测试数据

数据来源GSE101571

构建测试数据信息表,rnaseq-test.csv

group,replicate,fastq_1,fastq_2,strandedness
2cell,1,/data/baimoc/data/rnaseq-test/SRR5837392_1.fastq.gz,/data/baimoc/data/rnaseq-test/SRR5837392_2.fastq.gz,unstranded
2cell,1,/data/baimoc/data/rnaseq-test/SRR5837393_1.fastq.gz,/data/baimoc/data/rnaseq-test/SRR5837393_2.fastq.gz,unstranded
8cell,1,/data/baimoc/data/rnaseq-test/SRR5837402_1.fastq.gz,/data/baimoc/data/rnaseq-test/SRR5837402_2.fastq.gz,unstranded
8cell,1,/data/baimoc/data/rnaseq-test/SRR5837403_1.fastq.gz,/data/baimoc/data/rnaseq-test/SRR5837403_2.fastq.gz,unstranded

项目目录

mark

启动流程

../../nextflow run ../../rnaseq --input /data/baimoc/data/rnaseq-test/rnaseq-test.csv --genome GRCh37 --igenomes_base /data/baimoc/references/ -profile docker
白墨石 CSDN认证博客专家 生物信息学 CSDN博客专家 知乎专栏作家
生物信息学在读博士,主要研究生信流程自动化,生物序列分析,web应用及数据库搭建。
联系方式在左栏,欢迎学习交流,咨询提问 ^.^
已标记关键词 清除标记
相关推荐
程序员的必经之路! 【限时优惠】 现在下单,还享四重好礼: 1、教学课件免费下载 2、课程案例代码免费下载 3、专属VIP学员群免费答疑 4、下单还送800元编程大礼包 【超实用课程内容】  根据《2019-2020年中国开发者调查报告》显示,超83%的开发者都在使用MySQL数据库。使用量大同时,掌握MySQL早已是运维、DBA的必备技能,甚至部分IT开发岗位也要求对数据库使用和原理有深入的了解和掌握。 学习编程,你可能会犹豫选择 C++ 还是 Java;入门数据科学,你可能会纠结于选择 Python 还是 R;但无论如何, MySQL 都是 IT 从业人员不可或缺的技能!   套餐中一共包含2门MySQL数据库必学的核心课程(共98课时)   课程1:《MySQL数据库从入门到实战应用》   课程2:《高性能MySQL实战课》   【哪些人适合学习这门课程?】  1)平时只接触了语言基础,并未学习任何数据库知识的人;  2)对MySQL掌握程度薄弱的人,课程可以让你更好发挥MySQL最佳性能; 3)想修炼更好的MySQL内功,工作中遇到高并发场景可以游刃有余; 4)被面试官打破沙锅问到底的问题问到怀疑人生的应聘者。 【课程主要讲哪些内容?】 课程一:《MySQL数据库从入门到实战应用》 主要从基础篇,SQL语言篇、MySQL进阶篇三个角度展开讲解,帮助大家更加高效的管理MySQL数据库。 课程二:《高性能MySQL实战课》主要从高可用篇、MySQL8.0新特性篇,性能优化篇,面试篇四个角度展开讲解,帮助大家发挥MySQL的最佳性能的优化方法,掌握如何处理海量业务数据和高并发请求 【你能收获到什么?】  1.基础再提高,针对MySQL核心知识点学透,用对; 2.能力再提高,日常工作中的代码换新貌,不怕问题; 3.面试再加分,巴不得面试官打破沙锅问到底,竞争力MAX。 【课程如何观看?】  1、登录CSDN学院 APP 在我的课程中进行学习; 2、移动端:CSDN 学院APP(注意不是CSDN APP哦)  本课程为录播课,课程永久有效观看时长 【资料开放】 课件、课程案例代码完全开放给你,你可以根据所学知识,自行修改、优化。  下载方式:电脑登录课程观看页面,点击右侧课件,可进行课程资料的打包下载。
©️2020 CSDN 皮肤主题: 成长之路 设计师:Amelia_0503 返回首页