linux基础使用
安装conda环境
Conda是一个开源的软件包管理系统和环境管理系统,用于构建、分享和管理软件环境。它最初是为Python开发的,但现在已经扩展到其他编程语言和工具。
Conda的核心功能是创建和管理虚拟环境。虚拟环境是一个独立的、隔离的环境,其中包含特定版本的软件包和依赖项。这使得不同项目之间的软件包和依赖项可以相互独立地存在,而不会产生冲突。使用虚拟环境可以帮助您在不同的项目之间轻松地切换,并确保每个项目都使用正确的软件版本。
Conda还提供了一个强大的软件包管理系统。它拥有一个广泛的软件包仓库,您可以从中选择和安装各种开源软件包。Conda可以自动解决依赖项,确保您安装的软件包与其所需的依赖项兼容。此外,Conda还可以管理软件包的更新、升级和删除。
除了软件包管理和环境管理外,Conda还提供了其他一些有用的功能,例如创建交叉平台的可执行文件、共享环境和软件包、创建可重复的分析工作流等。
Conda有两个主要的分发版本:Anaconda和Miniconda。Anaconda是一个完整的数据科学平台,包含了大量的数据科学工具和库。而Miniconda则是一个精简的版本,只包含Conda和一些基本的依赖项,可以根据需要进行定制安装。
打开终端 -> 下载软件包 -> 安装,指定安装位置 -> 配置镜像
- 切换到工作目录下(打开终端)
- 使用下面的命令(下载安装包)
- 在当前文件夹下创建software文件夹用于存储下载的软件。
- 国内镜像参考,选取适合的国内镜像选取需要下载的软件包,并进入archive文件夹下选取适合的版本复制链接,在服务器上使用
wget
命令下载
mkdir ./software && cd ./software/
wget -c https://mirrors.aliyun.com/anaconda/archive/Anaconda3-2023.07-1-Linux-x86_64.sh
3. 安装,指定安装位置
- 使用bash命令安装下载好的conda软件包
bash Anaconda3-2023.07-1-Linux-x86_64.sh
一路回车,yes下去吧。如果想把conda安装到指定目录,当系统问你想把conda安装到哪个时,直接输入路径即可。
- 测试一下conda是否安装好,激活conda,调出conda 帮助信息
source ~/.bashrc
conda --help
- 配置镜像
因为在国内,从conda默认的软件源下载速度非常慢。所以需要国内的镜像软件资源加到conda的配置中。一般就用清华的镜像(其实就是把链接地址写到某个指定的文本中的过程)。
conda config --add channels https://mirrors.aliyun.com/anaconda/pkgs/free
conda config --add channels https://mirrors.aliyun.com/anaconda/cloud/conda-forge
conda config --add channels https://mirrors.aliyun.com/anaconda/cloud/bioconda
conda config --set show_channel_urls yes #设置搜索时显示通道地址
- 选取适合的Python版本来新建conda环境
- conda命令大全
conda create --name myenv python=3.6 //创建虚拟环境
conda activate myenv //激活虚拟环境
conda deactivate //退出虚拟环境
安装数据处理所需的分析软件
数据解压
- SRAtoolkit工具下载
SRA Toolkit是由美国国家生物技术信息中心(NCBI)开发的一组工具,用于处理和分析SRA(Sequence Read Archive)数据。SRA Toolkit提供了一系列命令行工具,可以从NCBI的SRA数据库中下载、转换、处理和分析高通量测序数据。
conda install -c bioconda sra-tools
数据质控
- FastQC下载
FastQC是一款基于Java的软件,一般都是在linux环境下使用命令行运行,它可以快速多线程地对测序数据进行质量评估。
conda install fastqc