基因学苑云服务器

计算,网络,存储一直是生物信息分析基础架构中最重要的三大件。2025年,我们花费巨资,采购了一条跨境网络专线,可以直接连接全球网络,无论是下载生物软件,还是下载生物数据都超级快。
我们的云平台从2015年开始运营,目前已经是第10个年头,已累积投入超过600余万元。目前拥有四个完整机柜,目前我们已有5480线程 CPU,45T内存,2PB磁盘空间。已有超过5000位用户使用过我们的云计算服务。

为什么选择我们的生物云计算平台?

在原有台服务器基础之上,最近我们又采购了三台设备。根据计算需求不同,我们提供11种配置可供选择,不同配置在CPU,内存和默认存储方面有所差别。

图 1: 同源基因云计算资源
  1. 国际专线网络,可以直接访问全球网络,下载生物数据更快更稳;
  2. 数据中心四台机柜,超30台Dell全新机器,算力充足;
  3. 全新Dell EMC服务器专业存储,多种方案保障数据安全;
  4. 开箱即用,无需等待采购时间,配置上架时间,以及部署软件时间;
  5. 超低价格,同等配置价格仅为公有云价格1/5到1/10;
  6. 全新超融合架构,具有高可用性,稳定且安全;
  7. 行业内第一个生物云平台,从2015到现在十年行业经验,更懂用户;
  8. 已配置大量常用生物软件和数据库,省去自己安装软件大量时间;
  9. 无需运维,将更多时间精力用于科研;
  10. 最新R运行环境。
  11. 专属答疑群,无需提交工单,群内及时响应需求;
  12. 提供GPU计算可供选择;

共享云服务器

在2015年全球最早推出共享生物云计算,截止到目前,我们的云平台已经平稳运营超过十年。服务超过5000多位用户。在原有服务器基础之上,最近我们又采购了大量计算设备。根据计算需求不同,目前我们可提供14种配置可供选择,不同配置在CPU,内存和默认存储方面有所差别。

A类型:少量样品RNAseq,16S,WGCNA,GEO表达分析,肿瘤panel等;

B类型:该配置是通用型配置,可以满足绝大部分生物云计算需求,例如基因组的拼接,人全基因组,外显子,单细胞分析等;

C类型:如果需要更多计算资源,需要更快时间完成计算,可以选择C类型,C类型用户较少,可以完成一些大型基因组的拼接,宏基因组的分析等。

D类型:旗舰配置,可以完成大型计算,例如一些超大基因组拼接,宏基因组拼接。

E类型:为GPU运算,可以完成机器学习,或者三代纳米孔测序碱基识别等;

V类型:主要服务于购买过教学视频用户,与其他服务器不同之处在于里包含了视频课程中全部案例数据,配合视频可以进行同步操作。也可以做一些小规模数据分析。

注释:计算资源具体消耗无法精确衡量,与数据量大小,计算类型,计算峰值,磁盘读写速度,软件算法都有很大关系,实际使用过程中越大的计算资源,理论上计算速度越快。

图 2: 生物云服务器2023配置与价格表

独享云服务器

如果是个人用户使用,可以选择我们的共享云服务器,更具有性价比。如果是一个课题使用,可以选择我们的独享云服务器。

图 3: 独享云服务器价格表

云服务器配置

图 4: 已安装大量软件

注意,不同的服务器内容有所差异,比如配置显卡的机器包含更多纳米孔数据分析相关内容。

R环境

我们的云服务器里已经配置了R语言的使用环境,并且安装了大量R的扩展包,用户可以直接使用。RNAseq和单细胞直接使用即可分析。

上传数据,直接分析

我们的生物云为用户解决了常用生物软件,生物数据库的配置问题。100M国际网络,可提供更快速网络数据上传和下载。这还不够,我们还为用户准备了大量软件使用脚本以及大量生物数据分析案例,在服务器里直接运行即可得到结果,省去自己准备数据的大量时间,可以快速掌握一项分析技能。

除了软件之外,我们还配置好了大量生物数据库,例如metamaps库,centrifuge库,最新nr,nt,blast索引,diamond索引,kraken索引,kraken2索引,metaphlan索引,humann索引等,省去大量下载数据时间。真正让您”上传数据,直接分析”。

图 5: R语言环境

内置bioconda

由于管理员安装的bioconda只能使用里面的软件,如果自己安装软件需要将bioconda安装到自己目录下, 这点不如rstudio-server方便。现在我们直接为用户安装好了bioconda。而且选择了mambaforge版本,这个版本可以直接使用mamba命令,使用更快。登录账户之后,直接使用即可,例如安装bwa以及samtools软件。只需要运行下面命令即可。

mamba install -n base -y bwa samtools

同时,我们还提供了一个超过700多行的软件安装命令。可以直接使用grep命令搜索需的软件,然后直接安装。软件列表包括了基因组拼接,rnaseq,单细胞测序,宏基因组,R语言,python语言等安装。

例如我们想要安装一个宏基因组分析的kraken2软件。

(base) wangtong 09:01:13 ~
$ grep "kraken2" mamba.sh 
mamba create -n kraken2 -y
mamba activate kraken2
mamba install -n kraken2 -y fastqc 
mamba install -n kraken2 -y fastp
mamba install -n kraken2 -y multiqc
mamba install -n kraken2 -y seqkit
mamba install -n kraken2 -y bowtie2 
mamba install -n kraken2 -y samtools
mamba install -n kraken2 -y krakentools
mamba install -n kraken2 -y kraken2
mamba install -n kraken2 -y bracken 
mamba install -n kraken2 -y krona

搜索到了,直接安装即可。为了便于管理,这里推荐大家多创建虚拟环境。否则当软件过多时相互之间会有依赖冲突。

#创建kraken2环境
mamba create -n kraken2 -y
#安装kraken2软件

mamba install -n kraken2 -y kraken2

更多软件,可以查看每个账户目录下的mamba.sh文件。老用户可以直接将该文件拷贝至个人目录下。

cp /ifs1/Software/mamba.sh ~
图 6: 生物软件安装脚本

常见问题

1.购买流程?

直接添加下面作者微信,确定型号,给一个用户名和邮箱开通账号,开通发票,具体发票信息请微信联系。

图 7: 购买微信

2.有流程吗?

没有流程,只提供计算资源,具体分析需要每个人独立完成。请有Linux操作经验的用户购买。本服务器主要用于真实数据分析,想学习Linux或者学习生物信息,请购买我们VIP,或者单独购买一些小的云服务器。

3.整台服务器一个人用吗?

我们的生物云属于共享模式,也就是多人共同使用,这样才能极大降低价格,充分利用资源,由于计算资源足够大,每个人都够用。每个人不能占据全部计算资源的一半。例如一共256线程,单个用户同时最多不超过128线程,这样错峰使用,大家可以同时流畅运行。

4.我的数据被别人拷贝走了怎么办?

每个用户都为普通用户,每个人的数据只有自己可以访问,相互之间并不干扰。

5.自己可以安装软件吗?

可以,系统已完成基础配置,常用软件都可以自行安装。如果默认的软件无法满足使用要求,也可以自己安装使用bioconda软件管理工具,完成7000余款软件的安装。

6.磁盘不够怎么办?

如果默认的2T磁盘不够用,可以选择付费增加存储空间,0.5元1G每月,比如要增加1T,则每月额外支付512元。