• Aspera上传数据到NCBI,使用Python脚本保持传输无中断

    适用情况数据上传到NCBI时,有多种可选方式,对于数据量不大的数据可以选择网页上传。稍大数据可选择FTP或Aspera,目前中国大陆境内FTP上传到NCBI数据速度普遍较慢,使用Aspera速度稍快。Aspera上传受网络环境稳定影响较大,传输容易中断。 该。

    分享一个绘制祖先成分堆积图的R代码

    代码为R代码,主要用于将Admixture分析后的结果文件绘制为堆积图。可访问该项目的Github地址。# 加载必要的包 library(ggplot2) library(reshape2) library(plyr) library(dplyr) libr。

    Nginx代理服务器设置:以gpt_academic服务器端部署为例

    首先,我们假定当前的网络访问情况如下:我作为使用者,在网络环境A下进行网络访问。服务器B为部署了gpt_academic(下简称gptac)的服务端。但是A访问B并不通畅,经常会无法访问。此时,服务器C分别与A、B都具有非常良好的连通性。本篇博文主要讲的就是。

    通过&+ wait进行多线程计算

    最近因为修改article图片的原因,需要对计算绘制祖先成分分析的堆积图。使用Admixture计算时,SNP数据量大概在180x1764689。虽然数据量不大,但是需要计算不同k值下的情况,计算速度还是很慢的。通过学习多线程计算的方法,实测下面的方法在cp。

    基因共表达网络

    基因共表达网络(gene correlation network,GCN)基因共表达网络是一种无向图,每个节点代表基因,如果二者存在明显的共表达关系,就用一个边连接两个节点。对不同的样本或者不同的实验条件建立基因表达谱后,可以通过查看不同样本间产生相似表达模。

    (基础)下载安装conda搭建生信软件使用环境

    我们知道很多生信软件使用conda安装和构建环境是比较方便的,虽然偶尔conda也会出现一些问题,但那毕竟只是偶尔,如果能够省去手动安装的时间,还是很不错的。下面对初次安装conda的流程进行一个记载。这里我选择的是miniconda。操作环境:Ubuntu。

    从pubmed导出目标主题相关的文章并制作词云

    最近课程汇报,需要对选定的题目的研究进展和热点进行简单的展示。思索后认为如果能用词云展示最近新发的文章标题哪些词汇频率高会不会比较好。本来想用python生成词云,结果看到一个用R包制作词云的文章,非常不错。下面讲解一下具体流程。演示环境:R-4.2.1Rs。

    合并fasta.gz在新的gz中(待更新合并fasta)

    在处理转录组数据的过程中,raw_data分成了很多段,进行清洗不是很方便,会产生很多小的清洗文件和报告,那么合并操作是很方便的。通过查询大佬的处理方式,得出来两种快速处理的方法一种是使用cat直接将文件合并cat sample_1_fasta.gz sam。