tinyarray

前言

hi,我是小洁。这是我基于自己的数据分析需求写的R包,很高兴被你看到了。我会在公众号《生信星球》更新这里面一些好用的小函数,也做一些其他的分享。

安装方式

1.在线安装

if(!require(devtools))install.packages("devtools")
if(!require(tinyarray))devtools::install_github("xjsun1221/tinyarray",upgrade = F)

2.本地安装

点击本页面的绿色按键code然后点击Download ZIP,下载到你的工作目录下,用devtools::install_local("tinyarray-master.zip",upgrade = F,dependencies = T)安装。

3.安装R包过程中可能出现的问题及解决办法

如果报错说xx包找不到,那就安装它。 如果报错信息中出现http,404,internet,url等关键词,说明是网络问题,一般来说本地安装即可解决。

函数介绍

1.几个常用绘图函数

都是字面意思:表达矩阵可视化其乐无穷。

draw_heatmap(),draw_volcano(),draw_venn(),draw_boxplot()

ggheat(),也是字面意思,用ggplot2的函数来画热图,目前还不怎么成熟,这个主要是为了拼图对齐和图例收集。

详细的介绍在:

披着ggplot皮的pheatmap,深夜激动更新我的包

2.GEO芯片下游分析

geo_download() : 提供geo编号,返回表达矩阵、临床信息表格和使用的平台编号。

find_anno():查找芯片平台注释

get_deg() :提供芯片表达矩阵、分组信息、探针注释,返回差异分析结果。

multi_deg() : 多个分组(最多5个)的差异分析

如果是想一步到位,做出差异分析常见的几张图,可以用get_deg_all() 和multi_deg_all()

这一部分主要是融合跟简化一下GEOquery、Annoprobe、limma的差异分析。

quick_enrich() : 简单直观的富集分析

double_enrich():上下调基因分开富集,合并画图

详细的介绍在:

我写了一个R包,简化芯片的差异分析

我完善了那个R包,可以简化多组的差异分析啦

3.表达矩阵探索

make_tcga_group():根据TCGA的样本命名规则,快速得出分组

sam_filter():去除tcga中的重复tumor样本

match_exp_cl():匹配tcga表达矩阵与临床信息

trans_array():替换矩阵的行名,比如把表达矩阵的探针名替换为基因名

trans_exp():将tcga或tcga+gtex数据进行基因id转换

t_choose():批量做单个基因的t检验

cor.full()和cor.one() :批量计算基因间的相关性

4.生存分析及可视化

point_cut():批量计算生存分析最佳截点

surv_KM():批量做KM生存分析,支持用最佳截点分组

surv_cox():批量做单因素cox,支持用最佳截点分组

太好用了!批量生存分析加画图,一步到位,还支持最佳截点~

exp_boxplot():给感兴趣的基因画T-N箱线图

exp_surv():给感兴趣的基因画KM-plot

box_surv(): 给感兴趣的基因画箱线图和KM-plot

5.网络图相关

hypertest():批量做mRNA和lncRNA的超几何分布检验

plcortest():批量做mRNA和lncRNA的相关性检验

两个检验给ceRNA锦上添花

interaction_to_edges():根据关系表格生成网络图的连接表格

edges_to_nodes():根据连接表格生成节点表格

6.灵活小函数

dumd():统计数据框每一列各有多少个取值

intersect_all():任意数量的向量取交集

union_all():任意数量的向量取合集

split_list():拆分列表,每个元素成为一个数据