单细胞测序分析之小技巧之for循环批量处理数据和出图-欧洲杯线上买球

“harmony”整合不同平台的单细胞数据之旅生物信息学习的正确姿势

ngs系列文章包括ngs基础、转录组分析（nature重磅综述|关于rna-seq你想知道的全在这）、chip-seq分析（chip-seq基本分析流程）、单细胞测序分析 (重磅综述：三万字长文读懂单细胞rna测序分析的最佳实践教程（原理、代码和评述）)、dna甲基化分析、重测序分析、geo数据挖掘（典型医学设计实验geo数据分析 (step-by-step) - limma差异分析、火山图、功能富集）等内容。

在进行单细胞转录组测序分析中，我们发现比如样本较多或者需要大量出图的时候，我一开始就是大量手动一个一个的出图，但回头想想，这样的操作模式不都是一样的嘛，直接用for循环不就搞定啦！

首先我们讲点for循环的基础知识及举个小栗子！

for循环基本结构如下：

for(变量 in 值){}

也就是说当变量在值的范围内将执行中括号内的操作。是不是非常简单？

我们举个栗子：

比如我们想要计算一个向量中偶数的个数：

x <- c(2,5,3,9,8,11,6)
count <- 0
for (val in x) {
if(val %% 2 == 0)  count = count 1
}
print(count)

[1] 3

在上面的示例中，由于向量x具有7个元素，因此循环迭代了7次。

在每次迭代中，val取x的对应元素的值。

我们使用了一个计数器来计算x中的偶数。我们可以看到x包含3个偶数。

比如我们现在有两个患者的鼻腔样本，然后我们进行单细胞测序后，cellranger后我们在filtered中分别生成了3个文件：barcodes，features和matrix。我懒呀，我想万一我有好多个样本怎么办，不如用一个for循环来搞定！

于是我的文件就成了这个样子：

batch_list=list("p2","p3")
batch_data_list=list("p2"=1,"p3"=1)
for( i in 1:length(batch_list))
{
  print(batch_list[[i]])
  s_object=read10x(paste("~/input_files/",batch_list[[i]],sep=""))
  s_object=createseuratobject(counts =s_object, min.cells = 0, min.features = 400, project = "p23")
  s_object[["percent.mt"]] <- percentagefeatureset(s_object, pattern = "^mt-")
  s_object <- subset(s_object, subset = nfeature_rna >100 & nfeature_rna <8000 & percent.mt <10)
  s_object@meta.data[, "run"] <- batch_list[i]
  s_object=normalizedata(s_object)
  batch_data_list[[i]]=findvariablefeatures(s_object, selection.method = "vst", nfeatures =5000)
}

那么我们仔细看一下刚才发生了什么，我们首先把我们的“p2”和“p3”设置为list，然后在for循环中我们分别进行了读取数据，提取线粒体基因比例，qc筛选，在metadata中添加新的一列，进行归一化并计算高变基因。最后将p2和p3合并在一个list中。

这时候一定会有好同志问这样一个问题，为什么在batch_data_list=list(“p2”=1,”p3”=1)中将p2和p3都赋值为1，这时候我们不妨不对其进行设置，使batch_data_list=list(“p2”,”p3”)，我们会看见下图中的p2会消失哦！

在我们使用seurat中的findallmarkers()得到每个cluster的高变基因后，我也同时得到了一个csv表，可是我觉得太不直观了，于是我现在要循环出一些不同clusters的vlnplot，我应该怎么办呢？嗨，循环起来呀！

clustersss <-
  list(
    "0",
    "1",
    "2",
    "3",
    "4",
    "5",
    "6",
    "7",
    "8",
    "9",
    "10",
    "11",
    "12",
    "13",
    "14",
    "15",
    "16",
    "17",
    "18",
    "19",
    "20",
    "21",
    "22"
  )
for (i in clustersss) {
  for (m in 1:nrow(run.combined.markers)) {
    if (run.combined.markers["cluster"][m, ] == i) {
      filename <- paste(run.combined.markers$gene[m], 'vlnplot.pdf', sep = '_')
      p <-
        vlnplot(object = run.combined,
                features = c(run.combined.markers$gene[m]))
      print(p)
      ggsave(p,
             filename = paste(i, run.combined.markers$gene[m], 'vlnplot.pdf', sep = '_'))
      dev.off()
    }
  }
}

我给解释一下上面的内容，首先我们把我们的cluster设为list，i代表cluster，m代表run.combined.marker的排序，使用两个for循环进行嵌套，最后在保存文件时将cluster 基因名 vlnplot结合进行保存。

每次看见这样出图我都特别有成就感，，，，哈哈哈哈，快have a try!

其实也可以写一个apply版的，获得所有plotlist，再用patchwork或cowplot进行拼图。

plotmarker <- function(cluster, run.combined) {
  for (m in 1:nrow(run.combined.markers)) {
    if (run.combined.markers["cluster"][m,] == cluster) {
      filename <-
        paste(run.combined.markers$gene[m], 'vlnplot.pdf', sep = '_')
      p <-
        vlnplot(object = run.combined,
                features = c(run.combined.markers$gene[m]))
      ggsave(p,
             filename = paste(i, run.combined.markers$gene[m], 'vlnplot.pdf', sep = '_'))
      return(p)
    }
  }
}
plotlist = lapply(clustersss, plotmarker, run.combined = run.combined)

投稿时间：2023-03-15 最后更新：2023-03-15

标签：进阶数据重磅基因

3 4 5

单细胞测序分析之小技巧之for循环批量处理数据和出图-欧洲杯线上买球

读java性能权威指南（第2版）笔记16_垃圾回收c

产业交集越来越多，未来市场规模达6000亿，3d打印成新风口

3000元内dlp投影仪的破局者-大眼橙x6家用投影仪

济阳区首台水下无人清淤机器人成功下水作业

充电桩出口需求大增218%！数字化“秒懂”外贸市场｜数说网事

真香！阿里最新出品java面试核心讲（终极版），github已星标50k

4个已被科学家证明，但是人类始终难以接受的理论

哈拉尔德·蓝牙，以无线技术命名的维京人

以s科技创新企业为例，谈谈我国基于价值链的营运资金管理现状

同行降价清仓，2023款小鹏p7i"逆势涨价"，24.99万起，诚意在哪？

纾困解难赋新能精准服务助发展信阳市委网信办深入企业走访调研

amd宣布任命五位新企业院士：来自图形架构到先进封装等各个领域

几款热门ai应用上手体验：chatgpt、new bing、midjourney......

室温超导研究是必拿诺贝尔奖的“历史性突破”吗？

荣耀magic5至臻版和三星s23ultra过招，谁配得上安卓之光称号

《自然·医学》：到底哪种饮食方案更能预防慢性病？超20万

经基因工程改造的细菌可寻找并消灭肿瘤

火山引擎 dataleap：揭秘字节跳动业务背后的分布式数据

太极拳进阶修炼课程（7）