直播回顾+问题解答|IF18分作者亲述如何发表高分文章+热门生信分析助力高分文章
直播回顾+问题解答|IF18分作者亲述如何发表高分文章+热门生信分析助力高分文章

点击上方蓝字关注我们

直播回顾+问题解答|IF18分作者亲述如何发表高分文章+热门生信分析助力高分文章



      11月19日,拜谱生物组织了一场接近2小时的线上直播。参与线上观看的各位老师分享“浙江大学邵逸夫医院的蔡秀军教授发表了题为“UBQLN1 mediates sorafenib resistance through regulating mitochondrial biogenesis and ROS homeostasis by targeting PGC1β in hepatocellular carcinoma”的文章,该文旨在阐明线粒体生物发生介导的 ROS 水平在 HCC 索拉非尼耐药中的作用机制。”

     我们邀请了文章作者徐俊杰拜谱生信分析总监俞鸿分别讲述了,如何写出了18分的相关文章,以及生信分析如何助力写出高分文章两个话题。

      现场气氛十分热烈,两位老师讲完后,提问一波接着一波,没看到的各位老师也不用担心,直播回看来了!

      同时我们也整理出了直播时,老师们在线提出的一些问题的解答解析。供各位观看回播的老师赏析!

直播回顾+问题解答|IF18分作者亲述如何发表高分文章+热门生信分析助力高分文章




视频内容丰富,时间过长,因此回看分为上下两集。



直播回顾+问题解答|IF18分作者亲述如何发表高分文章+热门生信分析助力高分文章

直播回放(点击下方播放下集)






直播回顾+问题解答|IF18分作者亲述如何发表高分文章+热门生信分析助力高分文章

直播回放(点击下方播放上集)





在线Q&A整理:


1.相关性分析和显著性差异有什么区别吗

A:样本相关性和蛋白显著差异都是依据蛋白在不同样本间的表达情况进行分析的。区别在于前者是对样本整体水平的表达分析,主要用于评估组内样本的重复性好坏和组间样本的差异性大小,比如组内样本的相关性系数越接近于1表示两样本的蛋白表达情况相似度越高,即两样本的相关性越好、重复性越好;反之组间样本的相关性系数越接近于0则表示相关性越低、差异性越大;总之,样本相关性分析与PCA分析的用途相似。后者是对单个蛋白进行统计检验和差异倍数计算。p<0.05表示该蛋白在统计学上具有显著性;fc>1.2或<0.83表示该蛋白在两组间的变化倍数大;同时符合两个筛选条件的蛋白则是两组间的显著差异蛋白。


2.聚类不到一起怎么办

A:样本聚类,如果组内样本没有聚到一起,第一步先通过样本比较分析(包括PCA或相关性等)判断组内重复性和组间差异性,如果有离散样本需进一步评估是否需要剔除。如果不存在异常样本,那么在图中只显示蛋白聚类、不显示样本聚类即可(一般出现组内样本聚不到一起的主要原因是实验处理对组间的差异影响不够大,导致组间样本无法区分开、蛋白在样本间的表达模式趋势接近,最终产生组间样本交叉聚类的情况)。


3.聚类在一起表示什么意思?聚类是比较集中的吗

A:蛋白聚类是将表达模式趋势相近的蛋白归类成多个簇,用聚类树表示,所以聚类在一起的蛋白(即距离越近的树枝)表示它们的表达模式越相似,其可能具有相似的功能或者参与相同的生物学途径,或者在通路中处于临近的调控位置。


4.你们提供的组学常规报告包含哪些分析?可以提供哪些个性化分析?想做高级的图有哪些要求

拜谱生物蛋白组学的常规分析内容如下图所示:

直播回顾+问题解答|IF18分作者亲述如何发表高分文章+热门生信分析助力高分文章

标准分析流程图(修饰组学还可提供motif分析)

 

个性化分析根据目的不同分为4类:1. 筛选biomarker(包括WGCNA;机器学习和模型构建等);2. 通路的激活/抑制分析(包括DA-score;GSEA;SPIA等);3. 特色数据库的通路富集分析(Wiki pathway数据库;Reactome数据库等);4. 复杂关系可视化(complex heatmap复杂热图、circos圈图、sankey桑基图等)。

 

高级分析要求:WGCNA官方要求至少15例样本(5组3重复);机器学习和模型构建至少2组10重复可做,生物学重复越多越可靠。GSEA、SPIA、Wiki pathway和Reactome有物种限制,具体支持的物种可查看报告。


5.网络分析要怎么看?

拜谱生物蛋白组学的网络分析提供3种类型共5张图片,如下图所示:


1. PFI网络分析

圆形节点表示蛋白质,红色表示上调蛋白,蓝色表示下调蛋白;橘色矩形表示KEGG pathway;灰色实线表示该差异蛋白富集到该功能通路。图中具体标注了蛋白和通路的名称,该图可以反映富集通路情况及差异蛋白上下调情况。

直播回顾+问题解答|IF18分作者亲述如何发表高分文章+热门生信分析助力高分文章


2. PFI+PPI网络分析

圆形节点表示蛋白质,红色表示上调蛋白,蓝色表示下调蛋白;橘色矩形表示KEGG pathway;灰色实线表示PPI关系,紫色虚线表示该蛋白富集到该通路。图中具体标注了蛋白和通路的名称,该图可以反映上下调蛋白的通路富集情况以及蛋白-蛋白相互作用关系。

直播回顾+问题解答|IF18分作者亲述如何发表高分文章+热门生信分析助力高分文章


3. FFI网络分析

圆形节点表示KEGG pathway。颜色越红表示富集显著性越高;节点越大表示富集到该通路中的差异蛋白数(count)越多;灰色实线表示两通路存在共有差异蛋白,连线越粗表示共有差异蛋白越多。图中具体标注了通路名称,该图可以反映通路富集的显著性、count多少以及共有差异蛋白情况。

直播回顾+问题解答|IF18分作者亲述如何发表高分文章+热门生信分析助力高分文章


6.K-MEANS 和WGCNA两种结果或者说目前感觉很像,老师能具体说说区别和相应的应用条件吗?

K-MEANS和WGCNA是两种完全不同的分析。前者是将差异蛋白划分为k个簇,簇中的各个蛋白在不同样本/组别中的表达趋势相近,该分析可用于洞察目标变量的变化趋势以及同一趋势下的不同变量,在不同梯度/时间点采样或者模型/给药/对照等多组的实验设计中,就可以结合趋势结果来筛选目标蛋白。后者是根据蛋白之间的表达相关性构建共表达网络,然后再与样本特征(包括临床特征、手术方式、治疗方法等等)进行关联,最终筛选出网络连接度较高的关键蛋白(hub protein),该分析常用于探索蛋白与表型、代谢物、基因之间的联系以及挖掘核心蛋白。


7.请问老师WGCNA要多少例样本才可以做呢

官方要求至少15例样本(5组3重复)


8.多组比较是否可以层次聚类热图展示呢

多组比较筛选到的差异蛋白可以用聚类热图展示。




- End -




直播回顾+问题解答|IF18分作者亲述如何发表高分文章+热门生信分析助力高分文章


相关推荐: