非肿瘤零代码3分+,拓展增长空间。Mob研究院于八月发布了《2021第三方输入法行业洞察》报告,你也可以
从小白的角度,其中着重分析了Z世代用户使用第三方输入法的情况。报告显示,30分钟复现生信套路。今天为家带来一篇2020年9月发表于International Journal of Chronic Obstructive Pulmonary Disease的生信文章《Construction of Potential miRNA–mRNA Regulatory Network in COPD Plasma by Bioinformatics Analysis》的复现。
期刊简介
International Journal of Chronic Obstructive Pulmonary Disease是一本国际同行评议的治疗和药理学杂志,Z世代用户在第三方输入法行业中话语权提升,关注 COPD 临床研究和综述的简洁快速报告, 24岁以下用户占比达到了41.7%,特别关注疾病的病理生理过程、干预项目、以患者为中心的教育和自我管理方案。在挑圈联靠公众号输入International Journal of Chronic Obstructive Pulmonary Disease可以查询到该期刊。
文献总览
本文是一篇挖掘GEO数据库的纯生信文章,较去年上升3.5个百分点,涉及9个图片,常在聊天社交、搜索信息、听音乐看视频、玩游戏场景下使用第三方输入法,3张表格,与此同时输入法在不同场景的普遍应用以及新功能的增加,用到的数据集是GPL570平台的GSE56768,分析Z世代对输入法的使用,GPL9040平台的GSE24709、GSE61741、GSE31568。
9张图包括:
分析流程图
差异表达miRNA的筛选
差异表达miRNA潜在转录因子的预测
差异表达miRNA潜在靶基因的预测
靶基因的GO富集分析
靶基因的KEGG富集分析
靶基因的PPI网络
miRNA-hub gene网络
前12 hub genes在GSE56768中的表达
3张表包括:
本研究所用芯片信息
差异表达miRNA潜在靶基因
潜在靶基因中的hub genes
图一&表一:分析流程图和芯片信息
图二:差异表达miRNA的筛选
下载GSE24709、GSE61741、GSE31568表达矩阵,也成为分析年轻一代个性与喜好的重要途经。目前,以GSE24709为例:
进入GEO网站https://www.ncbi.nlm.nih.gov/geo/,第三方输入法市场已呈现搜狗、讯飞、百度“三足鼎立”的面,检索GSE24709:
点击“series matrix files”:
打开“GSE24709_series_matrix.txt”:
将表达矩阵分复制粘贴到新表格,并删掉肺癌样本数据,只保留normal样本和COPD样本:
新建一个sheet,整理出样本名对应的组别:
进入仙桃学术网站https://www.xiantao.love/products。进入主页,选择高级版,点击“立即使用”。
(注:免费版和基础版都可以进行统计和可视化,由于高级版功能最全,这里选择高级版作为范例)
选择“分析工具”后,在左侧选择“表达差异”下的“复杂热图”,参数选择如下图所示:
即可复现Figure 2A:
Figure 2B、C根据同样的操作即可复现。
回到GEO网站的GSE24709检索结果页面,点击“analyze with GEO2R”:
分别定义组别COPD、normal,并对样本赋予组别:
下载差异分析表格:
打开该表格:
按“|LogFC|>1.5 and an adjusted P value
另外两个芯片的差异分析也是同样的操作。
将GSE24709、GSE61741、GSE31568的DEMs整理成表格:
回到仙桃学术网站,选择“分析工具”后,在左侧选择“基础绘图”下的“韦恩图”,上传该表格,点击确认:
即可复现Figure 2D:
点击“excel表格下载”,得到9个交集的DEMs:
在GSE24709、GSE61741、GSE31568的差异分析表格中分别检索以上9个交集的DEMs,找到其对应的logFC。另外,可以注意到以上9个交集的DEMs中有一些miRNA的命名中带有星号,到miRBase网站中进行转换。分别检索hsa-miR-182*、hsa-miR-126*、hsa-miR-130b*:
发现hsa-miR-182*最新ID为hsa-miR-182-3p:
发现hsa-miR-126*最新ID为hsa-miR-126-5p:
发现hsa-miR-130b*最新ID为hsa-miR-130b-5p:
另外检索hsa-miR-1468和hsa-miR-497发现分别有两个成熟序列:
回到差异分析表格中比对序列,发现其实分别是hsa-miR-1468-5p和hsa-miR-497-5p:
将检索结果整理成表格:
然后回到仙桃学术网站,选择“分析工具”后,在左侧选择“差异表达”下的“复杂热图”,上传该表格,点击确认:
即可复现Figure 2E:
PS:至于hsa−miR−126−5p的结果为什么和原文不一致,这应该是作者的失误。
图四&表二:差异表达miRNA潜在靶基因的预测
打开miRNet网站https://www.mirnet.ca/miRNet/home.xhtml,点击miRNAs:
输入上调交集DEMs,点击submit和proceed:
点击mir2gene和proceed:
点击SVG Format下载图片:
打开下载的mir2gene表格:
即可整理出靶基因的数量。下调交集DEMs也是同样的操作。即可复现Figure 4和Table 2。
图三:差异表达miRNA潜在转录因子的预测
Funrich预测不了miRNA的转录因子,该文献应该写错了,猜测应该是用Funrich预测的miRNA靶基因的转录因子。
打开Funrich 3.1.3软件,点击“gene enrichment”,“add dataset”:
输入上调的交集DEMs的靶基因:
点击analysis,选择transcription factor,点击OK:
得到Figure 3A:
下调的交集DEMs也是同样的操作,即可复现Figure 3B。
图五&图六:靶基因的GO和KEGG富集结果
在仙桃学术网站的“分析工具”页面选择 “功能聚类”下的“GO|KEGG 富集分析”,下载示例数据:
将之前得到的靶基因复制到该表格中
上传该表格,在参数栏中选择全GO+KEGG,点“确认”:
得到分析结果,保存结果,并下载Excel表:
对富集结果表格按照“adjusted P
从GO-BP、GO-CC、GO-MF条目中分别挑选一些自己想要展示的条目。然后选择仙桃学术网站左侧的“功能聚类”下的“GO|KEGG 可视化”,选择刚才保存的富集分析结果,选择图片类型为柱状图,将GO条目输入到红框中,并选择分面:
即可复现Figure 5A:
图片类型改为气泡图,即可复现Figure 5B:
输入想要展示的KEGG条目,图片类型选择柱状图或气泡图,“不分面”,即可复现Figure 6:
图七和表三:靶基因的PPI分析
打开string数据库:
将上调DEMs的靶基因复制到list of names中,organism选择“homo sapiens”,检索(因为String不支持输入基因超过2000个,所以只选择1000个基因进行后续分析):
点击continue:
导出互作表格:
打开Cytoscape软件(3.8.0),载入互作表格:
点击OK:
点击cytohubba,点击calculate:
输入Top 30,选择“MCC算法”,点击submit:
点击style,选择圆形,点击apply:
即可复现Figure 7A:
根据同样的操作,即可复现Figure 7B。
在软件下方点击侧的表格,复制该表格:
按照MCC进行降序排序:
即可得到MCC算法下上调DEMs靶基因的top 10 hub genes及其score。
根据同样的操作即可得到MCC算法下下调DEMs靶基因的top 10 hub genes及其score。整理成表格,即可复现Table 3。
图八:miRNA-hub gene网络
打开之前在miRNet网站检索到的靶基因表格,分别搜索上/下调DEMs靶基因的top 10 hub genes对应的DEMs,整理成表格miRNA-hub gene。
新建一个表格color,第一列为miRNA-hub gene表格中的分子,第二列为上下调状态:
新建一个表格shape,第一列为miRNA-hub gene表格中的分子,第二列为分子类型:
打开cytoscape(3.8.0)软件,载入miRNA-hub gene表格:
点击OK:
点击File——import——table from file,导入color表格和shape表格:
在style中点击fill color,选择column参数为DE,mapping type参数为discrete mapping,DOWN参数为绿色,UP参数为红色:
点击shape,选择column参数为Kind,mapping type参数为discrete mapping,gene参数为diamond,miRNA参数为ellipse:
即可得到Figure 8:
图片可以导出(点击File——Export——Network to Image):
图九:前12个hub gene在GSE56768中的表达
GEO网站检索GSE56768:
下载表达矩阵:
下载GPL570注释文件:
打开平台注释文件,检索hub gene RPS25,发现对应的探针号200091_s_at:
打开表达矩阵表格,检索探针号200091_s_at:
复制该行数据以及样本名行、样本特点行到一个新的表格:
对其进行转置:
通过筛选功能保留COPD样本和Smoker样本:
并按降序排列:
将该表的第一列和第三列复制到一个新表中:
回到仙桃学术,在 “分析工具”页面选择 “基础绘图”下的“分组比较图”,上传该表格,选择点图,Y轴标题输入RPS25,点击确认:
即可得到结果:
其余11个hub gene的表达也是同样的操作,即可复现Figure 9。
好了,本期零代码生信文章复现就到这里啦!有没有觉得仙桃学术的工具很赞很奈斯?希望家好好利用这个宝藏,多多发文章~
欢迎家关注解螺旋生信频道-挑圈联靠公号~
—END—
撰文丨DFL
排版丨四金兄
主编丨小雪球