咨询热线:400-065-6886   天昊基因

中文 / English

主页 > 技术支持 > 科研进展 >

 Python入门到底有多简单(一):数据读写与输出


生信团 上海天昊生物

    很多人觉得数据分析入门很难,但随着B站和公众号上的学习资源越来越多,学习数据分析已经变得非常简单。以下面为例,从一张规则的表格中,根据门水平名称,生成对物种门水平的表格文件。

 

导入pandas包


In [1]:
import pandas as pd

 

读取数据


读取文本文件pd.read_table,读取excel文件,
可以用df = pd.read_excel('*.xlsx',sheet_name='*')。

In [2]:
df = pd.read_table('subsample_otu.tax.0.03.xls')

如下图所示,门水平有12个门的数据。



 

 

 

查看待拆分的门


In [3]:
df['phylum'].unique()

Out[3]:
array(['Acidobacteria', 'Actinobacteria', 'Armatimonadetes',
     'Bacteroidetes', 'Chloroflexi', 'Firmicutes', 'Fusobacteria',
     'Gemmatimonadetes', 'Planctomycetes', 'Proteobacteria',
     'Spirochaetes', 'Synergistetes'], dtype=object)
 
 
生成Excel文件

根据门水平名称,提取对应门水平的信息,并生成以门水平名称命名的Excel文件。
In [4]:
for i in df['phylum'].unique():    
     df[df['phylum']==i].to_excel(i+".xls",index=False)


Out[4]:


 

往期相关链接:
1、R基础篇
excel不熟练怎么办,R来帮您(一)数据分类汇总
如何使用Rstudio练习R基础教程
R相关软件及R包安装
【零基础学绘图】之气泡图绘制(六)
【零基础学绘图】之绘制venn图(五)
【零基础学绘图】之绘制barplot柱状图图(四)
【零基础学绘图】之绘制heatmap图(三)
【零基础学绘图】之绘制PCA图(二)
【零基础学绘图】之alpha指数箱体图绘制(一)

2、R进阶
【绘图进阶】之带连线的箱体图绘制(8)
【绘图进阶】之配对箱体图绘制(七)
【绘图进阶】之通路与菌的相关性分析热图(六)
【绘图进阶】之lefse定制化绘图(五)
【绘图进阶】之六种带中心点的PCA 图和三维PCA图绘制(四)
【绘图进阶】之交互式可删减分组和显示样品名的PCA 图(三)
【绘图进阶】之绘制PCA biplot图(二)
【进阶篇绘图】之带P值的箱体图、小提琴图绘制(一)

3、数据提交
3分钟学会微生物多样性云平台数据分析;
3分钟学会CHIP-seq类实验测序数据可视化 —IGV的使用手册
10分钟搞定多样性数据提交,最快半天内获取登录号,史上最全的多样性原始数据提交教程
20分钟搞定GEO上传,史上最简单、最详细的GEO数据上传攻略

4、表达谱分析
表达谱分析(二)通路富集分析和基因互作网络图绘制
如何对GEO数据进行差异分析
miRNA靶基因预测软件__miRWalk 3.0

5、医学数据分析
KING: 样本亲缘关系鉴定工具
【WGS服务升级】人工智能软件SpliceAI助力解读罕见和未确诊疾病中的非编码突变
隐性疾病trio家系别忽视单亲二倍体现象——天昊数据分析助力临床疾病诊断新添UPD(单亲二倍体)可视化分析工具
【昊工具】Oh My God! 太好用了吧!疾病或表型的关键基因查询数据库,我不允许你不知道Phenolyzer
天昊客户服务中心
手机/微信号:18964693703
 
【本群将为大家提供】
分享生信分析方案
提供数据素材及分析软件支持
定期开展生信分析线上讲座
QQ号:1040471849
 
 
作者:大熊
审核:有才
来源:天昊生信团
 
 
 
 
 
 
 



上海天昊生物科技有限公司 版权所有 沪ICP备17008908号
地址:上海市浦东新区康桥路787号9号楼 邮箱:techsupport@geneskies.com 电话:400-065-6886