python 读取excel文件,并读成数据框格式输出
发布日期:2021-06-29 03:49:01 浏览次数:3 分类:技术文章

本文共 1731 字,大约阅读时间需要 5 分钟。

pandas直接读取

import pandas as pddf = pd.read_excel('/path/file.xlsx' )

sheet_name: str, int, list, or None, default 0

header: Row (0-indexed) to use for the column labels of the parsed DataFrame.
names: List of column names to use.
usecols

自定义函数(很久以前,都是用这个读取的,时代变迁太快啦)

from openpyxl import load_workbookimport pandas as pddef extract_xlsx_onesheet(wb, sheet_name, header=False):    ws = wb[sheet_name]    if header:        data = ws.values        columns = next(data)[0:]        df = pd.DataFrame(data, columns=columns)    else:        df = pd.DataFrame(ws.values)    return df

读取excel文件:

path = 'C:/Users/DELL/Desktop/work/CloudStation/scaffold/CMGC_group.xlsx'wb = oad_workbook(path)

查看有哪些sheet:

In [12]: wb.sheetnamesOut[12]: ['CDK', 'CDKL', 'CK2', 'CLK', 'DYRK', 'GSK', 'MAPK', 'RCK', 'SRPK']

选择一个读取成数据框:

df = extract_xlsx_onesheet(wb, 'CLK', header=True)

有列名就header=True, 否则不填即可。

In [12]: dfOut[14]:      chembl_id_mol                                   canonical_smiles0     CHEMBL485053                 CN1C(=N\C(=C/c2ccc3OCOc3c2)\C1=O)N1    CHEMBL1803085       Oc1ccc(NC2=N\C(=C/c3ccc4OCOc4c3)\C(=O)N2)cc12    CHEMBL3728359  Nc1ccc(Cl)c(NC2=NC(=O)\C(=C\c3ccc4ncccc4c3)\S2)c13    CHEMBL2321962  O\N=C/1\C(=C/2\C(=O)Nc3c(Br)cccc23)\Nc4cc(ccc1...4    CHEMBL2321952  O\N=C/1\C(=C/2\C(=O)Nc3ccccc23)\Nc4ccc(cc14)C(.....             ...                                                ...101  CHEMBL1802856           CN1C(=N\C(=C/c2ccc3OCOc3c2)\C1=O)NC(=O)C102  CHEMBL3318024          CCNC(=O)Nc1ccc2ncc(cc2n1)c3ccc(OC)c(OC)c3103  CHEMBL2012570                   Cc1nccc2c3cc4OCOc4cc3n(CCCCN)c12104  CHEMBL2062565   CC(=O)Nc1cnc2ccn(c3cc(NC4CC4)n5ncc(C#N)c5n3)c2c1105  CHEMBL1230165        OC(=O)c1ccc2c(c1)nc(Nc3cccc(Cl)c3)c4ccncc24

转载地址:https://blog.csdn.net/zdx1996/article/details/103679635 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:python matplotlib 给图任意加标注
下一篇:Ubuntu 开机自动挂载硬盘

发表评论

最新留言

留言是一种美德,欢迎回访!
[***.207.175.100]2024年04月20日 22时50分33秒