我需要阅读一个Excel,其中有一些文件夹,每个文件夹在该位置包含许多文件,而我想要的文件将在这些文件夹之一中。如何从该位置读取所需的文件?我的文件名是Daily Report on (18-Nov-2020)_ALL.xlsm
,我想读为df1 = pd.read_excel(r'C:\(many folders here)\Daily Report on (18-Nov-2020)_ALL.xlsm',header = 1, usecols = "A:B,D:N,U,W,Z",skiprows = range(1,3))
。
我的文件名的日期部分18-Nov-2020
不是固定的,它是系统的当前日期。如何每天在运行程序时自动在文件名中更改此日期部分?
期待你的支持
glob
模块。'**'
表示“所有可能的目录和子目录”。此外,请确保recursive=True
from glob import glob
import os
today_file_path = glob(os.path.join(fixed_path, '**', today_filename), recursive=True)[0]
%d
是月份中的天,是月份%b%
的缩写,%Y
是年from datetime import date
today_formatted = date.today().strftime('%d-%b-%Y')
today_filename = 'Daily Report on ({})_ALL.xlsm'.format(today_formatted)
print(today_filename)
输出:
'Daily Report on (28-Nov-2020)_ALL.xlsm'
谢谢@马克。我的第二点解决了。请帮我解决第一点。我不知道预期文件的特定文件夹位置。如何从许多文件夹中读取所需的文件?
是否有一组固定的文件夹,可能会出现文件?例如,有3个不同的文件夹,但是您不知道要在哪个文件夹中查找?
不!!文件夹不固定。某些路径是固定的,例如C:\ RPA \ 2020(许多文件夹未固定)\ Daily Report on(28-Nov-2020)_ALL.xlsm @Mark
我编辑了答案,以包括第一个问题。对你起作用吗?
再次感谢@Mark。工作正常