对文件进行创建,读取和保存等操作
Windows 上的倒斜杠以及 OS X 和 Linux 上的正斜杠
在 Windows 上,路径书写使用倒斜杠(\)作为文件夹之间的分隔符。但在 OS X 和Linux 上,使用正斜杠作为它们的路径分隔符。如果想要程序运行在所有操作系统上,在编写 Python 脚本时,就必须处理这两种情况。
写程序时,先import os
os.path.join() 函数可以很容易完成这件事
如果将单个文件和路径上的文件夹名称的字符串传递给它,os.path.join()就会返回一个文件路径的字符串,包含正确的路径分隔符
1 | >>> import os |
这是在Windows上运行出的结果,输出中倒斜杠有两个,第一个倒斜杠是转义字符,每个倒斜杠都需要另外一个倒斜杠字符来转义得到
如果在Linux下得到的结果:
如果需要创建文件名称的字符串,os.path.join()函数就很有用
获取当前工作目录和改变目录:
利用 os.getcwd()函数,可以取得当前工作路径的字符串,并可以利用 os.chdir()改变它,更改的目录不存在会报错!
创建新文件夹:
程序可以用 os.makedirs()函数创建新文件夹(目录)
处理绝对路径和相对路径 :
os.path 模块提供了一些函数,返回一个相对路径的绝对路径,以及检查给定的路径是否为绝对路径。
• 调用 os.path.abspath(path)将返回参数的绝对路径的字符串。这是将相对路径转换为绝对路径的简便方法。
• 调用 os.path.isabs(path),如果参数是一个绝对路径,就返回 True,如果参数是一个相对路径,就返回 False。
• 调用 os.path.relpath(path, start)将返回从 start 路径到 path 的相对路径的字符串。如果没有提供 start,就使用当前工作目录作为开始路径。
1 | >>> os.path.abspath('.') |
调用 os.path.dirname(path)将返回一个字符串,它包含 path 参数中最后一个斜杠之前的所有内容。调用 os.path.basename(path)将返回一个字符串,它包含 path 参数中最后一个斜杠之后的所有内容。
1 | >>> path = 'C:\\Windows\\System32\\calc.exe' |
如果同时需要一个路径的目录名称和基本名称,就可以调用 os.path.split()
1 | >>> calcFilePath = 'C:\\Windows\\System32\\calc.exe' |
接受一个文件路径并返回每个文件夹的字符串的列表的方法:
1 | >>> calcFilePath.split(os.path.sep) |
在 OS X 和 Linux 系统上,返回的列表头上有一个空字符串:1
2>>> '/usr/bin'.split(os.path.sep)
['', 'usr', 'bin']
查看文件大小和文件夹内容
- 调用 os.path.getsize(path)将返回 path 参数中文件的字节数。
- 调用 os.listdir(path)将返回文件名字符串的列表,包含 path 参数中的每个文件
1 | >>> os.path.getsize('C:\\Windows\\System32\\calc.exe') |
可以看到,我的计算机上的 calc.exe 程序是 776192 字节。在我的C:\Windows\system32 下有许多文件。如果想知道这个目录下所有文件的总字节数,就可以同时使用 os.path.getsize()和 os.listdir()。
1 | >>> totalSize = 0 |
可以查看C:\Windows\System32文件夹属性大小是否与计算一致。
检查路径有效性:
如果你提供的路径不存在,许多 Python 函数就会崩溃并报错。os.path 模块提
供了一些函数,用于检测给定的路径是否存在,以及它是文件还是文件夹。
• 如果 path 参数所指的文件或文件夹存在,调用 os.path.exists(path)将返回 True,
否则返回 False。
• 如果 path 参数存在,并且是一个文件,调用 os.path.isfile(path)将返回 True,否
则返回 False。
• 如果 path 参数存在,并且是一个文件夹,调用 os.path.isdir(path)将返回 True,
否则返回 False。
文件读写过程 :
在 Python 中,读写文件有 3 个步骤:
1.调用 open()函数,返回一个 File 对象。
2.调用 File 对象的 read()或 write()方法。
3.调用 File 对象的 close()方法,关闭该文件。
1 | myfile=open('D:\\hello.txt') #打开文件对象 |
使用 readlines()方法,从该文件取得一个字符串的列表,列表中的每个字符串就是文本中的每一行。
1 | >>> sonnetFile = open('sonnet29.txt') |
写入文件:
- open(file, ‘w’) :打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除覆盖。如果该文件不存在,创建新文件。
- open(file, ‘a’) :打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
1 | >>> baconFile = open('bacon.txt', 'w') |
用 shelve 模块保存变量 :
利用 shelve 模块,你可以将 Python 程序中的变量保存到二进制的 shelf 文件中。这样,程序就可以从硬盘中恢复变量的数据。中的变量保存到二进制的 shelf 文件中。这样,程序就可以从硬盘中恢复变量的数据。shelve 模块让你在程序中添加“保存”和“打开”功能。例如,如果运行一个程序,并输入了一些配置设置,就可以将这些设置保存到一个 shelf 文件,然后让程序下一次运行时加载它们。
1 | import os, shelve |
运行上述代码,会在当前目录生成demodata.bak, demodata.dir, demodata.dat三个新文件.而在LInux上,只会生成一个demodata.db文件。这些二进制文件存储着shelve数据。
运行结果:
shelf 值有 keys()和 values()方法,返回 shelf 中键和值的类似列表的值。因为这些方法返回类似列表的值,而不是真正的列表,所以应该将它们传递给 list()函数,取得列表的形式。
1 | print(list(demo.keys())) |