Un día necesité listar los archivos existentes en una carpeta y sus subcarpetas. Como reto, quise implementar mi propia función y aquí está :D
Los algoritmos que recorrer árboles de directorios son recursivos, no se usan bucles debido a que el algoritmo ignora la profundidad que alcanzarán los subdirectorios en el árbol.
import os
from os import listdir
from os.path import isfile, isdir, join
def listdir_recurd(files_list, root, folder, checked_folders):
if (folder != root):
checked_folders.append(folder)
for f in listdir(folder):
d = join(folder, f)
if isdir(d) and d not in checked_folders:
listdir_recurd(files_list, root, d, checked_folders)
else:
if isfile(d): # si no hago esto, inserta en la lista el nombre de las carpetas ignoradas
files_list.append(f)
return files_list
La forma de usar esta función es:
if
__name__ == "__main__":
filez
= listdir_recurd([], 'D:\Sample',
'D:\Sample',
['D:\\Sample\\Uno'])
#
esto omite la subcarpeta 'D:\\Sample\\Uno'
filez
= listdir_recurd([], 'D:\Sample',
'D:\Sample',
['D:\\Sample\\Uno', 'D:\\Sample\\Dos'])
#
esto omite la subcarpeta 'D:\\Sample\\Uno' y la subcarpeta 'D:\\Sample\\Dos'
filez_
= listdir_recurd([], 'D:\Sample3',
'D:\Sample3',
[]) #
esto no omite ninguna subcarpeta
La función recibe los siguientes parámetros:
"files_list": es el acumulador. Siempre es una lista vacía.
"root" y "folder": carpeta raíz y carpeta con los archivos que se va a listar, estas dos rutas deben ser la misma. La carpeta con los archivos a listar es la carpeta actual cuyos archivos se están listando, su valor lo controla el algoritmo y va recorriendo las subcarpetas que se van hallando.
"checked_folders": lista las subcarpetas en la carpeta del parámetro "root" que se desean omitir. Si se desea listar todos los archivos, se ingresa una lista vacía.
Python permite ingresar el separador de rutas como \ ó \\.
Esta función sólo ha sido probada en Windows, y ejecutada con
Python Tool for Visual Studio usando Python 2.7