PyFileSearcher是一款轻量级且易于使用的文件搜索工具,专为解决多种文件搜索需求而设计。它不仅适用于个人用户,也适用于大中型企业的服务器环境。该工具能够高效地追踪过去两天内占用存储空间的文件,并且完全免费、开源,兼容Linux和Windows操作系统。
获得的功能
按名称、尺寸和文件类型进行搜索。
按路径的一部分进行搜索。
搜索索引中不迟于N天的已删除文件信息。这些文件与一般文件的搜索方式相同,并可保存搜索设置以供未来使用。
以CSV格式保存搜索结果。
在搜索结果中突出显示已删除的文件记录。
解决文件夹因各种原因未被索引的问题,尤其是适用于Windows中长路径(超过256个标识符)的情况。
工作原理
PyFileSearcher在您的电脑硬盘上运行,并仅存储有关文件的最少必需信息,包括尺寸、创建时间、修改时间和文件的首次索引时间(有利于在不查看特性的情况下寻找新文件)。为了更好地存储这些信息,您可以应用SQLite数据库查询,每个要索引的目标目录都有一个。如果需要索引数十万至数百万个文件,还可以使用MySQL数据库查询。在第二种情况下,您可以使用单个数据库查询,同时指定多个目标目录。在这两种情况下,每个目标目录都与其他文件目录并行处理索引。
索引设置
在设置了简洁的索引主要参数(目标目录,以及在使用SQLite时,后缀名的授权管理或信用黑名单)之后,您可以使用"--scan"主要参数运行程序。程序将自动开始索引,并在完成后关闭。您可以使用计划任务程序来执行此操作。在检测过程中,会在工作目录中创建一个pid文件。该文件的存在将阻止扫描器运行,如果程序崩溃,请手动删除该文件。
测试结果
在拥有约2000万个文件的文件服务器上进行了测试。扫描时间约为5小时。较大进程中的文件数量约为700万个。MySQL的非默认设置(针对Debian Stretch)如下:
innodb_buffer_pool_size = 3000M
innodb_log_file_size = 128M
innodb_log_buffer_size = 4M
innodb_flush_method = O_DIRECT
更新日志
在1.1.1版本中,已将pid进程存储到pid文件中。
附加的认证降低了在pid文件未被删除时终止扫描器执行的机会。
默认设置 "sqlTransactionLimit" 从20000改为1000。
应用特点
PyFileSearcher具有以下特点:
快速索引:能够快速索引大量文件。
高度定制:允许用户根据需求自定义搜索条件和索引设置。
跨平台兼容:支持Linux和Windows操作系统。
开源代码:便于用户学习和修改。
如何使用
安装PyFileSearcher:从官方源代码库下载并安装。
配置索引参数:设置目标目录和后缀名授权管理或信用黑名单。
运行扫描:使用--scan
参数开始索引过程。
查看结果:以CSV格式查看搜索结果或直接在程序中查看。
PyFileSearcher是一款强大的文件搜索工具,能够帮助您轻松找到所需的文件,并管理您的文件系统。
- 新游戏暂无消息 参与地图设计大赛赢取奖励 10-31
- 2K公布免费第三人称英雄射击游戏《Ethos计划》 10-21
- 考试啦,《葫芦娃2》带来原动画细节小考卷(4) 10-21
- 王国两位君主北欧之地隐士有什么用 10-21
- 我的世界种子怎么种植方法 10-21
- 崩坏学园2怎么注销崩坏怎么注销账号 10-21
- 不止《生化危机》外媒精选30款恐怖佳作 10-21
- 王国两位君主北欧之地雷神之锤解锁顺序 10-21
- 梦幻西游梦玲珑穿什么 10-21
- 功夫熊猫阿宝邀你切磋,《蛋仔派对》联动KouKouLove第二弹开启 10-21