批量删除同名电子书(保留指定格式)有一个同名Python批量删除电子书工具助手,一个小书库清理器,先后存储了上百G的电子书,很多电子书一样的一本,不过四种格式,epub、mobi、azw3、pdf,多浪费硬盘啊,搜遍全网,没有现成的软件,只能自己动手。其他格式都被删除了,剩下epub格式的速度很慢,无法享受。
昨晚和朋友聊微信,突然想起盘里的200多G电子书,有很多格式相同的,太占容量了,5万多本,占了快200多G,手动删除了一些不感兴趣的书籍。和朋友讨论如果写代码来删除一些同名但格式不同的电子书,处理流程应该怎么样。后来朋友突然说,其实用数据库也可以弄,而且很快:第一步:用bat批处理遍历子目录的文件路径,我测试发现,5万多本的电子书,生成路径文本不用3秒就完成了,4M大小的文本。第二步:导到数据库,分割出文件名,不带后缀名那种 ,排序,加上编号,然后拼接上绝对路径,再删除指定编号的(删除是为了保留同名的某一本电子书),剩下的就是同名且格式不同的电子书路径了。第三步:在数据库上,给每行路径前加del /F /S /Q 命令,导出为文本,改后缀为bat,运行,即可把所有同名的电子书删除。然后我就想了一下,还写啥程序,这用数据库,一下就能完成的事,写程序还要花一天时间,太傻了。。。然后因为不懂数据库,昨晚是用excel对5万多行的电子书进行分列,拼接等等处理,不熟悉,一边百度一边弄的。。。。还是忙了2小时,不懂数据库真惨。。。今天一早起来,觉得还是不爽,我的电子书是处理完了,广大的吾友小书库满了怎么办,不懂程序的吾友,清理又不方便,所以还是嗑嗑碰碰,绞尽脑汁花了一天,写到现在发贴才写完python小工具《批量删除同名电子书 仅保留一本指定的格式》
第一步:双击运行《python小工具-批量删除同名电子保留指定格式》,默认是按epub>mobi>azw3>pdf>doc>chm>html>txt 顺序来保留电子书,简单说,如果你电脑里不同的文件夹里同时存在着多种格式的同一个名字的电子书,且其中有一本格式是epub,那么程序会保留epub格式的,如果没有epub,只有其它格式,程序会依上面的顺序,依次判断,最后,如果你的电子书格式在上面都没有,例如是ppt格式的,程序会自动保留一本,其它的一律删除。之所以优先保留epub,是因为其压缩率相对mobi高点,体积小点,两者排版差不多,以上关于epub和mobi的压缩率大小是我百度的。
第二步:回车后,会弹出窗口,你选择电子书所在的目录就行,会遍历子目录,列举出所有的电子书路径,千万不要选其它什么电脑软件或者非电子书的目录,免得把你电脑软件的一些文件误删除。第三步:选完电子书目录后,静心等待就行,稍等片刻,会输出正在删除xxx路径电子书的字样,当有些电子书文件是只读属性, 会自动调用cmd命令强制删除。第四步:当删除完毕后,会自动打开电子书所在的目录,到这一步,已经是完成整理了哦,看看你的硬盘省了多少内存(貌似是电子书是删除到回收站了,测试时没有留意,建议执行完毕后,清理一次回收站,再看看硬盘省下多少容量)。第五步:用下面我提供的 批量删除空文件夹软件,批量删除空的电子书目录。完美,哈哈。注意事项:打个比方,如果你想优先保留azw3格式的电子书,不要其它格式的,那就修改源码中的[("azw3", "AZW3"),("epub","EPUB"),("mobi","MOBI"),("pdf","PDF"),("doc","DOC"),("chm","CHM"),("html","HTML"),("txt",列表里的元组顺序。有编程底子的应该懂,这是列表里嵌入了元组。如果不懂编程的,修改时,要特别注意逗号大小写这些。
送到嘴上吧:打包了多种优先顺序不一样的exe,自行挑选使用那个
请先复制一些相同名字但不同格式的电子书,分别扔到几个子目录文件夹里,用我的软件自行测试几次,观察使用后的结果是否和你预期的结果一致,再对自己的电子书库大批量使用。免得误删了你的电子书了,岂不找我拼命。
批量删除完同名电子书后,可能会有一些目录是空的,此是就用它来批量清理空目录
批量删除空文件夹的使用教程:
记得勾上下面的两个勾,否则不会删除空的子目录。
如果你想用数据库或excel来批量删除,可以下载下面这个批处理,提取绝对路径:批处理 遍历所有目录及子目录的文件路径
from tkinter.filedialog import * #这个主要作用是os模块 删除文件,和运行时弹出,让你们选择要删除书籍的目录。
from operator import itemgetter #这个模块好像可以根据2个条件来排序,下面用来根据 书名和后缀名 排序.
from os import startfile
#下面可能有些功能或变量是多少余的,算法不精,时间来凑,只能用比较笨的方法来实现。
# 整体思路:
# 和上面的excel处理差不多,都是先列举出电子书路径,然后根据相同的书名对路径排序,再剔除只有一本的书的路径,剩下的就是重复的书本路径了,然后再根据算法判断,优先剔除epub格#式的,其次是mobi,再到azw3,再到pdf,再到。。。。。。,如果指定的格式都没有,就从重复的路径列表中,去除第一个路径,剩下的电子书路径,都是重复的。最后,大胆的调用删除命#令,全部删删删删删删,如果删除出错,就调用cmd命令强制删除。
Files_Names={
"sort_list":[], #后面,这个元素列表,会存储以下信息 [绝对路径,电子书名,后缀名,同一本书的数量序号,是否重复]
"ml_name":""
}
def list_name(ml_name):
file_names = os.listdir(ml_name) # 根据选择的目录列出里面的文件及目录 返回值为列表
if file_names != "": # 只要返回的文件路径和目录路径不为空,防止你犯二,选择了一个没有文件的空目录
for i in range(0, len(file_names)): # 列表转换为循环数。
path = os.path.join(ml_name, file_names[i]) #电子书绝对路径 例如:E://电子书/1文件夹/家书.epub
if os.path.isfile(path): # 如果为真,则是文件
# 实际测试,发现有一些电子书,没有后缀名,故加上判断,没有.的大概率是没有后缀名的书籍,此类的就放弃,不整理。之所以判断.号是否存在于path[-6:]而不是判断是否存在整个绝对路径path中,是因为发现有些文件夹名带有.号,而此时存在这个文件夹里的电子书恰巧是没有后缀名的,这种情况就会造成误判认为其有后缀名。所以我才判断.号是否存在于path[-6:],而不用整个路径判断
if "." in path[-6:]:
hj=path.split(".")[-1] #分割出电子书后缀名 例如epub
name_nohj=path.split("/")[-1].replace("." + hj, "") #分割,替换去除后缀名,只剩下电子书名 例如:家书
Files_Names["sort_list"].append([path, name_nohj, hj]) #[绝对路径,电子书名,后缀名]
else: # 如果不是文件,那应该是目录,就加上/,再调用自身方法,进行递归列出下一层的文件,听说很多人在递归这里搞不明白。。。
try:
list_name(path + "/")
except:
print("访问目录出错,可能不是一个目录,或者是奇奇怪怪的文件名")
if __name__ == '__main__':
#format_hj变量用于 指定电子书优先留下的格式,在前面的格式元组是要优先留下的,因为epub相对mobi压缩率高,排版差不多,所以优先留下epub的,其次是mobi,再到azw3 .....最后到txt,如果你的电子书,都不属于下面的格式,那就不管格式了,自动留下第一本,其它重复的书就删了。
#如果你们要优先留下azw3格式的,只需要调一下 下面的元组顺序就行,把("azw3", "AZW3")放到第一。
format_hj = [ ("pdf", "PDF"), ("azw3", "AZW3"), ("mobi", "MOBI"), ("epub", "EPUB"),("doc", "DOC"),("chm", "CHM"), ("html", "HTML"),("txt", "TXT")]
Files_Names["ml_name"]=askdirectory() #选择电子书所在的目录并存到变量里,后面重命名完成后,调用这个变量,显示文件夹出来
if Files_Names["ml_name"]!="": #此判断为了防止你不选择文件夹,直接点了取消,此时返回空,就不执行遍历电子书功能。
Files_Names["ml_name"] += "/"
list_name(Files_Names["ml_name"]) # 把选择的目录传入到list_name方法中,进行递归遍历照片文件路径
aa=sorted(Files_Names["sort_list"], key=itemgetter(1,2)) #根据 书名和后缀名 排序,出来的效果就是 即使不同文件夹里,但名字相同的电子书,都会排在一起,方便后期用挑选需要的格式,和删除
# 例如:
# ['E:/电子书合集/20200101/豆瓣高分电子书合集/酒神.azw3', '酒神', 'azw3']
# ['E:/电子书合集/20200101/酒神.epub', '酒神', 'epub']
# ['E:/电子书合集/电子书/小说/酒神.mobi', '酒神', 'mobi']
# 循环判断,给电子书,加上数字序号,当遇到重复的书本就加1,遇到不同的书本,就恢复序号为1
for index,i in enumerate(aa):
num=1
if index!=0:
if (i[1] == q_i[1]):
num=q_i[3]+1 #数字序号增加
q_i = i
i.append(num)
#根据上面的数字序号,循环判断,是否重复,重复的加上”重“字,不重复即只有一本的,加上”不“字
for index,i in enumerate(aa):
repeat = "不"
if index!=0:
if (i[3] == q_i[3]+1):
q_i.pop()
q_i.append("重")
repeat="重"
q_i = i
i.append(repeat)
#把在电子书列表中,有 不 字的列表 直接 用倒序删除掉。 不能用顺序,这是一个坑
for i in range(len(aa) - 1, -1, -1):
if "不" in aa[i][4]:
del aa[i]
#下面再通过把同一本书不同格式,合并到同一个列表中。再塞到一个大列表里。
bbb=[] #瞎鸡乱定的变量名,当时心态已经崩了 小列表
ccc=[] #瞎鸡乱定的变量名,当时心态已经崩了 大列表
for index, i in enumerate(aa):
if index!=0:
if (i[3] == q_i[3]+1): #这里通过判断前一个和后一个的数量序号是否相等,判断是否同一本书
bbb.append(i) #是同一本书,就塞到小列表中
else:
ccc.append(bbb) #表示不是同一本书,就把当前的塞到大列表,结束,开始新的一轮加塞
bbb = [] #清空小列表
bbb.append(i) #往小列表加进新的一本书
else:
bbb.append(i) #第一本书,就塞到小列表中
q_i = i
ccc.append(bbb) #最后一本 塞进大列表
if len(ccc[0])!=0:
for i in ccc: #根据算法,删除需要的格式,留下不需要的格式电子书,后面就根据这些不需要的电子书绝对路径,循环删除。
for hj in format_hj: #这是要保留的格式
BOOL = False
for index,o in enumerate(i): #这里的i表示同一本书,但不同格式的列表,o表示具体的一本书的路径信息列表
if hj[0] in o[2] or hj[1] in o[2]:
i.pop(index)
BOOL=True
break
if BOOL:
break
if BOOL==False: #如果多本书名相同的电子书格式都不符合 format_hj指定的格式,就按顺序移除第一本,即保留第一本。
i.pop(0)
for i in ccc:
for o in i:
try:
os.remove(o[0])
print("删除:%s"%o[0])
except:
print("删除不了,将调用cmd命令删除!"+o[0])
o[0]=o[0].replace("/","\") #不替换一下反斜杠,命令不生效
cmdd="del /F /S /Q "+o[0]
os.system(cmdd)
else:
print("竟然没有重名的书籍!恭喜!恭喜!恭喜!恭喜!恭喜!恭喜!")
startfile(Files_Names["ml_name"]) # 完成后自动打开 压缩图片所在的文件夹
内存管理丨4.7M
PDF文档分拣工具是一款非常好用的文件管理工具,这里有很多强大的功能可以使用,帮助你更好的进行文件整理,这样查找起来就会比较方便了,感兴趣的快来点击下载吧。软件介绍PDF文档(*.PDF) 查找、分拣、归类工具。功能介绍- 找出完全由图片组成的PDF文件。- 根据页面数或字符数分拣:可以从一批文档中找出页面数或字符数小于、等于或大于某个值的PDF文档,如分拣出页面数大于10页、或字数多于1000的
系统辅助丨686KB
O&OShutUp10是一款非常好用的文件管理软件,这款软件可以帮助用户非常方便快捷地管理整个系统,可以说是非常好用了,这是一个非常不错的软件,赶快下载下来试一试吧!O&O ShutUp10说明可打开或关闭win10各种功能。如果中文意思翻译不太好的地方,可用英文显示更明了。O&O ShutUp10优势更多的控制你的操作系统调整您的安全设置保护您的隐私控制位置服务控制Win
办公软件丨12.12M
极客多标签文件管理器是一个十分好用的、支持多标签页的文件管理器工具免费软件。有了这款软件,找文件就可以更方便更便捷了。另外它还支持Window10/7/Vista等系统!有需要的用户可以来微侠网下载使用。极客多标签文件管理器功能介绍1.支持多标签页面。多标签页面,使文件管理更加简单和容易。2.双屏幕文件管理。双屏显示,使文件比较更加直观。3.MAC文件管理MAC文件管理器的本地经验。4.多屏幕的大
服务器类丨9.2M
SysTools File System Migrator是一款利用云存储机制帮助进行快速的文件系统数据的一种网络文件迁移工具,如果你需要将大量的文件迁移到另外一台电脑上再也不需要一个超大存储量的U盘了,今天一个软件就可以进行网络传输的搞定,非常方便。软件介绍包含/排除文件类型选项仅将特定文件类型(用逗号分隔)从台式机迁移到云。应用基于日期的过滤器将数据从特定日期范围移动到云中,只需在“从”和“到
系统辅助丨35.4M
OneCommander(文件管理器)是一款非常不错非常棒的软件,其中的功能也是非常强大包含了多个方面,这是一款双窗口文件管理器,拥有强大的各种各样的功能,还可以外挂苹果或者安卓手机对手机进行管理,还拥有超多协议权力,可以说是非常全面了。基本简介Commander One 是一款双窗口文件管理器,它拥有强大的搜索,可以显示隐藏文件,无限标签,支持Root访问,内置进程管理器,而 Commander
文件管理PC端软件合集
超好用的文件管理器软件
电脑必备的文件管理软件大全
数据删除
文件整理
是不是面对一屏幕的文件看着就觉得心烦意乱,是不是经常会有电脑里的文件找不到,是不是想卸载某个程序却找不到文件的位置,那是因为你缺少了一款好用的电脑资源管理器,今天微侠小编为大家带来文件管理PC端应用合集,里面全是文件管理软件推荐,让你能够轻松的管理你的文件,让你的电脑变得清晰有条理化。想拥有更多使用和有趣的电脑软件吗,那就来微侠网看看吧。
电脑文件管理器软件非常适合现代办公使用,软件里提供了各种不错的功能,软件支持各种不同的格式及权限管理,帮助你有效的进行管理,小伙伴们你们还在等什么?一起来看看吧!
WinMerge(文件比较工具)
办公软件
详情EF AutoSync(文件同步备份软件)
办公软件
详情File version info editor(文件版本信息修改)
办公软件
详情Recovery Toolbox for CorelDraw(CDR文件修复工具)
办公软件
详情NetworkOpenedFiles(共享文件显示工具)v1.30中文绿色版
办公软件
详情Unreal Commander(文件管理)
记事管理
详情翰文标书及文档管理系统
办公软件
详情EF Commander Free(文件管理器)
办公软件
详情Duplicate File Finder Plus(文件查重软件)
办公软件
详情在我们的日常工作或者生活中,当处理过的文件多起来,就会出现文件混乱的情况,这时候我们想要找到自己想要的文件都非常不容易,但是有了文件管理软件就不一样了,用户完全可以用这种软件对各种文件进行管理,让用户可以更加轻松的找到自己想要的文件,可以帮助用户轻松的整理自己混乱的电脑文件,让自己可以体验到简洁美观的桌面和电脑硬盘,连找文件都会快上许多,对于那些平时不常常整理硬盘或者桌面的用户来说,这种软件是非常
功能强大全面的手机文件管理软件推荐,有了这些APP,可以帮助你很好的整理你的手机文件,将重要文件和垃圾文件分开,重要文件加密保存,数据备份,清理垃圾文件,节省空间释放内存,帮助你节省手机空间,提升运行速度!
系统辅助丨3.7M
Cloud Box工具箱是一款非常不错的工具箱软件,大量不同功能的工具都可以给你带来很大的帮助,从多方面下手,提供最大的便利,感兴趣的随时可以下载。软件介绍一款电脑实用软件集合工具箱,作者把自己常用的软件做了收集和整理,重装系统和装虚拟机能节省很多时间。功能特色软件分为:装机检测、系统优化、常用工具、影音下载、其它工具。- 装机检测类为:系统激活工具、系统分区、系统驱动和电脑硬件检测等。 系统优化
系统辅助丨2.9M
E-钻文件夹加密大师是一款安全系数极高的软件,用户可以将文件拖放到软件中进行加密处理,使用起来非常方便,还有很多强大的功能都是可以直接使用的,感兴趣的一定不要错过。软件介绍E-钻文件夹加密大师是一款专业的数据加密软件,专为拥有大量商业秘密和个人隐私的用户订制的。可以加密任意的文件和文件夹,并且支持硬盘加密。多种原创加密技术, 让您的文件拥有钻石般的硬度。安全可靠,无懈可击!E钻文件夹加密大师是一
系统辅助丨12.1M
WiFi共享大师电脑版是一款可以帮助用户连接免费WIFI的软件,这里提供了很多功能,包括检测上网环境、提高上网速度等,使用起来非常方便,享受网上冲浪的趣味,喜欢的随时可以下载。软件介绍WiFi共享大师可以在有无线网卡的电脑上直接创建免费的WiFi网络了,手机、平板电脑等便携设备就可以直接连接这个免费的WiFi网络,享受上网冲浪带来的乐趣。笔记本一般自带有无线网卡,台式机那就需要自己买一个无线网卡插
系统辅助丨65M
元气桌面壁纸电脑版是一款拥有大量不同主题的壁纸软件,不仅有动态的还有各种静态的,每天都可以更换不同的风格,所有的图片都是高清的,喜欢的快来下载吧。元气桌面软件介绍专为年轻人打造的动静态壁纸及桌面美化的电脑应用软件海量高清动静态壁纸下载使用,最新版极速下载元气桌面软件特色解放臃肿桌面,还你无限清爽桌面整理助手:智能识别文件,一键分类整理,个性设计排版,壁纸自动切换一键整理桌面桌面从此清爽如新动/静壁
系统辅助丨33.1M
DynamicTheme(Windows动态壁纸)中包含了多种风格的壁纸内容,无论是动态的还是静态的都可以设置,大量素材可以选择,使用起来也相当方便,感兴趣的一定不要错过。Dynamic Theme动态背景和或锁屏图片,带有每日必应或 Windows Spotlight图片一张必应或 Windows Spotlight图片或个人图片。软件特色使用每日必应或 Windows Spotlight 图片
系统辅助丨121KB
RunCatWindows是一款电脑上CPU检测工具,在你的桌面上会有一只可爱的猫猫,猫猫的走路速度就代表了CPU的占用率,有需要的可以下载进行检测,使用起来相当方便。Run Cat介绍这款软件「主要功能」就是在你那空着不用白不用的任务栏上养一只跑步的小猫咪。非常简洁,不花里胡哨。而次要功能呢,它其实还可以监测 CPU 占用,这决定了猫咪的奔跑速度。CPU 占用越高,猫咪速度越快,这大概是一款 5
系统辅助丨52.9M
火萤视频桌面2022最新版是一款全新的桌面壁纸软件,这里的风格相当齐全,包含动态的、静态的还有各种不同的资源可以选择,给你带来全新的体验,操作简单,有需要的随时可以下载。萤火视频桌面2022特色全球首家支持全平台的视频桌面--全面支持XP、Win7、Win8、Win10全球首家提供视频内容推送的视频桌面软件全球第一性能优化的视频桌面--CPU资源综合占用最低全球第一家智能控制的视频桌面软件全球第一
系统辅助丨1M
系统文档目录迁移修改工具是一款强大的搬家软件,可以将你电脑硬盘中的所有文件都转移到其他地方,使用起来非常方便,也可以批量操作,给你带来非常便利的体验,有需要的千万别错过。说明介绍有木有发现,电脑使用久了,电脑的 C 盘就变的火红火红,或者是随着电脑系统的重装,电脑 C 盘的文件也就全部丢失了...[黑线]虽说数据无价,但是对于 C 盘的文件,咱也不敢乱动呀,一不小心就得黑屏...那么有没有可以一键
系统辅助丨3.5M
喵切(桌面壁纸切换)是一款可以随意切换桌面壁纸的软件,这里的种类相当丰富,你也可以自定义各种风格的图片设定成你的壁纸,该软件绿色小巧,有需要的随时欢迎下载。软件介绍喵切是一款壁纸切换工具,绿色小巧,用户用它可以切换电脑壁纸,点击猫咪就可以随意切换壁纸了,特别方便,然后用户想要切换其他的壁纸,也可以自己替换掉img文件夹的图片。软件特点- 软件小巧,一键安装- 点击猫咪,轻松切换壁纸- 自定义壁纸内
系统辅助丨4.9M
简易日历是一款简单好用的电脑日历软件,你可以将各种重要事宜用不同的颜色标注出来,使用起来相当方便,该软件完全不占内存,界面也是非常简洁的,感兴趣的快来下载吧。软件介绍一款非常简单小巧的桌面日历工具,该日历有秒表、记事等功能,时间和节日信息一目了然,随时可以查看,界面非常直观,用户查看时间非常便利。软件特点- 更快、更轻简洁纯净的外表,更轻薄的体积,让工作更有效率- 永久免费,放心使用我们承诺,永久