目前备份新浪微博的方法
新浪微博于2009年公测,到现在也有十多年历史了,我也是从2010年早期注册的用户,微博现在也是成了我们社交的一部分,经历过几次新版变化,当然现在我登录也是被强制更新了v7新版,新版界面真的太难用了,目前也找不到办法退回旧版,我辛苦整理的标签也没了!没能早点备份旧版微博,后悔啊! 哭了!
相信大家一定也看到过如下提示,“作者已删除微博”“作者已设置仅半年可见”,如果不经常备份,就会不记得当时是啥内容……微博的体验真的一塌糊涂。
现在也是时候养成备份习惯了,为了防止微博哪一天关闭了,我们还能及时留下回忆~以前微博也是有第三方备份应用的,但是现在可能失效了,因为微博接口经常变更,插件脚本需要不断更新,也是很麻烦的事。好在现在还是有大神们开发备份工具,我们及时利用当下的工具去备份,永久留存。
目前微博备份有这些工具:
- 稳部落
- weibospider
- Octoman(浏览器插件)
- SingleFile(浏览器插件)
- MemoMe
- Weibo-archiver(浏览器脚本)
- 微贝(已失效)
- 印象笔记(剪藏插件)
- 有道云笔记(剪报插件)
稳部落
官网:https://www.yaozeyuan.online/stablog/
github:https://github.com/YaoZeyuan/stablog
稳部落是2020年出来的,支持Windows 64系统与macOS系统,可以备份图片,支持增量备份、断点续传,最终导出PDF电子书。
可选备份时间范围,微博顺序、是否备份图片、以及按月/年/条数分页。炸号也能用,但注意不能备份被炸到自己都不能登陆的账号,也可以备份别人的微博。
稳部落蛮好用的!就是备份比较慢,每页要休眠20s,防止被封,我4000多条微博备份了3小时左右,时间上还是可以接受的,它同时也会下载图片,空间比较大,如果不需要图片可以尝试在html代码改成微博外链地址,全量备份后以后就可以增量备份了,就不用再花那么多时间。
不过目前无法导出数据,出现如下报错:
umi.f506ab8c.js:formatted:90445 Uncaught (in promise) ReferenceError: remote is not defined |
issues上也有反馈了这问题,等作者修复吧。
weibospider
github:https://github.com/dataabc/weiboSpider
这个比较复杂,需要用Python来爬取,它可以爬取一个或多个新浪微博用户的数据,并将结果信息写入文件或数据库。
爬取结果可写入文件和数据库,具体的写入文件类型如下:
- txt文件(默认)
- csv文件(默认)
- json文件(可选)
- MySQL数据库(可选)
- MongoDB数据库(可选)
- SQLite数据库(可选)
同时支持下载微博中的图片和视频,具体的可下载文件如下:
- 原创微博中的原始图片(可选)
- 转发微博中的原始图片(可选)
- 原创微博中的视频(可选)
- 转发微博中的视频(可选)
- 原创微博Live Photo中的视频(免cookie版特有)
- 转发微博Live Photo中的视频(免cookie版特有)
这个好处是会自动爬取,也可以定期爬取,不过它是纯文本格式的,不能生成可视化网页,作者说暂时没有这计划,如果有能力者可以自己定制~
Octoman
官网:https://blog.liuguofeng.com/p/5670
github开发版:https://github.com/misswell/octoman-weibo-backup
这是个浏览器插件扩展,chrome和edge商店都有上架,也可以去官网下载离线包。
每500条微博会保存为一个html文件,保存的信息有微博文字、评论数、转发数、点赞数;图片可点击,会跳转到微博,每备份500条,会休息两分钟。
注意事项:
- 需要登录微博
- 请勿同时保存多个用户,会限制访问
- 保存过程中不建议频繁操作微博
- 每500条微博存为一个HTML文件,可用Chrome打开
- 如想存图到本地,可打开HTML文件后右键另存为,建议及时另存
- 微博太多会保存不全,因为新浪接口返回暂无微博
- 显示的总数会和实际数量不一致,微博接口的问题
- 保存的文件如果出现finish代表已经全部完成
- 经用户反馈炸号微博也可备份,前提是能登陆看到自己的微博
- 如出现验证失败的提示,请点击验证失败这段文字,然后重试
效果也是跟稳部落一样,不过目前使用显示“验证出错,请点击此链接,然后返回重试”,等作者更新吧。
SingleFile
github:https://github.com/gildas-lormeau/SingleFile
这也是个浏览器插件扩展,这个其实不是微博备份,而是将网页整页备份,当你想只需要备份几页就可以用它~通常咱们右键另存为网页,是不会保存图片和样式的,而这个插件能完整保存图片外链、样式,永不会丢失!当然保存下来文件会比较大,需要你浏览器全部加载才能保存。像新版微博可能还是会丢失图片,别的网站效果很好。
另外有个分支SingleFileZ,能将网页整个打包,打包成zip格式,包含已保存的资源(图像、字体、样式表和框架)等。若要用浏览器访问文件,必须打开--allow-file-access-from-files
选项。
MemoMe(原名Speechless)
官网:https://speechless.fun/?from=liuguofeng
github:https://github.com/meterscao/Speechless
使用说明:https://docs.qq.com/doc/DWEZQanFUWUJ4SGV6
一键轻松备份新浪微博,把文字、图片、评论,导出成PDF到本地
主要功能:
- 备份全部微博
可备份全部时间的微博,修复了旧版本2018年以前的微博无法备份的问题。 - 备份微博评论
微博下的评论和回复内容,可以备份到本地。 - 更便捷的浏览方式
可以像微博一样按照年月查看微博、浏览图片、播放视频、查看评论。 - 导出多种格式
把微博导出为 PDF 备份到本地,还支持 Markdown、TXT多种文件格式。 - 备份多个账号
可以备份多个你珍惜的微博账号,轻松切换。 - 备份图片和视频
微博内容中的图片、视频文件可以直接备份到文件夹。 - 备份收藏的内容
收藏过的微博内容也很重要,也支持备份到本地 - 傻瓜式安装使用
只需下载安装客户端即可,支持 Windows 和 Mac 两种系统。
这个插件功能蛮多的,能导出可见范围的微博,不过唯一缺点是收费,自己看需求斟酌吧。
Weibo-archiver
github:https://github.com/Chilfish/Weibo-archiver
又一个新出的备份脚本,这脚本是面向有编程基础的用户,关于更多操作细节可见讨论区
该工具仅能获取公开可见的微博,对于那些仅半年可见之外的、仅粉丝(自己)可见的等不是自己的微博,将无法获取。
这个工具我喜欢,有HTML界面,不过想要查看只能输入命令运行本地服务器查看,比较繁琐,期待作者未来出桌面应用。开发者很友好,有过交流,如有需求可以向开发者提供建议,我也赞助了一下~
微贝
目前已失效
作者链接:https://weibo.com/1088413295/F9rBm6xpK
微贝是2017年开发的,由作者Easy开发,我当时也使用了,也很不错,就是没有转发评论数字栏,后来变收费了,现在也找不到下载地址了,我电脑里也打不开这个工具了……
当初的备份现在打开网页发现图片不显示,我看了下源代码,需要把当时的wx前缀地址改成tvax,就能显示图片了。
如:
wx1.sinaimg.cn |
改成:
tvax1.sinaimg.cn |
悲报:2023-01-06发现无法访问图片了,微博又加强了防盗链……只能等后续解决了。
New 2023-01-10更新新的方案:github issues 上有大佬给出了新方法,用 https://image.baidu.com/search/down?url=
百度图片作为代理帮我们下载图片,即可在html文件全部显示,缺点无法在新标签页预览,只能下载。
如下面例子:
https://image.baidu.com/search/down?url=https://tvax4.sinaimg.cn/large/488c829bgw1es31sl8s7rg2091066gqc.gif |
在html里批量替换加上前面地址就好,不过上次微相册维护后有很多图片失效了,除了肉眼手动排查之外,可以一个个打开html文件用SingleFileZ插件保存,然后在manifest.json文件再排查无后缀的图片,替换新的地址即可。也可以在images文件夹找空白文件,再在html里搜索相关路径替换新的地址。
印象笔记/有道云笔记
印象笔记官网:https://www.yinxiang.com
印象笔记剪藏插件:https://www.yinxiang.com/product/webclipper1/
印象笔记是很多年就出备份微博的功能了,关注@我的印象笔记在转发/评论/私信@我的印象笔记 就能保存到印象笔记,很多时候在评论下就看到有很多人@笔记啥的,就是这样来的。不过目前接口失效,这功能多半也不好使了,它网页端有个“剪藏”插件,可以截屏网页保存到你的笔记,也可以弄标签,画个批注等,不过截的是图片不是可复制的文字……如果不是很在意的话也可以试试,下载它的客户端可以导出笔记,可以导出html文件,网页版没有导出功能。平时看到有用的微博可以截图留念,用来应急用也不错。
有道云笔记官网:https://note.youdao.com/?keyfrom=ydoc
有道云笔记剪报插件:https://note.youdao.com/note-download?keyfrom=ydoc
有道云笔记也有类似插件,叫剪报,我试用了下不如印象笔记来的方便,它自动识别的网页正文不是很准……用来做备用笔记也是可以的。
微博新鲜事
我突然想到个鬼点子,就是微博不是有个“新鲜事”功能吗?可以收藏微博进去,然后再利用SingleFile插件保存网页,算是个折中的收藏备份方案吧……不过原文有个需要展开全文的按钮,点击会跳转新的地址,这个问题待解决中。
总结
工具名 | 说明 |
---|---|
稳部落 | 这工具蛮好用的,可惜现在作者没有继续维护了,备份较慢。 |
weibospider | 需要有Python基础,这个好处是会自动爬取,不过它是纯文本格式的,不能生成可视化网页。 |
Octoman | 浏览器插件扩展,作者也是很久没维护了。 |
SingleFile | 这是一个网页整页备份的插件,算是另一种方法。 |
MemoMe | 这个插件功能蛮多的,能导出可见范围的微博和评论,样式也很好看,可以考虑试试。 |
Weibo-archiver | 又一个新出的备份脚本,仅面向有编程基础的用户,它界面还蛮好看的,未来会出桌面应用。 |
微贝 | 该插件已失效 |
印象笔记 | 另一种备份方法,仅适合单段微博收藏。 |
有道云笔记 | 另一种备份方法,自动识别不是很准。 |
目前感觉有用的是稳部落、weibospider、MemoMe、Weibo-archiver这些工具了,看情况对症使用,不知道未来会不会有人编写新的插件。
如果遇到评论加载不出来,请不要担心,稍等一会儿,等待服务器后台修复即可,或者过一段时间来看看~