去年开始我想学 Python 爬虫,由于工作和家庭事务太多,根本没有时间好好看视频教程,于是买了本《Python3 网络爬虫开发实战》。鬼知道这书原来这么厚,间断地看完 selenium 部分就放着吃灰了。
我想,既然都学了,就得找东西练练手啊。由于平时需要用各种软件,于是我计划写一个抓取 正版软件优惠信息 的爬虫。
恰好去年是 AI 爆发的一年,靠着清华大学开发的 Codegeex 插件+搜索引擎,我写了个 300 多行的小爬虫,把优惠信息抓取下来后保存成 json 文件。家里有一台 10 年的老超极本,目前装了 Ubuntu Server 系统 24 小时运行,我添加了 crontab,于是这个小爬虫就可以每天自动运行了。
爬虫的目的绝不仅仅是拿到数据,重点是要把数据用起来。过完年后,我开始琢磨,可以用这些数据做些啥。
还是时间有限的缘故,我暂时放弃自学前端建站的打算,选定 Google Sheets、腾讯文档这种在线表格来展示数据。于是靠着问 ChatGPT、Google Gemini ,又写了个几十行的小脚本,把 json 数据转换成 Excel 表格。
既然“项目”已经上线,接下来就是如何推广的问题了。
国内不是什么问题,我在 博客 和 微信公众号 上发文介绍这个表格:《我制作了一个“很丑,但很有用的表格”》,但是国外访问有两个问题,一个是速度,另一个是语言。为此,我又专门建立了一个 Blogger,命名为:AN UGLY BUT USEFUL SHEET ,希望老外能顺利访问。
接下来我的计划就是尽可能多地去更新表格,有机会就推广。虽说这是一个业余项目,但也花了不少时间和精力,希望它能成功。
感谢你能阅读到此,希望这个表格能帮助到你。如果觉得有用,一定要帮忙转发分享哦!