近日,草叶网旗下大部分平台在技术上完成了升级改造,文章网址页取消了以年、月命名的文件夹。
改造前网址结构:https://www.sccaoye.com/a/2024/07/2536.html
改造后网址结构:https://www.sccaoye.com/a/2536.html
缩短了网址结构,便于更好的使用现在新功能。为什么这样改造呢,优势在哪儿?我们来看看草叶网最近十多年的经历。
5年前吧,草叶网的网址一般为:https://www.sccaoye.com/2536.html,那时候大家都喜欢这种结构的文章链接。
这也是zblog的伪静态规则,实际2536.html文件是不存在的,只是读取的数据库,数据库伪装成静态文件,这样的网址链接美观简短好记住。
而在2022年的时候,草叶网旗下有部分网站文章数量已经达到百万级别,每次文章访问都要读取数据库,数据库压力非常大,导致整个网站负载很严重,为了缓解这个问题,我们加了生成静态的功能,我们就把访问数据库的2536.html直接生成了实实在在的文件。而我们访问网址:https://www.sccaoye.com/2536.html,就实实在在的访问的是文件2536.html,不需要再走数据库,这样就大大减少了数据库的压力。
但是这样一改进后又出现了一个新的问题,那就是网站的根目录下几百万个文件,如1.html~1000000.html等等,导致开发的时候找网站根目录的某个文件都很难找到,而且网站的根目录打开也很慢了。那怎么办呢?于是技术人员就想了一个办法,把所有文章的文件都放在一个目录a/里面,然后为了查找方便,又在a/目录里面按照年月划分给分类存放,这也就是经典的文件目录,如:/a/2024/07/2536.html,这样生成的静态文件按照年月分类存放,简直非常完美,这种方案也是很多大型门户站最喜欢的做法,包括新浪、网易、腾讯等。
但是到了近期,草叶网旗下新增了用户置顶、刷新文章的功能,新增了这些功能后,我们发现一个bug,也就是比如文章的链接为:/a/2024/05/2536.html,这也就是说这文章是2024年5月发布的,而我现在刷新一次文章的话,文章的发布时间就变成了2024年7月,相对于文章链接也就跟着变了,变成了:/a/2024/07/2536.html,这样的话原来的文章链接就打不开了,所以针对此文章,草叶网技术团队又重新升级了文章链接的结构。
改造前网址结构:https://www.sccaoye.com/a/2024/07/2536.html
改造后网址结构:https://www.sccaoye.com/a/2536.html
这改造后,文章置顶、刷新等都不会改变文章的链接地址,而文章也都存放在/a目录下,这样也就很方便归类了,大家若对此有其他看法,欢迎留言讨论。