3月心声和致歉声明/分布式论坛程序和铁血算法

王志勇 发表于 2020年03月12日 12:40

由于众所周知突然的“咯噔咯噔咯噔”的原因,本博客在2月10日~3月5日的所有数据丢失。因为一直觉得服务器稳定,所以会隔较长时间备份一次博客,最后一次备份是2020.2.10。

向大家表示歉意,2月10日~3月5日期间的评论,有大约一半会丢失。另一半,是我在服务器宕机的当天,从百度缓存里复制的,然后手工一条一条复原。百度缓存对每篇博客,有个时间节点,所以声明:有时候会出现某一楼之后的评论会全部丢失,并非是我删除了

有必要说一下这家国人的VPS商(主要做香港/日本/韩国/美国的服务器),是史上最便宜的香港VPS。从去年8月到今年3月5日事发前,一直相当稳定。1个多月前,已经有网友反映日本服务器已经宕机多天还没处理。

3月5日,我的VPS突然不能访问,然后去他们的网站看通知。通知是请在明天以前做备份,服务器要迁移。也就是3月5日是可以做备份的,但是3月5日已经彻底宕机,无法拿到数据。

等不了他们了
已经等了7天,现在等不了了,当天给他们发的工单、QQ消息,至今未回。他们的网站,以前的联系方式,是国内的136手机号,还能联系到。3月5日,发现他们唯一的电话是+1的国外号码。已经完全失联,看来跑路无疑,已经凉透了

我的2个空间还剩余4个月的使用时间。剩下的钱不可退回来,也不做这个要求,只希望拿回数据。

倒闭前的人文(人性)处理方式
但是这一家,连给用户备份数据这一点都做不到。只要稍微有一点人性,可以事先发邮件通知,我的邮箱里没有邮件通知。而且因为垃圾邮件、催费邮件多,所以我平时也不看邮箱。

或者他们可以提前一天关闭客户的服务器一段时间,然后客户肯定会去看他们的网站上的通知,提醒用户在约定的时间里,备份数据。

这样的事情,同样发生在去年的一家便宜VPS。之前都较稳定,然后突然跑路,数据也拿不回来。

这一家,在日本服务器宕机的期间,编造日本地(隔开)震的谎(隔开)言:地(隔开)震影响了他们的服务器。

最近很忙
因为最近很忙,加上博客丢失了将近一个月的数据,所以更不想写博客了,写博客也“耽误”不少时间。因为受疫(隔开)情的影响,孩子每天的网课,我需要花更多的时间参与

现在我已经把2月写的10篇博客都复原了,是宕机的当天,从百度缓存里复制的。但是,有2篇没有被收录,只能从本机里找了。因为我每次发博客之后,都需要编辑至少10-20次,本机的文章都是编辑之前的文章,这2篇要复原基本不可能了。

分布式论坛
独立微博程序还没有时间开工,却又萌生一个编写开源的分布式论坛的想法。写开源程序,是我的一个人生使命──必须有作品,哪怕是0收入。独立微博程序的开发周期,从0开始编写直到上线,约为4-6个月的全天工作日,约900-1500小时以上的编程时间,我的眼睛……分布式论坛的开发工作量,估计与此不相上下。

这决不是重复开发wheel。虽然有一部分名词听起来并不是新词,或者是老掉牙了。但是,确实有其存在的重要意义,有刚需的新功能。这种分布式论坛,也是我设想中的一个新玩法,国内外应该还尚未有这种玩法,就是架设在用户虚拟主机、或VPS上的论坛/讨论组,域名由我方提供,或者由用户申请备用域名(为了数据安全,不要用博客的域名)。

或许有人说,国内外论坛程序,已经有很多很多了。

但这种程序有所不同,类似于Web版的微信群、QQ群的功能,想做什么样的形式,都能做出来,只是开发者工作时间长短的问题。2009年初我从0开发的t(隔开)g(隔开)for论坛,就是这种形式,既能当论坛、也能当讨论组使用。

但是,当时的这个论坛,并非现在设想中的分布式。这个分布式的含义,是虚拟主机/VPS,由用户自己提供。

而且,可以随着用户的需求,将多个论坛关联起来,使服务器之间产生数据上的互动。

分布式的优点是:数据并非集中,分布广泛,所以相对安全很多。

铁血算法
“铁血”,我暂时想不出来有更恰当的词语。因为wall是一年比一年高了,导致我越来越多地使用“隔开”体。铁血算法,就是将数据进行加密,用户看到时再还原。

被几乎所有人认为现在最安全的HTTPS,其实早晚有一天是会失去其安全意义的,也就是原先的安全功能在某种情况下会形同虚设。而且就是在HTTPS刚出来不久,实时传输中就可以破解其安全级别。

思路是,虽然HTTPS在路由服务器当中是加密传输,但是URL本身是明文的,在路由服务器中,URL都是可见的。某个路由服务器获取URL后,在服务器上设计一个客户端软件,甚至用wget,就可以获取这页的内容。除非这些web,是使用需要Cookies才能访问的页面,那么路由服务器,才无法获取这页的内容。

所以,实质上,对于不需要Cookies就能访问的大多数web页,HTTPS早晚会形同虚设。而且,HTTPS开发者在开发之初,没有考虑到150ms以上跨国间的服务器,https访问会很慢

最好的解决办法,就是web开发者自行将文字进行加密。效率最高、最节省客户端CPU资源的办法,就是将文字在(程序语句产生的)HTML页的数据中,将正文内容的文字的顺序打乱,然后用JavaScript还原,称为“铁血算法”。

这种打乱文字顺序的方式,在实时传输中,是不可能被路由服务器获取原文信息的,除非使用一个高度通用的相同公式,路由服务器用此公式进行还原,这个机率无限无限接近0。

但是,这种打乱文字顺序、再用JavaScript还原的方式,怕搜索引擎。因为在大约10年前的搜索引擎,是忽略JavaScript产生的数据的。如今的搜索引擎,JavaScript产生的数据,只要用户看到的是什么数据,搜索引擎抓取到的数据,就是和JavaScript产生的数据是一样的。(CSS的display:none里的内容,暂时可当“隔开”体使用。)

因此,还需要用更高级的办法,来避开搜索引擎。

2020-03-14 09:25更新:
今天服务器又恢复了,赶紧下载了备份,2月10日~3月5日的数据都已恢复。

23条评论:
1   张波博客 2020-03-12 14:04
我香港的VPS从来没有备份过,看来得要备份了。虽然上面放了几个小小的站,但也是一点点的写出来的。

自由勇 2020-03-12 17:52
嗯,得坚持定期备份,稍不留神,数据就没了。

2   angel2018 2020-03-12 15:37
勇哥,辛苦了。
你的博客文章数据大小压缩后并不大,是可以设置每天自动备份的,勇哥大意了。

上次我停了另一个vps,用了一个新的,原来的少数数据也没备份回来,切换也是一种成本,哎。

自由勇 2020-03-12 17:53
谢谢!定期备份、双服务器间自动传输,程序和脚本没来得及写,所以暂时只能手工定期备份、下载。

3   心灵博客 2020-03-12 16:37
那天我给你的gmail发了邮件。格子老师有你文章的备份。

自由勇 2020-03-12 17:54
谢谢!我还以为是格子老师发的。那个链接只有标题,没有我的文章备份,当时我也想从那里找。

4   心灵博客 2020-03-12 16:40
我的电脑上、nas上,都有当天的最新备份,最糟糕情况下丢半天的数据。

自由勇 2020-03-12 17:55
备份工作做得很好!

5   心灵博客 2020-03-12 16:44
国人的,外国人oneman的必须每天备份。
国外我只买大厂的,比如vultr digitalocean linode,(搬(隔开)(隔开)工从没买过),香港的很多都是国内小作坊或者是oneman的,再便宜也别买,除非买来挂机。

自由勇 2020-03-12 17:55
嗯,大厂贵些。vultr和瓦(隔开)工的速度和线路、稳定性没的说,是美国主机里数一数二的,有博友就是长年用这2家的。

6   2020-03-12 17:42
默哀三分钟。oneman或者小作坊的真心不能认真作站。或者一定要就要日日备份。勇哥前面的确用的很爽,但是好日子不长……

自由勇 2020-03-12 17:57
谢谢!之前用得很好,boom是突然出现的。

7   心灵博客 2020-03-12 19:53
文章内容他的数据库里面有的,只是没展示出来。你联系一下,他就会发给你啦。

自由勇 2020-03-12 20:08
谢谢!也许他的时间节点比百度缓存早。我还是凭记忆复原一下这2篇博客吧,丢失的部分约10%左右。

8   格子老师 2020-03-13 18:37
你的两篇文章 我已经邮件发给你,不知道 有没有用!!

自由勇 2020-03-14 08:49
谢谢!邮件暂时没有收到。今天服务器又恢复了,赶紧下载了备份。

9   笛声 2020-03-14 08:43
hostloc论坛里面经常有人提到:主机在国外的网站,用http能打开,https就打不开,墙看不到里面的内容,直接阻(隔开)断,所以你说的加密没啥意义,以后的墙会往白名单方向发展,我们斗不过的。

自由勇 2020-03-14 08:50
这种加密是用于更大程度地防止qiang。一旦域名被qiang,就没有办法了,只能更换域名,所以称为“备用域名”。

自由勇 2020-03-14 09:54
刚想起来,hostloc论坛前段时间很多人讨论的这种http能打开,https阻(隔开)断,主要是一部分大厂的香港VPS。似乎没有见过网友说其它地区的主机有这种情况。

10   自由勇 2020-03-14 09:24
大家好!今天服务器又恢复了,赶紧下载了备份,2月10日~3月5日的数据都已恢复。
11   格子老师 2020-03-14 14:14
你这个博客没有邮件通知,回复了都不知道,得自己过来看看是否有回复!!

自由勇 2020-03-14 16:21
因为时间的关系,没有做这个功能。

发表评论:
名字: (*必填)
博客: (可省)

正文:

  记住信息?

直接发送Trackback到此文章

说明:本评论系统不支持HTML代码。(您的留言需要审核,审核规则请见这里。)

王志勇:1980-09-26 (40周岁)
程序设计,前端设计。

版权声明:本博客所有文章,均符合原创的定义,禁止转载,违者将必究;正确的方法是贴原文的标题和网址即可。

与此相关的链接
自由勇专栏

Blog存档 Archives

2019年12月
2019年11月
2019年10月
2019年09月
2019年08月
2019年07月
2019年06月
2019年05月
2019年04月(30)
2019年03月(30)
2019年02月(30)
2019年01月(30)
2018年12月(30)
2018年11月(30)
2018年10月(30)
2018年09月(17)
2016年-2017年(9)
2014年06月-09月(10)
2013年 +

2012年 +
2011年 +
2010年 +
2009年 +
2008年 +
2007年 +
2006年 +
2005年09月(4)

Copyright © 2006-2020 auiou.com All rights reserved.
此Blog程序由王志勇编写 已经发布在Arsue