谈网页archive
原帖:https://web.archive.org/web/20220318045732/https://twitter.com/ultramarine471/status/1504101790089850884https://web.archive.org/web/20220316222354/https://twitter.com/ultramarine471/status/1504107230081130498https://web.archive.org/web/20220318045922/https://twitter.com/ultramarine471/status/1504256523144368128https://web.archive.org/web/20220318051900/https://twitter.com/NiltokotliN/status/1504512083798347784
https://web.archive.org/web/20220316113721/http://mindhacks.cn/2011/11/04/how-to-interview-a-person-for-two-years/
“你有了解过 mindhack 吗,我感觉他也不是像传说中的那么神。”
“我看过《暗时间》来着,感觉他至少在思想实力上都远超我们大多数人,不过我倒是好奇你会知道他,毕竟《暗时间》也有将近十来年了。”
“你是哪一年来着,应该比这本书要大几岁吧。”
“这本书是我小四一年的读书摘抄,当时以为自己懂得了这么多一定能成为大师的,当时我疯狂地背单词写代码,准备尽快出国读书。”
“唉,其实我一直不知道怎么安慰你,单单在你身上发生了这么多的事。”
“你对我一直很好的,我会记得,如果有下辈子我想让你做我的女儿。”
“他的思想文章都非常好,只是他忽略了一些细节,例如这一篇《怎样花两年时间去面试一个人》博客,有两三个链接因为删帖、权限等原因而无法访问,并且这么久了也没有意识到这几个链接失效了。”
“啊,我还以为是”
“就这样,他是在博客网志为主的时代里成长起来的,或许是当时删帖和屏蔽都比较少吧。”
“但是这么久都不检查一下自己博客里面的链接还能不能点开,简直是太不负责任了,你想想你在一个景点看到了麦当劳的提示牌,兴致勃勃地走过去发现是个厕所,这对我可是天大的侮辱,虽然我知道可能也只是负责人没检查好,厕所提供的gdp不可能高过麦当劳,地方政府不会允许麦当劳被厕所优势取代的。”
“这两个有什么冲突的地方吗,不过没想到你也有这么可爱的一面。”
“Flattered. 不过别想用这个来转移话题,我不懂网络编程,所以有什么方案能解决这个访问不了的问题吗。”
“我知道有网络快照和 wayback machine 来着,后者就是你把网址粘贴到这个网站下,它就会自动帮你保存网页内容这样子。”
“那要是这个网页后续有变化,这个wayback machine会自动帮你追踪最新变化吗。”
“应该不能。”
“那不行,这样还是需要我手动地跟踪所有引用的网址的变化,要是他们没删帖,但是把帖子改得面目全非或者干脆就跟原先的唱反调,就跟社会主义前后三十年一个德性,那不是更完蛋吗。”
“但至少快照是在那里的,只要你能提供你所希望的某段时期的某个版本的快照,应该就可以让读者满意了吧。”
“我明白你的意思了,你是说直接把快照的链接当成原先的链接一样放到博客里面,告诉读者只有这一段时期的这个网页版本是有效的,后续的修改完全与作者写作时的意志无关。”
“差不多吧。”
“别每次都差不多啊,世界上就是因为有了许多跟你一样的差不多的忠实信徒,才会把很多好事都给办砸,确切一点会死吗,以后要是喜欢的人问你喜不喜欢她,难不成你也这么回答人家,”
“啊我,”
“对了,你刚刚说如果有下辈子想做我的女儿来着,但众所周知,嗯……”
“是让你做我的女儿啦,告诉你也没什么,我总感觉你跟我家的猫渊源不浅,她平时见人就信任地把自己摊平,但一见到你就远远地躲开;但同时上上次我去三舅家的时候,他们的两只猫却根本不怕你。”
“也就是说,只是我家的猫在怕你,当然也可能是羞于见你,总之不是血海深仇就是三世孽缘,我虽然不懂猫语,但她的心意我能感觉得到,就在这两个选项之间徘徊着,答案也说不定就非得是唯一的,我家的猫一天到晚就老纠结一些乱七八糟的东西,纠结的时候连毛球都不怎么爱玩,草草应付了事。”
“这么牵强的说法都能信誓旦旦地当成理由吗,这算什么呢,天才少女的余裕吗。”
“哪里牵强了,你跟她本来就很像吗,在我看来都快有夫妻相了。”
“恕我冒昧,你的视力应该还是正常的吧,还是说……”
“我能看到好多好多你们看不到的东西的,所以别把重心放在论证过程啦,毫无保留地相信我就好。”
“小时候我不懂事,总觉得世界上所有人都应该有爸爸妈妈,于是我找啊找,问啊问,终于找到问到了两个东西,一个相信是我的妈妈,另一个……”
“啊,我有这么说过吗。”
“另一个没有否认是我的爸爸,每次我晚上睡不着,情绪有些不对劲的时候,就会想到爸爸跟妈妈的恋爱故事,这样我就能睡着了。”
“那,具体有哪些故事呢。”
“拜托,不要突然就问起这种很私密的事情可以吗,我想想,嗯,比如说,”
“从前有个妈妈,妈妈被坏透了心眼的巫婆变成了黑猫,必须一整天都帮忙打扫卫生、叠被子、取快递,只给她一点点的时间去捉老鼠,妈妈成天饥一顿饱一顿的。”
“后来巫婆被屠龙的勇士杀掉了,头被挂在了人民广场上供人们参观,人们白天欢呼雀跃,却在夜深人静的晚上跑到巫婆的坟前哭泣。”
“原来巫婆并不是很坏很坏的人,只是脾气很坏,经常大发脾气,宫里如花似玉的女孩子被丑陋的亲王娶走或者交换之后,过不了几年只留下一堆孩子和一地纸钱。”
“巫婆为此大发脾气,离开了王宫住进了森林,此后每当有适龄的宫女需要外嫁,她就悄悄地把宫女变成猫咪,按照不同地点进行变色,东宫的猫咪变成绿色,西宫的猫咪变成白色,北宫的猫咪变成黑色,南宫的猫咪变成红色,中宫则是橘黄的猫咪。”
“她把跟了最久的一批猫咪变成她的模样,由它们带领本宫的一批猫咪,这些猫咪分别得到了巫婆的一根指节,毫不留情地把剩下的猫咪们当成了劳动的囚犯,必须辛苦一天才能得到吃的。”
“有些猫咪忍不住了,逃出了森林回到老家,可家人们已经不认识她了,没有办法只能继续回去帮老巫婆干家务。”
“终于有一天计划泄露了,勇士用他的宝剑斩杀了巫婆,用他的玉杵在坟前刻下《妖妇》《暗娼》《兽恋》的字样,而那些四散奔逃的猫猫,在跑到森林边上的修道院时突然变回了人形,只不过,依旧留下了长长的猫的胡须,这也就是猫须修女的来历。”
“那你的妈妈怎么没变回人形,以及那些女孩子的爸爸妈妈又到哪里去了呢。”
“因为巫婆的法术屏障是以她自己为中心的,巫婆被杀的时候我妈妈一路紧随着跟过来,没有脱离法术屏障,自然还是猫咪的样子。”
“爸爸妈妈多半是穷苦人出身,就算把闺女藏起来,又能藏到几时呢;皇宫里丢了这么多宫女,如果集体出走也多半会以娘家为首选,事实上士兵们已经奉命搜查过好几轮了,窖藏的酒都快被检查人员喝光了。”
“不错不错,你继续。”
“鬼才要继续跟你讲,都是我小时候的梦啊幻想啊掺杂一起的结果,总之你就是我的爸爸了,是因为看我妈妈无家可归才收留下来,最后就有了一个我。”
“怎么一到爱情的桥段就如此草率啊,”
“因为后面是孽缘嘛,经过我多年的分析,嫌隙产生的根本原因,在、于、”
“别卖关子了,”
“在于你根本没有爱人的动力,却有着完美的恋人的态度。”
“我在换装搭配不同的衣服款式的时候,经常会想,到底是什么决定了几种色调搭配和样式效果的风格的呢,为什么这样的搭配总是会让人产生类似的共鸣呢,就不能有人某A是复古内敛,别人却认为它是时尚新潮吗,到底什么是时尚呢,人们所说的复古又是以哪个时代为标准的呢。”
“后来我发现,设计师们似乎是有意地维持着这份不统一的样式,保持着表达与体验之间或大或小的一定差异。能表现十分的就少表现三分,能讲清楚的就讲得稍微模糊一点,”
“设计师们并不研究怎样让衣服更美,研究的是怎样让某种款式以适当的保守的方案落地,且同时具备让大多数人产生特定风格感知的外形。”
“你就像设计师一样,只是寻思着研究爱的一般结构,甚至还想着写成论文或箴言,供后世进行讨论研究吧。”
“不,不,这样很好,这样我就知道你的弱点在哪里了,下辈子会为你做出表率的。”
“对不起,”
“需要多少盆冷水,才能浇灭你心中无尽渴望传颂的火苗呢。”
“在常人难以理解的地方,实际上反而比谁都功利呢。”
“对不起,我,”
“你不冷酷,准确来说算是毫无温度可言。”
@NiltokotliN
但一般来说也不会去检查自己的博客内链接吧,要是读者碰到了还联系不上那就更麻烦了…我之前在GitHub上看到了一串文本中有失效链接,提issue以后也并没有人响应…
@ultramarine471
我倒觉得博客还是可以检查一下的,那种分散的教程文档,久了就忘记放哪儿了,但是博客是可以集中管理的,感觉难度大概应该会小一些吧……
但你们肯定比我有方法啊,毕竟是专业的hh
撇开后续发生的不谈,定期检查引用的链接是否可访问,这件事本身是可取的,也确实一直以来被包括我在内我的许多人所忽视。
但目前就出现几个问题,首先,文档内引用的链接,如果它自己里头还有别的链接,别的链接之中还有别的链接,当然这可以通过给定递归栈的深度来管理;但我怎么知道页面的元素是否可以点击呢,点进去之后发现要登录才能查看(然而此时你甚至还没注册),或者跳转到另一个毫不相关的网站上,都有可能。
其次,我如何能保证,从 wayback machine上搜索得到的版本正是我自己指定的那个呢,难道要我直接在文档里弄成{code=href}这种样式吗,取消了点击跳转的功能而必须手动复制到地址栏才能浏览。
这种做法稍微有点别扭了,不过我正好也喜欢比较别扭的事情,就先这样吧。
并且还有一些小细节,例如肯定要把所有的内部链接都archive完了以后,才能再archive外面的文档链接,并且内部链接的版本不能比外部的链接的版本来得新。
以及有些文档是长期更新的,就archive必定会得到许多版本,要确保文档一有改动就立刻进行archive,那也就是说要保存原先文档的md5或者别的什么。
后者其实可以宽松一点,比如我设置一个15天的冷却时间,然后我每次想要archive的时候,就检查下上一个版本距今是否已经超过15天,超过的话就运行不超过就不运行这样子。