偷东西
所谓知法犯法,罪大恶极。
我就是一个例子啦。
话说我实在顶不顺我以前那个在20six.co.uk的blog。
那个Server真的是有够鬼慢,我完全进不到。
其实也不是很急着回去,反正那时候的我写的东西有够难看的。
想象一下,比这个更难看、更自大、更嚣张、更多DotA。
恐怖咧。
但这毕竟是我的成长过程的一部分嘛。
哈哈..
虽然是有够幼稚与肤浅,但我还是得承认嘛。
所以我觉得把我的回忆留在这样反应过慢的Server实在有点太危险,好像随时都会当机,然后不见到完这样。
因此,我必须做些什么,来挽救我的回忆!
一直以来,我都有一个想法。
因为那个Server没有给我机会Export database出去。
所以如果我要我的回忆,我就得一篇篇的Copy&Paste。
如果我没记错,应该有600++篇咧!
这样Copy&Paste 600次,我不是傻子啊!
所以我就觉得我应该需要拥有一个Search Engine都有的东西,叫做Crawler/Spider/Bot。
Crawler是一个自动化的系统,它会在网络上到处地走,根据某种数学公式决定该去哪一个网站。
去到的时候,就会去拿那个网站的HTML Code然后储藏在自己的Database里面。
但是,这种东西只有Google/Yahoo/Baidu等等的Search Engine才有咧。
我怎么可能做得到?
终于有一天,我发现到原来我可以通过PHP做一只小Spider。
虽然它的速度和功能没有像Google它们的这么强。
但是,它也能偷HTML Codes。
最重要的是,它的Codes我google一下就出来了。
大概9行字而已,非常地简单易懂。
这才让我发现到,原来要偷东西是这么容易的事情!
在经过了许多的Experiments后,嘿嘿,我是很喜欢做Experiments的。
我马上发现到它一分钟便能偷九十多面,也就是我整个20six.co的Blog!
哇靠..
想象我本来需要Copy&Paste 600下,大概要吃掉我两个星期的时间。
现在我的这个小蜘蛛,一分钟便能搞定!
妈的,所以我才说,我们真的很需要电脑。
所以搞定了偷东西的动作后,便是我接下来四个小时的解码。
虽然拥有整个Blog的HTML,但是要从HTML里面把文章一篇一篇地拉出来绝对是另一回事。
起初我还以为简单。
真正去做的时候,才知道并没有这么简单。
但不管怎样,我还是成功把它们全都拉出来,放在我wahlaoeh.com的database里面了。
所以,如果你想看看以前自大又幼稚的我。
请点这里-->http://old.wahlaoeh.com
目前我正在做着一个Archive的系统,方便查阅。
不用一个Page一个Page Click下去。
所以你不难发现我的这个Blog的右下角有个很奇怪的东西。
放心,你的电脑没有问题。
是我昨晚做到一半,被Assignment拉去的后果。
哈哈..
- 要发表评论,请先登录
- 红点: Chinkang's Weblog
- 浏览原文
- 972次阅读



















