建站经验 experience
当前位置:首页 > 网站建设专题 > 建站经验
从网站被封说起 谈谈敏感词和非法网址过滤的重要性
发布日期:2011-10-11 阅读次数:647 字体大小:

生活在当今的网络时代的个人站长真的是不容易,做个网站,担心的事情真是太多。黑客、挂马、网络攻击、服务器故障、数据丢失,好容易服务器稳定了,为了提高流量赚点广告费,又处心积虑的给网站做优化、推广、seo,费尽千辛万苦,绞尽脑汁。费尽千辛万苦流量有了起色,网警和管局又来了,说你有非法信息,断网、关站、整改、罚款。

个人站长真是太不容易,最近我的网站被封了,当初是想把它做成一个网络收藏夹,被封也是因为这个,原因是有人用它收藏了不良信息,收藏的信息先是被搜索引擎收录,继而被网警查到,于是顺藤摸瓜就找到了我的网站。管局和机房也不管你那么多,什么托管协议全是一纸空文,说拔网线就拔网线,让你进去维护你都得感恩戴德谢天谢地。

好容易通融打点进去删了不良信息,网站被关禁闭后得以重新开放。那就要吃一堑长一智,在社会主义初级阶段,在当今中国的网络管理体制下,看来想要活着,就必须对不良信息做好提前预防,对于那些利用网站收藏不良信息的用户,虽然给网站带来了流量,可是也只能很无奈的说不。

症结找到,就要开始制定安全策略,首先是敏感词过滤机制的建立,这个并不难,到网上找来一堆敏感词,放到一个数组里面,在用户提交信息的时候遍历数组,若数组中的敏感词在用户提交的信息也存在的话,则拒绝收录用户信息。即使更新和丰富敏感词数组,很容易的就把敏感词封锁掉了,我甚至连“mm”都加为敏感词,唉,这也是没办法啊。

可有些人就不用敏感词了,把“A片”换成“B片”、”C片”、“M片”逃避你的过滤,这真是一个令人头大的问题,总不能把所有字符的组合都设定为敏感词吧。于是我想到了网址,因为收藏的部分是由标题和网址组成,标题可以千变万化,但网址总是不能变的。于是又建立网址的过滤机制,这个只能用笨办法,人肉审核。这可是需要定力的,因为你面对诸多有色网站却还要有一颗事业心,HOHO,自持,自持吧~~。

把所有见到的非法网址,提取域名,加入黑名单,同样像敏感词一样的过滤机制,如果用户提交的内容中含有可疑网址,则拒绝收录。然后继续人工审核,逐步发现和丰富非法网址,我就不信这世界上非法网址的发现速度比我的封杀速度还快。

最终,我的网站又恢复了和谐安详。人有七情六欲,谁也不是圣人,可是当今世界,个人站长真的是很无奈,只对那些收了不该收的网址被K了的用户说声抱歉,不是我拒绝你,而是他们不让我接纳你。

欢迎同类站长交流经验,我的”收多多”网络收藏夹地址:http://shoudd.com。