月度归档:2014年08月

破解火车票上的身份证号码

首先我在百度上找到了一个他人的火车票图片

接着从图片里我们可以获取到信息如下:

姓名 梅勇
性别 男 (倒数第四位至倒数第二位3位数为顺序码,顺序码为奇数所以为男性)
(可参考http://www.cnblogs.com/xudong-bupt/p/3293838.html)
来自 武汉市新洲区 (身份证号码前六位代表地区)
(可参考http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/200406/t20040607_38302.html)

身份证号码:4201171988xxxx1638

得到上述消息后,我们可以通过身份证号码验证算法对其进行有效性验证和排除。
(可参考http://www.cnblogs.com/xudong-bupt/p/3293838.html)

我用JS实现了一个有效性验证,代码如下:

var sfz_qian="4201171988";
var sfz_hou4="1638";
var sfzhm="";
for(i=1;i<=12;i++)
{
  //为了程序的方便,我就假设每个月有31天
  for(j=1;j<=31;j++){
		if(i<10){
			if(j<10){
				sfzhm=sfz_qian+"0"+i+"0"+j+sfz_hou4;
			}else{
				sfzhm=sfz_qian+"0"+i+j+sfz_hou4;
			}
			result=getvalidcode(sfzhm);
	        	if(result!=false){
        	        	console.log(result);
        		}
 
		}else{
			if(j<10){
                               sfzhm=sfz_qian+i+"0"+j+sfz_hou4;
                        }else{
                               sfzhm=sfz_qian+i+j+sfz_hou4;
                        }
			result=getvalidcode(sfzhm);
       	 		if(result!=false){
			      console.log(result);
        	        }
 
		}		
 
		}
	}
 
 
 
function getvalidcode(sfzhm_new){
 
var sum=0;
var weight=[7,9,10,5,8,4,2,1,6,3,7,9,10,5,8,4,2];
var validate=['1','0','X','9','8','7','6','5','4','3','2'];
for(m=0;m<sfzhm_new.length-1;m++){
sum+=sfzhm_new[m]*weight[m];
}
mode=sum%11;
if(sfzhm_new[17]==validate[mode]){
	return sfzhm_new;
}else{
	return false;
}
 
}

代码运行后如下:

接着我们导出35条记录做为字典,拿到12306进行暴力添加常用联系人,最后我们得到了该图片上面的身份证号码了

php spider script

自己用PHP写了个爬虫,基本功能已经实现。 PHP spider 下载地址

linux 环境下运行#php spider.php http://www.leesec.com

下面为测试过程图

下面为测试结果

有兴趣的可以试试

脚本缺点:

1.未对静态页面进行去重处理
2.未对页面内js操作后的结果进行处理
3.相对路径转绝对路径BUG未处理(2014年9月8号修复这个BUG)