现在样本增加到2万了,识别率达到百分之90多吧!应该算满意了,discuz 的验证码识别实验到此为止了,过程学了很多东西,技术宅的力量又增加了不了,哈哈!
对discuz的验证码去噪率已经达到百分之一百了,我在想,将样本库增加到20万,效果应该能接近100% , 有时间再研究下样本的相识度问题,现在都是最简单的…
玩验证码识别要停下来了…
顺边说说discuz 的验证码的背景去噪方法: 都是根据网上的说法的,先统计一个颜色点的上下左右是否为同色,将这些符合条件的颜色统计起来,然后算出每种颜色的长度和高度,高度大于9,小于25的,宽度小于30的,再统计符合刚才条件的颜色点,然后再统计颜色点最多的四种颜色,这样这四种颜色以外的就是噪点……ME就是这样搞出来了…用的工具:python