还是没办法达到100%识别率

现在样本增加到2万了,识别率达到百分之90多吧!应该算满意了,discuz 的验证码识别实验到此为止了,过程学了很多东西,技术宅的力量又增加了不了,哈哈!

对discuz的验证码去噪率已经达到百分之一百了,我在想,将样本库增加到20万,效果应该能接近100% , 有时间再研究下样本的相识度问题,现在都是最简单的…

玩验证码识别要停下来了…

顺边说说discuz 的验证码的背景去噪方法: 都是根据网上的说法的,先统计一个颜色点的上下左右是否为同色,将这些符合条件的颜色统计起来,然后算出每种颜色的长度和高度,高度大于9,小于25的,宽度小于30的,再统计符合刚才条件的颜色点,然后再统计颜色点最多的四种颜色,这样这四种颜色以外的就是噪点……ME就是这样搞出来了…用的工具:python

关于无聊人

一个无聊人而已
此条目发表在技术生活分类目录,贴了标签。将固定链接加入收藏夹。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注