证码识别--type1
​从最简单的开始。主要是研究通用的方法、整理通用的框架和思路,最后整理超越之上的价值。
思路,主要是两个部分:图像的分割和图像的识别。这里的分割,可能是分割到字符的程度,也可能是分割到笔画的程度。
对于type1来说
其分割还是比较简单的,这种程度的验证码识别,就要达到95%以上才可以。
 
一、图像分析
可以看出来,图像中有孤立的干扰点的,这些点,通过8联通算法,是很好去掉的
有一定的效果,再进一步去掉在竖直方向孤立的点
目前这个结果算是比较干净的了
二、投影计算
通过看字符的特点,里面加了一些单个点的干扰,可以通过纵向投影来过滤,编写代码,查看特征
 
做到这一步,下一步就是识别的问题,对于这种简单的问题,我认为其识别也可以从简单的方面开始来做。
关于识别,可以单独拿出来做,因为识别这块有专门的解决方案tesseract,然后各个方面也可以做一个比较来着。
三、识别 比较倾向于内容分析
小结:验证码识别来做的话,的确比较复杂,因为不同于数据的大开大合,这里是最考验基本功的地方。如果能够把这方面的能力加强,将来一定会很有益处。
 

最新文章

  1. 只是为了好玩——Linux之父林纳斯自传
  2. 转:安装MySQL遇到MySQL Server Instance Configuration Wizard未响应的解决办法
  3. SAP Adapter启动报错
  4. qq红心头像[中国心]制作教程之Photoshop教程
  5. ZOJ题目分类
  6. [CSS]浮动的那点事儿
  7. “Cache-control”常见的取值有private、no-cache、max-age、must-revalidate等
  8. js判断字符在另一个字符串中出现次数
  9. Android开发的初学者快速创建一个项目
  10. Servlet 工作原理解析--转载
  11. RMAN-FORMAT-CONFIGURE及动态性能表
  12. 走进JDK(十)------HashMap
  13. Redis JdkSerializationRedisSerializer,stringRedisSerializer,ProtoBuf 体积,性能简单比较.
  14. innerText 与 innerHtml的区别
  15. springboot 缓存
  16. 深入浅出Mybatis技术原理与实战(杨开振)(带详细书签) PDF 下载 高清 完整版+源码
  17. 【bzoj5073】[Lydsy1710月赛]小A的咒语 后缀数组+倍增RMQ+贪心+dp
  18. [mobile angular ui]MAUI中的font awesome图标
  19. 内存单元,CPU对存储器的读写,三大总线
  20. nodejs报错 XMLHttpRequest cannot load localhost:3000/test_date/. Cross origin requests are only supported for protocol schemes: http, data, chrome, chrome-extension, https.

热门文章

  1. PostgreSQL Replication之第九章 与pgpool一起工作(6)
  2. struts2 radio标签 单选按钮
  3. The Havel-Hakimi Algorithm
  4. poj: 2159
  5. html随笔
  6. 关于Linux系统basename函数缺陷的思考
  7. SqlServer nvarchar中的中文字符匹配,更改SqlServer实例和数据库排序规则的办法
  8. JVM学习笔记(二)------Java代码编译和执行的整个过程【转】
  9. linux中的优先搜索树的实现--prio_tree【转】
  10. C# Driver LINQ Tutorial