从12306网站上面下载海量验证码图片,找大学生识别,并将验证码所示信息与图片MD5值联系起来。有了这个数据库之后就轻松多了。扫描OCR识别是不靠谱的,达不到那么精确。再补充一下,如果有语音辅助残疾人士读验证码的情况,语音识别会是个好办法。