Python多线程学习

一、Python中的线程使用:

Python中使用线程有两种方式:函数或者用类来包装线程对象。

1、 函数式:调用thread模块中的start_new_thread()函数来产生新线程。如下例:

阅读更多

识别破解Captcha的5*3方法

首先以数字验证码开始,字母的要比数字麻烦一些,不过搞清楚了数字验证码的识别,字母的也就不难了。

验证码一般都是图片,而且一般都是4位数,处理过程是:先分割为4个部分,然后逐一识别,由于分割比较简单,我这里就不说了,我这里只说如何识别。

我的方法是把需要识别的图片,划分为 5 行,3 列,15个块,为什么要划分为15个块呢?先看图!

阅读更多

Python写爬虫抓站的一些技巧

1.最基本的抓站

2.使用代理服务器

这在某些情况下比较有用,比如IP被封了,或者比如IP访问的次数受到限制等等。

阅读更多

Python PycURL 网络编程

在使用urllib的时候经常会死掉,以前debug过,是没有设置 timing out 所以超时后就会死掉。
PycURL是curl的python库,虽然有些curl的功能没有实现,但是还是很强劲的。

curl是非常强劲的一个工具,
google内部用它来 debug GDATA API. Using cURL to interact with Google data services

可以去 http://pycurl.sourceforge.net/ 下载最新的PycURL。

阅读更多

Python正则表达式的用法

字符串替换

1.替换所有匹配的子串
用newstring替换subject中所有与正则表达式regex匹配的子串

2.替换所有匹配的子串(使用正则表达式对象)

字符串拆分

1.字符串拆分

2.字符串拆分(使用正则表示式对象)

阅读更多

Python多线程thread与threading实现

python是支持多线程的,并且是native的线程。主要是通过thread和threading这两个模块来实现的。
python的thread模块是比较底层的模块,python的threading模块是对thread做了一些包装的,可以更加方便的被使用。
这里需要提一下的是python对线程的支持还不够完善,不能利用多CPU,但是下个版本的python中已经考虑改进这点,让我们拭目以待吧。
threading模块里面主要是对一些线程的操作对象化了,创建了叫Thread的class。
一般来说,使用线程有两种模式,一种是创建线程要执行的函数,把这个函数传递进Thread对象里,让它来执行;另一种是直接从Thread继承,创建一个新的class,把线程执行的代码放到这个新的 class里。
我们来看看这两种做法吧。

阅读更多