关卡地址:
关卡是寻找两边都被三个大字母包围的小字母。 代码可以参考上一小节的。 代码如下:# -*- coding: UTF-8 -*-import urllib.requestimport reimport stringurl = urllib.request.urlopen('http://www.pythonchallenge.com/pc/def/equality.html')page = url.read().decode('utf8') # 在Python中urlopen返回的response是byte类,需要转成string类pattern = re.compile(r' ') # 注释是在 ,这里使用?是想最短匹配,不过好像不加也没有影响m = re.findall(pattern, page)#print(m)pattern = re.compile(r'(?<=[a-z][A-Z]{3})([a-z])(?=[A-Z]{3}[a-z])')print(''.join(re.findall(pattern, ''.join(m))))
这段代码主要是考察re正则表达式的使用,其中(?<=...)是前缀匹配,但是不捕获,(?=...)是后缀匹配,也是不捕获。
最后一段输出代码,有很多括号,不可取,这主要是由于re.findall返回的序列[],要用''.join()来转换成string输出,或许有更好的方式来实现。