Error while using URLLIB in Python 2.7
进口URLLIB来自BS4进口美汤进口再
SUMT=0
html=urllib.urlopen('http://python data.dr chuck.net/comments_338391.html').read())
汤=美汤(HTML)
tags=汤(span)
对于标签中的lne:LNE=STR(LNE)数据=re.findall("[0-9]+",lne)数据[0]=int(数据[0])sumt=sumt+数据[0]
打印库
错误:
1 | IOError: [Errno socket error] [Errno 11004] getaddrinfo failed |
请注意,
不管怎样,对我来说两个版本都很好用。
1 2 3 4 5 6 7 8 9 10 11 12 13 | import urllib2 import re if __name__ == '__main__': url = 'http://python-data.dr-chuck.net/comments_338391.html' comments = {} pattern = re.compile('<tr><td>(?P<name>.+?)</td>.+?class="comments">(?P<count>\d+)</span>.+?') for line in urllib2.urlopen(url).read().split(' '): m = pattern.match(line) if m: comments[m.group('name')] = int(m.group('count')) print(comments) |
产量:
即:为我工作。