Понадобился парсер прямого эфира яндекса. Написал на python, его я начал изучать недавно,поэтому код далеко не идеальный. Результат сохраняется в файл efir.txt , может кому-то пригодится…
# coding: utf-8
# author: Rushter
# site: http://klipner.ru
import httplib,re,time
count = 200 # сколько парсить
print "[*]Parsing has started"
print "[*]Parsing "+str(count)+" acc"
for i in range(count/20):
f = open('efir.txt','a')
conn = httplib.HTTPConnection("stat.yandex.ru")
conn.request("GET", "/queries/last20.xml")
r = conn.getresponse()
data = r.read()
req = re.findall('blank">(.*)',data)
#f.write(req)
for i in req:
f.write(i+'\n')
print i.decode('utf8')
f.close()
ps. Python 2.6
Категория:
Programming, SEO, httplib, Python, Seo, yandex, парсинг