Современный динамический дорген

В свободное время разрабатываю динамический дорген, который бы отвечал всем современным требованиям :). Кстати, его кодовое название «WhaleMore» ;).
Пока что функционал, который разрабатывается или уже разработан планируется такой:

  1. Один воркер обрабатывает множество доменов. Т.е. скрипт ставится на vps/vds и сразу обрабатывает сотни доменов.
  2. Поддержка парсинга всех современных социальных сетей, поисковых систем.
  3. Встроенная tds с возможностью подсчёта посетителей на дорах
  4. Автоматическая перелинковка в приделах одного дора или множества, на основе собирающейся статистики по поисковым запросам с поддержкой хлебных крошек.
  5. Автоматическое пополнение базы ключей по тематикам.
  6. Многопоточный парсинг данных для запрашиваемой страницы на лету с задержкой не больше 2 сек. Все данные парсятся один раз и в дальнейшем кэшируются в базе.
  7. В качестве веб сервера nginx, бэкенд — tornado.
  8. Хранение данных — mysql, postgresql или mongodb.
  9. Промежуточные данные хранятся в redis.
  10. Хранение тасков — celery+ rabbitmq.
  11. Асинхроный парсинг — celery+eventlet.
  12. Автоматическая уникализация шаблонов.
  13. Автоматический расчет веса перелинковки.
  14. Ротация способов слива и рекламных блоков.
  15. Частичное обновление контента по запросу.
  16. Возможность размещения на фрихостингах с помощью php скрипта.
  17. Автоматическая очистка не дающих трафик или забаненных дорвеев
  18. Встроенная статистика по индексации
  19. Хранение всей возможной статистики для определения средней температуры по больнице. (Скорость индексации, время жизни, трафик и т.д.)

А какие вам ещё нужны функции в доргене? :)

  • Diplomat

    Рекомендую ознакомится с функционалом SED
    А в бета-тестеры можно?

    • http://klipner.ru/ RushteR

      Нет, бетатестеры мне не нужны. Дорген для личного пользования пока что.

  • http://twitter.com/mr_The mr.The

    Используешь 1 бд(mysql, postgresql или mongodb) с контентом для всех доров, или у всех своя?

    • re1ix

      знакомый все лица :)

      используя одну наверное большая нагрузка получиться, лучше множество, но реализовать какую нибудь централизованную систему для управления всех этих бд (мониторинг, удаление в 2 клика и т.п.)

      • http://klipner.ru/ RushteR

        Нормально всё будет, в пределах 1-3к одновременных соединений будет выдерживать. Используется асинхронный вебсервер.

    • http://klipner.ru/ RushteR

      Любая на выбор, на этапе разработки сложно предсказать как поведут себя эти базы при 10 млн записей.

      • http://twitter.com/mr_The mr.The

        Из своего опыта: монго такие объёмы держит, но хоть сколько-то сложный поиск по ним — уже не вариант. Постргрес и мускул держат без проблем, если есть индексы и нет кучи джойнов. При сложном поиске ещё и денормализация нужна продуманная.

  • true

    В опере комменты не открываются

    • http://klipner.ru/ RushteR

      Новый disqus какой-то странный, вернул старый дизайн.

  • macros

    Ждем с нетерением. Если еще пользователи r-dorgena получат доступ с доплатой будет замечательно .

  • Sadsad

    а почему sqlite не планируешь  использовать?
    доры на пхп будут?

    • http://klipner.ru/ RushteR

      sqlite помрёт после первого миллиона записей. Никакого php, он только для фрих, чтобы удалённо подгружать доры.

  • Rere

    Как тебе ? ))) Если хочешь обсудить пиши. Что ты придумал давно уже реализовано skype serbindesign Я принскрин прилепил. Ты видишь ?

  • Guest

    123

    • http://klipner.ru/ rushter

      Круто, сам писал? Я дорами не занимаюсь уже, два года прошло уже :)