banner

R-PageRank

R-PageRank – бесплатная программа для расчёта условного веса на страницах, так называемого PageRank.

Для чего нужен расчет веса? Для построения оптимальной перелинковки, которая позволит концентрировать максимальный внутренний вес на страницах предназначенных для сбора трафика, что позволяет существенно подняться по нч запросам.

PageRank — это числовая величина, характеризующая «важность» веб-страницы. Чем больше ссылок на страницу, тем она становится «важнее». Кроме того, «вес» страницы А определяется весом ссылки, передаваемой страницей B. Таким образом, PageRank — это метод вычисления веса страницы путём подсчёта важности ссылок на неё.

Принцип работы:

Паук собирает все ссылки с вашего сайта, после этого происходит расчет веса каждой страницы, собранная информация сохраняется в csv.
Для удобной обработки csv файла лучше всего использовать excel.
Страницы запрещенные в robots.txt или ссылки с nofollow могут игнорироваться.

скачать R-PageRank

  • http://webmasters.ru/forum/f26/r-pagerank-22026/#post223783 R-PageRank

    [...] или ссылки с nofollow могут игнорироваться. Скачать: R-PageRank [...]

  • Neoveneficus

    >после этого происходит расчет веса каждой страницы

    Как происходит расчет PR?

    В алгоритме Брина и Пейджа строилась огромная резреженная матрица, где в узлах вероятность попадания с i-той страницы на j-тую. Все страницы соответственно, пронумерованы.

    Если грубо, далее находится вектор важности, по существу, являющийся собтвенным вектором матрицы. Можно использовать метод простой итерации.

    При этом есть модели, в которых допускается небольшая вероятность перехода с любой страницы на любую (aka набор url в браузере) даже без наличия ссылок, то есть при отсутствии ссылки со страницы i на страницу j – на i,j-ом месте будет не 0, а малое q.

    Используется ли в данном софте, хоть что-то подобное? Если используется, какая модель выбрана?

  • http://klipner.ru/ RushteR

    Всё как ты описал, никаких вероятностей перехода или других модификаций
    здесь нет. Софт написан для того, чтобы примерно видеть как распределен
    вес, не более.

  • Sdsad

    не очень понятно. Как можно по простому рассчитать условный PR? Интересует алгоритм и какие нужны входные данные

  • http://klipner.ru/ RushteR

    http://en.wikipedia.org/wiki/PageRank

  • Neoveneficus

    Rushter,

    Все-таки очень интересно узнать, что в твоем понимании «примерно видеть как распределен вес, не более.»

    Дело в том, что твой софт выдает какую-то цифру, а что это за цифра не ясно. Эта цифра результат каких действий?

    Просто даже из той же статьи на википедии есть множество разных нюансов. Как ты, например обращаешь матрицу, итеративно или считаешь обратную (в терминах английской википедии Algebraically).
    Если итеративно, какой параметр сходимости (Epsilon)? Как решается проблема страниц без исходящих ссылок?

    Я думаю, что данная программа без подробного объяснения того, что она делает, может быть полезна только тебе, автору. Поэтому реквестирую описание алгоритма работы.

    А еще было бы неплохо показать тесты на 4х страничном сайте с разным количеством ссылок на страницах.

    Rushter, я думаю, в курсе, остальным рекомендую статью:
    http://skrasnikov.livejournal.com/9990.html

  • http://klipner.ru/ RushteR

    Поверь, 90% пользователей данного софта знать это во первых не нужно, а во вторых большинство не в состоянии понять данного алгоритма с математической точки зрения досконально.
    Кто понимает, тот и в экселе отлично считает сам.

    Если тебе так важны нюансы, то наверное лучше написать свой скриптик :) .

    Считаю в 40 итераций, кооф. 0.85.

  • http://wlad2.ru/ wlad2

    крутая прога, а можно сделать чтобы ссылки которые начинаются с /go? или /click? программа не учитывала?
    таким образом делаю внешние ссылки через 302 редирект
    мой-сайт.ру/go?левый-сайт.ру

  • http://klipner.ru/ RushteR

    Закрыть их в robots.txt

  • http://wlad2.ru/ wlad2

    а точно.. вот протупил =)

  • Wotafak_gofak

    запустил, в логе кравлинг стартед и пиздец. Wtf?

  • http://klipner.ru/ RushteR

    Возможно русские пути до exe файла, их надо убрать.

  • Дмитрий

    не работает не на хр ни на 7 просто Старт и все.

  • Yarilo

    а почему именно 40 итераций? и по кооф. 0.0001.??
    из чего это высчитывается? и почему именно по столько?

  • http://klipner.ru/ RushteR

    Стандартные значения, которые обычно берутся в подобных формулах.