Давайте рассмотрим простой и наивный подход к вычислению пэйдж-ранка, так называемый итеративный подход. Итак, у нас с вами есть небольшой корпус документов, которые каким-то образом связаны ссылками между собой. На первом шаге этого алгоритма мы должны как-то проинициализировать черновое значение пэйдж-ранка каждого документа. Для этого мы присвоим ему значение, которое является вероятностью того, что пользователь случайным образом сразу телепортируется на этот документ. Очевидно, что для всех документов это значение будет одинаковым. Дальше давайте вычислим пэйдж-ранк для каждого из документов в этом корпусе. Итак, например, у нас есть с вами документ А, на которого есть только одна входящая ссылка из документа С, для которого та является единственной исходящей. Таким образом, документ С переносит свой текущий пэйдж-ранк в пэйдж-ранк документа А полностью, с учетом нашего понижающего коэффициента. Как я уже говорила, мы берем значение понижающего коэффициента равным 0.85. Переходим дальше к документу В. Как видим, в него тоже идет только одна входящая ссылка с документа А, однако у самого документа А две исходящие ссылки. Таким образом, мы понижаем его вклад в пэйдж-ранк документа В в два раза в соответствии с количеством исходящих ссылок. Повторяем эту операцию для каждого документа в нашем корпусе. Таким образом, мы получили черновые значения пэйдж-ранка для каждого документа. Очевидно, что это не итоговое значение, так как для вычисления некоторых из этих пэйдж-ранков мы использовали те значения, которыми изначально инициализировали значение пэйдж-ранка. Очевидно, что это не конечное значение. Давайте повторим еще одну итерацию и будем совершать итерацию раз за разом до тех пор, пока не увидим, что пэйдж-ранк каждого документа перестал меняться либо меняется в каких-то заранее нами оговоренных небольших пределах. Таким образом, наш метод сошелся, и мы получили какие-то конкретные конечные значения. Что же они нам говорят? Как мы помним, пэйдж-ранк — это один из алгоритмов ссылочного ранжирования, а ссылочное ранжирование содержит в себе два основных пункта. Во-первых, тот документ, на которого больше всего ссылаются, будет иметь наибольший ранк. И во-вторых, тот документ, на которого ссылаются авторитетные источники, также будет иметь более высокий ранк, чем другие документы. И именно это мы и получили в результате. На первом месте у нас находится документ С, на которого аж целых три входящие ссылки, больше, чем на какой-либо другой документ в нашем корпусе. И кроме того, часть своего авторитета, своего ранка он передал по единственной ссылке, а именно в документ А, который в нашем случае находится на втором месте. Итак, мы с вами только что рассмотрели первый и самый простой подход к вычислению пэйдж-ранка.