$24.48


$411.20


$32.07


Алгоритмы определения релевантности результатов поиска

Перевод тезисов из статьи Аарона Уолла, посвященной сравнению ведущих поисковых машин англоязычного сектора Интернета — Yahoo!, MSN Search, Google и Ask.

Yahoo!
• на рынке поисковых машин уже давно
• лучше, чем MSN, но далеко не так хорош, как Google в выявлении естественных ссылок
• содержит огромное количество внутреннего контента и возможность платного включения в результаты поиска, что стимулирует администрацию проекта к смещению результатов поиска в сторону коммерческих ресурсов
• взаимные ссылки низкого качества с далеких по тематике ресурсов все еще работают в Yahoo!


MSN Search
• новичок на рынке поисковых машин
• плохо определяет природу ссылки (естественная она или искусственная)
• из-за отсутствия опыта в анализе линков большое значение при ранжировании придается контенту страницы
• слабые алгоритмы ранжирования результатов поиска являются причиной перегиба в сторону коммерческих ресурсов
• любит быстрое наращивание ссылок
• новые ресурсы, к которым в большинстве случаев другие поисковые системы относятся настороженно, довольно быстро могут занять высокие позиции в MSN Search
• взаимные ссылки низкого качества с далеких по тематике ресурсов все еще работают в MSN Search


Google
• на рынке поисковых машин давно, и принял за основу модель структуры Сети, когда она была гораздо более не засоренной, чем сейчас
• намного сильнее других поисковых машин в определении естественных ссылок
• следит за ростом количества естественных ссылок
• результаты поиска смещены в пользу информационных ресурсов
• гораздо больше доверяет «старым» ресурсам
• страница сайта или его субдомен значительного возраста или при условии наличия авторитетной ссылки с родственного ресурса, даже при отсутствии внешних ссылок может занять более высокую позицию, чем следовало бы
• жестко фильтрует контент на дублирование информации, что приводит к отсеиванию большого количества страниц со схожим содержанием
• если страница явным образом оптимизирована под какой-то термин, поисковая машина может отфильтровать документ по этому термину
• очень важно варьирование текста ссылки на ресурс
• страницы, на которые ведут одна или несколько ссылок, содержащий ключевое слово, часто превосходят по позиции страницы, оптимизированные по поисковой фразе, содержащей это ключевое слово
• глубина индексирования определяется не только количеством, но и качеством связей. Ссылки низкого качества могут негативно сказаться на глубине индексирования вашего ресурса и даже осложнить включение в индекс
• взаимные ссылки и ссылки низкого качества с далеких по тематике ресурсов в Google не работают

Ask
• проводит поиск в тематических сообществах
• из-за сильного уклона в сторону тематических сообществ сайты очень медленно наращивают свои позиции при ранжировании до тех пор, пока их не начнут активно цитировать в соответствующем по тематике сообществе
• поскольку рыночная доля поисковой машины невелика не стоит уделять ей большого внимания только если вы не находитесь в сектору, где у них сильные позиции, дающий серьезный приток траффика

 

Интересное

Запись дисков через ATAPI...
Есть у меня CD-RW. И на нем я иногда пишу. Однажды я задумался: «Что же это за извращение такое, эмуляция scsi на ide?» И решил я записать диск на ATAPI CD-RW через ATAPI. Что из этого вышло…
Подробнее...
DBI для mSQL/mySQL
УстановкаДля использования интерфейсов rnSQL и MySQL к модулям DataBase Dependent/DataBaseIndependent (DBI/DBD) или MsqlPerl и MysqlPerl необходимо иметь следующие компоненты :
Подробнее...
Средства Delphi 7 для...
Рассмотрим наборы компонентов, которые присутствуют в библиотеке компонентов delphi 7, предназначенных для работы с базами данных. Вы узнаете, что такое набор данных, источник данных и...
Подробнее...
Администрирование дисков в...
Опытные пользователи Windows NT успели привыкнуть к утилите Disk Administrator, с помощью которой можно было создавать, удалять и менять параметры томов на физических дисках. В Windows 2000 ее...
Подробнее...
Изменение регистра
В Delphi есть три функции для изменения регистра: upcase, lowercase, uppercase. Но они работают только для латинского алфавита. Чтобы сделать аналогичные функции для русского алфавита я...
Подробнее...
Будущее - за Ethernet DSLAM
Популярность существующих методов широкополосного интернет-доступа (DSL) во многом обеспечивает стабильное состояние рынка решений DSLAM (Digital Subscriber Line Access Multiplexer). Современные...
Подробнее...
Основные конструкции языка...
В этой статье я расскажу о языковых конструкциях языка веб программирования php.Изучив их, Вы уже сможете писать простенькие программы.Особенностью конструкций этого языка является простота. if-...
Подробнее...
Что такое torrent? Что...
Что такое bittorrent?Bittorrent — это программа, которая позволяет очень быстро распространять файлы (обьемные файлы) среди пользователей. То есть, это не пиринговая сеть в чистом виде, а скорее...
Подробнее...
10 полезных приёмов при...
Если вы недостаточно хорошо освоили PowerShell, то наверняка не стремитесь применять этот инструмент в повседневной работе. Однако дананя оболочка является ядром таких систем, как Exchange 2007,...
Подробнее...
Стиль против Дизайна
От Дизайна к СтилюМой отец был полупрофессиональным художником (Sunday painter), книжки с его иллюстрациями сыграли для меня в детстве формирующую роль. Как и многие другие дети, я зачаровывался...
Подробнее...