В конце прошлого года Google представил широкой общественности (правда, пока только в США, но обещал при положительных отзывах развернуть сервис и в остальных странах) новинку.
Если вы захотите найти в Сети какую-либо мелодию, конкретного исполнителя или, даже не зная названий, просто введете в строку поиска часть песни, поисковая надстройка Google Music (http://www.google.com/music/) выдаст список ссылок на легальные сайты, где эту музыку можно прослушать или купить.
Также будут выводиться альбомные обложки, список треков, похожие исполнители или песни. Читать далее »
Вы хоть раз задумывались, как устроены такие поисковые системы как Яндекс или Google? Если бы перед Вами стояла задача написать поисковую систему с нуля, с чего бы Вы начали? Наверняка многие из Вас уже писали простые контентные сайты с внутренней системой поиска для них, А поиск реализовывали очень просто – командой LIKE синтаксиса SQL. Думаете, Яндекс тоже так работает?
Рассказать про все механизмы, реализованные в современных поисковых системах – это явно задача не для одного поста (да и рассказать-то я много не смогу ), поэтому здесь я расскажу про самую значимую и неизвестную для многих часть поисковиков – индекс. Но не будем торопиться.
Вообще, всю поисковую систему можно условно разделить на 3 части: интерфейс пользователя, поисковый агент и индекс.
Интерфейс пользователя знаком всем – google.com, ya.ru. Обычно это просто строка поиска. Поисковый агент – программа, которая ползает по сайтам, собирая тексты страниц и url с них. Поисковый агент сохраняет собранную информацию в индексе.
Ну, а самая важная часть – это индекс, или поисковая база данных. Читать далее »