Нефть и песок О стали Компрессор - подбор и ошибки Из истории стандартизации резьб Соперник ксерокса - гектограф Новые технологии производства стали Экспорт проволоки из России Прогрессивная технологическая оснастка Цитадель сварки с полувековой историей Упрочнение пружин Способы обогрева Назначение, структура, характеристики анализаторов Промышленные пылесосы Штампованные гайки из пружинной стали Консервация САУ Стандарты и качество Технология производства Водород Выбор материала для крепежных деталей Токарный резец в миниатюре Производство проволоки Адгезия резины к металлокорду Электролитическое фосфатирование проволоки Восстановление корпусных деталей двигателей Новая бескислотная технология производства проката Синие кристаллы Автоклав Нормирование шумов связи Газосварочный аппарат для тугоплавких припоев
Главная страница / Архитектура отрасли

НЕРЕНТАБЕЛЬНЫЙ ЛИДЕР

Граница между Web-сайтом и порталом достаточно условна. Если сайт обычно предназначен для оказания одной базовой услуги, то портал делает доступным для всех пользователей целый спектр услуг. При этом принципиально важно, что все его компоненты увязаны в единую систему и пользователь, пройдя процедуру идентификации, получает удобный доступ ко всем проектам на данном портале. Конечно, есть некий пороговый уровень количества сервисов, по достижении которого можно говорить о существовании портала. Сотрудники «Яндекса» считают, что если пользователь заходит к ним практически ежедневно, то это дает право говорить о портале.

Классические услуги портала – Web-почта, хостинг (то есть предоставление места для Web-страничек) и поиск в разных его вариантах – по товарам, по магазинам, по новостям. Почти на каждом портале есть и другие сервисы: на Яндексе, например, очень популярна служба «Открытки».

К сожалению, в большинстве случаев пользователи не знают всех возможностей портала и используют их далеко не на 100%. Так, мало кому известно, что на Яндексе посетитель может подписаться на услугу поиска по новостям: набираете поисковую строку, получаете результат, а затем указываете, что хотели бы получать по электронной почте сообщения об изменении результатов поиска по этому запросу. Если, например, вы руководите компанией, то можете набрать ее имя в поисковой строке и, подписавшись на поиск, будете фактически ежедневно получать пресс-клипинг. Через 25 минут после того как вашу компанию упомянут в новостях информационных агентств или через 2–3 дня после упоминания где угодно в Интернете придет сообщение о том, где, на каком сайте появилось имя компании или ваша фамилия (если задать поиск по фамилии). Причем такая услуга, как и все другие на Яндексе, предоставляется бесплатно.

Большинство порталов предлагают посетителям зарегистрироваться, то есть сообщить о себе определенный набор сведений. Можно этого не делать: основные услуги, например услугу поиска, клиент вправе получить анонимно. Однако регистрация и последующая идентификация пользователя при каждом его обращении к порталу позволяют предоставить ему целый ряд дополнительных удобств: он может получить собственный почтовый ящик, завести личную адресную книгу или настроить по своему желанию поисковую машину – указать, в каком виде он хочет получать результаты, сколько ссылок на сайты следует выдавать на одной странице, и т. д. Для того чтобы подписаться на поиск, необходимо сообщить свой электронный адрес.

Сердце портала – его база данных и поисковая система. Сегодня Яндекс имеет самую большую в мире базу русскоязычных ресурсов Интернета. Ни одна другая поисковая система ни в России, ни на Западе не может похвастаться таким охватом Рунета.

Поисковых систем во Всемирной сети сотни, а крупных, мирового масштаба только 5–6. В русской части Интернета лидируют три системы: Яндекс, Рамблер и Апорт. Естественно, каждая имеет свои особенности. В частности, все три системы могут узнать в тгическую форму слова, заданного в строке поиска. Однако Яндекс создал соответствующий программный модуль около 5 лет назад и поэтому имел достаточно времени для его усовершенствования. В Интернете употребляется множество новых несловарных слов – термины, фамилии, жаргонизмы, названия организаций и т. п. Программный модуль Яндекса эвристически моделирует морфологические изменения слов, которые отсутствуют в словарях, что позволяет более оперативно отыскивать необходимую информацию. С недавних пор такой модуль появился и на Рамблере.

Эффективность поиска зависит не только от объема ресурсов Всемирной сети, которые просматривает система. Результаты поиска в значительной мере определяются тем, каковы возможности формулировки запроса и как система с этим запросом работает. Ведущие поисковые порталы могут осуществлять так называемый расширенный поиск с использованием специального языка запросов, который позволяет тонко управлять процессом. Основные признаки такого поиска в разных системах совпадают, и пользователи нередко действуют стандартно, не замечая предлагаемых им уникальных возможностей. В частности, еще мало кто пользуется тем, что Яндекс умеет находить не только документы, содержащие некоторый текст, но и все источники, которые ссылаются на некоторый сайт в Интернете. Стоит только указать в качестве объекта поиска ссылку на сайт.

Создателям поисковых систем приходится проявлять немалую изобретательность, чтобы добиться максимального соответствия результатов поиска конкретному запросу. На Яндексе при этом учитывается даже порядок слов, а некоторые запросы автоматически переформулируются. Дело в том, что привычные вопросительные формы не всегда оказываются эффективными. Классический пример – это вопрос типа «что такое пылесос?». На него найдется довольно мало ответов, потому что такая фраза в текстах обычно не встречается. Зато если убрать словосочетание «что такое» и написать «– это» в конце, то фраза, построенная как «пылесос – это...», наверняка отыщется.

При наборе запросов, как и любых текстов, случается, что пользователи ошибаются. Хорошо, если поисковая система содержит модуль проверки написания и выдает сообщение о том, что данное слово ей неизвестно и, вероятно, следует исправить запрос. Яндекс может даже больше: если запрос набран не в том регистре – например, вместо русского в латинском, – он перекодирует его и предложит вновь провести поиск. В каждой поисковой системе существует немало таких особенностей, их наличие в конечном счете и определяет симпатии пользователей.

Одна из серьезных проблем поиска в сети – наличие множества копий одного и того же документа на разных сайтах. Точные копии, в том числе и отличающиеся видом кодировки, все поисковые системы легко отсеивают, но зачастую тексты повторяются неточно, с небольшими изменениями. К примеру, текст романа «Война и мир» может быть представлен на десяти сайтах, но на девяти предваряется фразами типа: «Я взял это у Мошкова. Спасибо Мошкову» или: «Я взял этоибо Петрову», а дальше следует текст романа – пять мегабайт. Естественно, пользователю обычно не нужны повторения, ему требуется получить ссылку на основной источник. Отсеивание дубликатов – так называемая обработка нечетких зеркал – превращается в сложную задачу, и приходится применять весьма изощренные алгоритмы, чтобы определить, какой сайт является основным, а какой – «зеркалом». Для этого требуется время, к тому же не все можно сделать автоматически: в некоторых случаях требуется ручная доводка, например, когда пользователи недовольны тем своим адресом, который робот Яндекс выбрал главным из ряда «зеркал».

Кроме того, в поисковых системах действуют специальные алгоритмы, которые отбрасывают «мусор». Это тоже типичная для Интернета проблема – возникает необходимость исключать из поиска серверы, директории на серверах и скрипты, формирующие малосодержательные, неинтересные или просто нечитаемые документы.

Для поиска по сайтам характерна еще одна особенность. Дело в том, что результаты выдаются в виде списка ссылок, ранжированных по степени близости к запросу. Нередко при подготовке текстов используются специальные приемы, чтобы ссылка на сайт, даже если он не соответствует запросу, попала на первые страницы результатов поиска. В самом простом случае в текст документа вставляются слова, часто фигурирующие в запросах, например «секс», «реферат» и т. п. Существуют механизмы, которые позволяют обнаруживать эти приемы и соответственно понижать рейтинг данной ссылки в списке найденных документов.

Хороший алгоритм поиска сортирует результаты, принимая в расчет не только наличие в текстах искомых слов, но и то, в какой части текста они расположены: если слово встречается в заголовке, а не просто в тексте, ссылка на этот документ займет более высокое место в списке. Важно и то, как часто встречается в русском языке содержащееся в запросе слово: чем менее оно распространено, тем большее влияние окажет на конечный результат.

По примеру поисковой системы Google Яндекс начал при поиске учитывать популярность документов в Интернет-среде. Если рассматривать Глобальную сеть как единую базу данных, то наличие ссылок на той или иной документ – важный фактор, говорящий о его значимости. Можно назвать этот показатель «популярностью в среде писателей». Следует отметить, что обычно принято определять степень популярности у читателей по количеству прочитавших данный документ. Но если подсчитать ссылки на него, то это позволит оценить, сколько из прочитавших нашли документ настолько интересным, чтобы сослаться на него в своих текстах. Google практикует такие подсчеты уже три года, а на Яндексе этот алгоритм применяется с мая 2001 года: при каждом поиске анализируется и число ссылок на данную страничку, и то, как она сформулирована.

Если описанные выше элементы поисковых систем в той или иной степени применяются на разных порталах, то технология Яндекс-Гуру уникальна и не имеет аналогов в мире. Она построена по известным псистем, но до сих пор только Яндексу удалось применить их при поиске информации в Сети. Задача здесь такова: снабдить необходимой информацией и подсказать решение человеку, который лишь приблизительно знает, что ему требуется. Скажем, желающий купить цифровую фотокамеру может не знать, что такое пиксел и сколько миллионов их должно быть в нужной ему камере. Яндекс-Гуру и не спрашивает его об этом – просто задается вопрос, предполагается ли пейзажная съемка. В соответствии с ответом можно определить, какое понадобится разрешение. Затем система выясняет, занимается ли человек портретной съемкой. Если да, ему потребуется объектив с определенными характеристиками. И так далее – задавая ряд простых вопросов, можно отсеять ненужную информацию и предложить человеку на выбор описания только тех устройств, которые отвечают его запросам.

Конечно, для построения такой системы необходима большая предварительная работа – около двух месяцев уходит на подготовку каждой категории продуктов, по которым предлагается поиск на Яндекс-Гуру.

Ну а для тех, кто разбирается в мегапикселах и фокусных расстояниях и точно знает, какие характеристики им нужны, в Яндекс-Гуру есть отдельный инструмент – фильтры. Устроен он очень просто: вы задаете граничные значения характеристик, а система выдает данные обо всех товарах, параметры которых попадают в заданные пределы. Естественно, что периодически алгоритмы поиска приходится модернизировать – в частности потому, что меняются качественные оценки. К примеру, если еще недавно большим разрешением в любительской цифровой фототехнике считался мегапиксел, то сегодня это уже три мегапиксела. Важно еще и регулярное обновление самой базы данных, по которой происходит поиск. База по товарам обновляется на Яндексе ежедневно, для поиска по новостям – каждые 15 минут.

По приблизительным оценкам в русской части Интернета сейчас содержится около сорока миллионов уникальных документов. Для осуществления эффективного поиска по запросам необходима большая подготовительная работа. Сам поиск по огромной базе данных представляется очень трудной задачей. На Яндексе просматривается и обрабатывается несколько миллионов документов в день. Поиск работает очень быстро, потому что здесь, как и в других ведущих поисковых системах, используется не суперкомпьютер с супербольшим количеством процессоров, памяти и дисков, а объединенные в единую систему обычные мощные компьютеры, каждый из которых действует как поисковая машина (эта технология называется кластеризацией поиска). У Яндекса их сейчас 24, то есть база данных как бы разрезана на 24 части. Один и тот же

запрос отправляется сразу на все машины, а полученные результаты собираются специальным программным модулем, переранжируются, после чего формируется окончательный список. Такая технология позволяет ускорить поиск и снизить стоимость обработки каждого запроса.

Вопрос о снижении себестоимости обработки запросов очень важен. Дело в том, что для пользователя услуга поиска предо, и для того чтобы портал приносил доход, важно найти разумное соотношение между расходами на его содержание и поступающими доходами.

Механизмы получения доходов в принципе те же, что на телевидении и в прессе: его приносит размещаемая на портале реклама. Однако по сравнению с традиционными средствами массовой информации реклама в Интернете обладает многими преимуществами. Недостаток у нее, по существу, только один: относительно небольшая аудитория. Но уже сегодня число пользователей Интернета в России оценивается цифрой 4 миллиона, и статистика Яндекса свидетельствует, что по

объему аудитории с ним соизмеримы только крупнейшие российские газеты, а впереди лишь пять главных каналов телевидения.

Реклама в Интернете принципиально отличается от рекламы в средствах массовой информации. Кого сегодня не раздражает телевизионная реклама? Вы смотрите фильм, а вам рекламируют стиральный порошок, вы пьете чай, а вам рассказывают сами знаете о чем... Человек,

который обращается к услугам поискового портала, объясняет, в чем он нуждается, и это позволяет предложить ему именно ту рекламу, в которой он реально заинтересован. На Яндексе рекламу можно показывать избирательно, в соответствии с запросами конкретного человека. Вы ищете стиральный порошок? Пожалуйста, почитайте о стиральном порошке. Фактически это уже не совсем реклама, а новый инструмент для удовлетворения потребностей пользователя.

Такая реклама значительно более эффективна, потому что человек сам ее ждет. Для рекламодателя такой способ размещения также обладает огромными преимуществами: если вы производите какую-то специфическую продукцию (к примеру, стартер для автомобиля), то круг ваших покупателей достаточно узок и вряд ли вы в состоянии позволить себе широковещательную рекламную кампанию стоимостью несколько десятков тысяч долларов. Яндекс покажет вашу рекламу только тем, кто наберет соответствующие слова в строке запроса (например, слово «стартер»). Пусть адресатов будет не так много, зато коэффициент полезного действия показа окажется так высок, что за весьма скромную сумму вы донесете ваше рекламное предложение практически до всех ваших потенциальных клиентов, которые только имеются в Интернете.

У портала есть четыре источника доходов. Первый – размещение широковещательной рекламы (это продвижение брэнда либо объявление о каких-то новых продуктах, потенциально интересных всем). Второй – реклама целевая, узконаправленная, о которой говорилось выше. Третий – партнерские программы с магазинами: сведения об имеющихся товарах предлагаются контекстно тем людям, которые ищут эти товары. Наконец, четвертый источник дохода – продажа технологий: поисковые системы Яндекса используются на сайтах «РБК», «Компьютерры», Connect’а; эта система работает в Государственной Думе, в МИДе, в целом ряде других организаций. На долю первых двух источников приходится примерно по тридцать и более процентов дохода «Яндекса», третий обеспечивает процентов двадцать.

По мере роста пды повышаются. За последние полгода ежемесячные поступления от рекламы на Яндексе увеличились вдвое. И тем не менее портал пока не окупается: огромные средства тратятся на развитие. За прошлый год число сотрудников увеличилось в десять раз, и в результате компания вышла на первое место по посещаемости в российской части Интернета. Естественно, что при этом тратилось больше денег, чем зарабатывалось. Тем не менее прибыль растет, и, по осторожным оценкам генерального директора «Яндекса» Аркадия Воложа, в 2003 году уровень рентабельности все-таки будет достигнут – естественно, если не произойдет резких изменений в экономической ситуации.

Обобщая все сказанное, можно утверждать, что крупные порталы в Интернете предоставляют пользователям множество чрезвычайно полезных бесплатных услуг и в то же время выступают в качестве интеллектуального посредника между покупателем и рекламодателем. К

услугам порталов обращаются практически все пользователи российской Сети, а рекламодатели еще далеко не полностью используют этот новый эффективный инструмент продвижения своей продукции. Будем надеяться, что освоить его им поможет эта статья.

Главная страница / Архитектура отрасли