Есть ли будущее у поисковиков «с интеллектом» или Google для чайников

Поисковая система Wolfram Alpha взбудоражила интернет-сообщество только своим анонсом и первыми результатами тестирования. Представляю себе, что будет, когда система будет доступна для всех желающих… Однако такие заявления о запуске поисковиков, понимающих обычные человеческие вопросы, равно как и новости о старте UGC-поисковиков у меня вызывают все больший скепсис. В первую очередь потому, что человеческое мышление и язык очень сложно формализировать. Как результат – очень сложно сопоставить утверждение, являющиеся вопросом (запросом) и какую-то единицу информации.

Проблемы, описанные ниже, касаются поисковых систем нескольких типов:

— поисковиков, отвечающих на вопрос на естественном, «человеческом» языке;

— поисковиков, работающих по типу «Вопрос» – «Ответ»;

— UGC-поисковиков, где вместо поискового алгоритма отвечают конкретные люди (этот тип систем является подтипом предыдущих).

Работа таких поисковых систем и их использование подвержено ряду проблем:

— сложности в формулировке запроса

Человеческое знание не всегда формально. Точно так же и не формальна человеческая жизнь. И задавая вопрос, человек может его сформулировать неверно – с точки зрения им же ожидаемых ответов. Часто это бывает из-за незнания каких-то вещей, иногда – потому, что человек просто не может верно сформулировать вопрос. С подобного рода вопросами наверняка сталкивались специалисты в ИТ или более-менее продвинутые пользователи, которым вопрос задавали пользователи неопытные.

— сложности в предоставлении ответа

Эти сложности касаются, прежде всего, хаотичных UGC-поисковых систем, то есть тех, где на запросы отвечают другие пользователи и эти ответы не модерируются. Самым ярким примером таких систем являются сервисы «Вопросов-Ответов». С подобного рода вещами сталкивался каждый более-менее опытный пользователь блогов и форумов. Увы, можно спросить, например, о том, когда отходит автобус из пункта А в пункт В, а услышать ответы вроде «почему ты не едешь поездом», «лучший вид транспорта – самолет», «только лузеры не имеют своей машины» и т.д. Конечно, на определенном этапе наступает момент, когда количество переходит в качество, и автор вопроса таки получает свой ответ, однако этому может предшествовать необходимость разгребать большие завалы информационного мусора.

Решением первой проблемы являются уточняющие вопросы, что собственно мы и делаем, общаясь с непрофессионалами. Или же, если получив ответ, пользователь остается недоволен и утверждает, что «имел в виду не то». Как реализовать такого рода обратную связь в поисковых системах – я себе не представляю. Нет, это реально в сервисах типа «Вопрос-Ответ», но вот для формальной поисковой машины, использующей алгоритмы, это, мне кажется, практически невозможно.

Вторая задача решаема – только для вопросов определенного типа. Какие и берется обрабатывать Wolfram Alpha. Судя по  описанию, сервис ответит на вопрос «когда отходит автобус из пункта А в пункт В», но не ответит – «чем лучше добраться из пункта А в пункт В» (как вариант – «какая стиральная машина лучше», «как быстрее похудеть» и т.д.). Вопросы второго типа – как раз для сервисов «Вопрос» – «Ответ».

Таким образом, поисковые системы, которые воспринимают вопросы на естественном «человеческом» языке являются очень узкоспециализированными. Точнее, сфера их применения на самом деле очень невелика. С их помощью нельзя составить подборку материлов по определенной теме, нельзя найти книгу или картинку, e-mail или номер телефона человека, или, например, …

Но зато можно найти прогноз погоды в определденный день, узнать курс валют 5 лет назад, день рождения Дарвина или дату убийства президента Кеннеди.

Будущее у таких поисковых машин есть. Однако их смело можно назвать утилитарными – они являются инструментом максимально упрощенного использования традиционных поисковых систем. Так сказать, гугл для чайников