q
Mail.RuПочтаМой Мир0ОдноклассникиИгрыЗнакомстваНовостиПоиск
Имя    ( регистрация )
Пароль ( забыли? )

Метки  

Календарь


Глюки морфологической машинки Яндекса

Как известно, морфологическая машинка Яндекса научена интерпретировать глагол и образованное от него причастие как одно и то же слово, что грамматически, конечно, правильно, однако на практике - при поиске то есть - иногда приводит к занятным результатам.

Возьмем один конкретный пример: связку "глагол" - "страдательное причастие на -т" (прошедшего времени то бишь): выпил - выпита, налил - налита и т. д. В случае, если вы введете в Яндексе что-то типа "налита вода", то он "сообразит", что "налита" - форма глагола "налить" и в результатах, помимо всего прочего, выдаст "налить воды", "налил воды" и т. п. (что в некоторых случаях и без глюков сильно захламляет поиск, кстати). Однако попробуйте ввести словосочетания типа "сорвать мяты", "битой по голове", "Пит с друзьями" :), "витые грабли" и т. п. Ясное дело, "мяты", "битой", "Пит" и "витые" Яндекс проинтерпретирует тут не только как существительные, но и как причастия (ибо по форме своей они совпадают со страдательными причастиями, образуемыми от глаголов понятно каких), вследствие чего в результатах вылезают "вилы, грабли", "пьют с друзьями", "сорвали, мяли" и всякий подобный хлам.

В общем, лучше с глаголами не связываться :)

P.S. Между прочим, тут есть любопытный выход на всякие оптимизаторские дела. Скажем, разработчику сайта о с/х продукции совсем не помешает знать, что "вилы, грабли" и "витые грабли" для Яндекса - это одно и то же :)

Upd. Как оказалось (см. один из комментариев), люди иногда заходят сюда в поисках сайтов о пирамидах майя. Специально для таких посетителей - подборка ссылок на сайты о майя: "http://neiron.ru/search.php?query=индейцы майя" :)

Нравится
Написать комментарий


     11-01-2006 19:41 (ссылка)
Re: Глюки морфологической машинки Яндекса
!!вилы
!!пила
!!бита

и т. д.
Андрей Белов      12-01-2006 10:30 (ссылка)
Re: Глюки морфологической машинки Яндекса
Да, забыл сразу прокомментировать случай с "вилами, граблями". Как видим, тут Яндекс ошибается вдвойне - из-за омонимии форм глагола "вить" ("вил" в пр. вр.) и существительного "вилы" ("вил" в р. п.). Т. е. тут возникают уже такие пары: а) глагол и причастие - "вил" - "витой", б) омонимичные им формы существительного и прилагательного - "вилы" - "витые". О, кстати, придумал занятный пример для эксперимента - "вита нова" (привет дантоведам! :)).
Андрей Белов      13-01-2006 17:40 (ссылка)
Re: Глюки морфологической машинки Яндекса
Существенное замечание о причинах происхождения такого рода проблем машинной морфологии сделал Игорь Ашманов (на Еже-листе, цитата приводится с разрешения автора):

"Это идёт ещё из великого Грамматического словаря А. А. Зализняка, который не вполне пригоден для машинных морфологий в виде "как есть", так как трактует часто грамматические возможности, а не узус".

(Большая часть - если не все 100 % - программ для обработки русской морфологии основываются на материалах словаря А. А. Зализняка).
     14-01-2006 09:20 (ссылка)
Re: Глюки морфологической машинки Яндекса
Я ввёл слово май.
Так мне про пирамиды майи начал выдавать яндекс.
Это к чему?

Написать комментарий