Обсуждение статьи Сеть, которая умнее людей
Всего сообщений : 34
Михаил : Проблема синонимов | 04.01.02, 17:11 |
"Елку" и "ель" как одно слово воспринимают уже сейчас все поисковые системы (Google, Рамблер, Яндекс...) Это обычная операция приведения словоформ к единому базису. Но вот пока ни одна поисковая система не дает возможность описать какой ТИП результата Вы хотите получить: освежитель воздуха "Ель", информацию о растении или предприятие с одноименным названием. Это можно сделать, используя Yahoo, List.ru, ... или прочие рубрикаторы (искать только в соответствующем разделе). Но в рубрикаторах информацию по полочкам распихивают люди ручками, а не поисковые системы автоматически. Crawler в этих системах только обновляет индекс автоматом. А как насчет ручками распихать по-полочкам весь интернет? Вот RDF/RDFS (resource description framework schema) эту проблему и решает: поисковики, которые смогут загружать документы в этом формате, будут знать что за свойства у ресурса, где брать описание типа (типов) этого документа, как этот документ связан с другими и т.д. Соответственно не будет путанницы между освежителем воздуха "Ель" и предприятием "Ель". К тому же часть схемы, описывающей ресурсы (часть онтологии), может быть на одном сервере, другая часть - еще в 10 местах. То есть можно отрубрицировать на своем сайте свои собственные документы и документы с сервера Нетоскопа используя онтологию находящуюся на Yahoo. И это описание будет корректно понято поисковой системой. Если бы уже существовал инструментарий и этот форум описывался бы в RDF, то пользователю на запрос "найти все статьи форума со словом Ель и оносящиеся к Онтологии" были бы выданы только эти сообщения... Это все дает КАЧЕСТВЕНННО новый уровень описания содержимого. Качественно новый, даже по сравнению с XML/XMLSchema именно потому, что это универсальный формат, который может быть понят любым поисковиком, в то время как приложение работающее с XML/XMLSchema должно быть заточено под конкретную схему и формат документов. Часть форматов уже есть. И многие еще в разработке (DAML, RDFS...). Это уже очень много. Но нет нормальных программ, с этим всем работыющих. И пока это тоже самое, что HTML без броузера.
Наиболее сильная группа (на мой взгляд), работающая с онтологиями и семантическим интернетом - в Стенфордском университете (где Сергей Брин придумал Гугл и где другой Сергей - Сергей Мельник - относитльно недавно (весной) выпустил интересную статью про сравнение и поиск по семантическим графам)
Ссылки по теме: http://www.semanticweb.org/ http://www.daml.org/ http://www.w3.org/RDF http://www.w3.org/TR/2000/CR-rdf-schema-20000327/ http://www7.scu.edu.au/programme/fullpapers/1921/com1921.htm (описание гуглового механизма) http://www-db.stanford.edu/~melnik/publications.html
|
Рекомендую посмотреть http://askjeeves.com/ Glen (10.01.02, 22:34)
Да, например L e x a (11.01.02, 22:42)
Давайте назовем вещи своими именами... Вахмурка (08.01.02, 17:45)
вопросы Swart (09.01.02, 0:38)
варианты Bot1 (09.01.02, 13:15)
вопросы Вахмурка (10.01.02, 14:00)
Ага, своими именами, а не вашими L e x a (09.01.02, 18:13)
Ага, своими именами, а не вашими Вахмурка (10.01.02, 13:31)
Кто на нас с Лехой? Марсианин (11.01.02, 12:25)
Давайте назовем вещи своими именами... Panya (16.01.02, 22:28)
"чистые" науки? Bot1 (07.01.02, 20:33)
фундаментальные то есть Glen (09.01.02, 4:30)
Проблема синонимов Glen (03.01.02, 21:40)
Проблема синонимов Михаил (04.01.02, 17:11)
Мелкое замечание Дмитрий (04.01.02, 22:39)
Еще нужно заставить разработчиков ресурсов делать это Glen (04.01.02, 23:26)
Зачем заставлять? Сайты делать никто не заставлял L e x a (07.01.02, 19:43)
Проблема монополизма Glen (09.01.02, 4:28)
Проблема монополизма L e x a (09.01.02, 18:21)
Проблема монополизма Недобрый Вахмурка (10.01.02, 17:44)
Re: Проблема монополизма Glen (10.01.02, 22:20)
Проблема монополизма Недобрый Вахмурка (10.01.02, 17:38)
Ерунда. Sergey (02.01.02, 20:00)
за человека никто думать не будет в любом случае :) Swart (02.01.02, 21:18)
за человека никто думать не будет в любом случае :) Знайка (06.01.02, 23:51)
за человека никто думать не будет в любом случае :) Вахмурка (08.01.02, 17:22)
за человека никто думать не будет в любом случае :) Знайка (08.01.02, 22:51)
ключевое слово "обычно". Swart (09.01.02, 0:15)
ключевое слово "обычно". Знайка (09.01.02, 4:25)
ключевое слово "обычно". Вахмурка (10.01.02, 13:43)
Re: "Подождем с десять лет, посмотрим... " Glen (10.01.02, 22:47)
за человека никто думать не будет в любом случае :) Вахмурка (10.01.02, 13:40)
за человека никто думать не будет в любом случае :) Знайка (11.01.02, 13:47)
Re: Ерунда. Glen (03.01.02, 21:33)
|