/ Форум / Сеть, которая умнее людей
Нетоскоп
Форум

Новости
АПРЕЛЬ МАЙ ИЮНЬ
ПН ВТ СР ЧТ ПТ СБ ВС
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31
2003 год 2004 2005 год

Форум
Клиенты подали в суд на PayPal за закрытие счетов (17)
Корейцы завалили сервер Олимпийского комитета США (6)
На "Газете.ру" решают судьбу российской олимпийской сборной (10)
"Коммерсант" опубликовал Топ-100 IT-менеджеров (11)
Новый сайт "За стеклом" сделал Павел Черкашин (13)
К 2020 году роботы получат гражданские права (10)
Физматшкола 239 компьютеризирована на пиратские деньги (22)
Японцы пытались сорвать сахалинский референдум (219)
Сергей Покровский: "Первые русские хакеры были работниками НИИ" (101)


Разделы

Обсуждение статьи Сеть, которая умнее людей
Всего сообщений : 34

Михаил : Проблема синонимов04.01.02, 17:11
"Елку" и "ель" как одно слово воспринимают уже сейчас все поисковые системы (Google, Рамблер, Яндекс...) Это обычная операция приведения словоформ к единому базису. Но вот пока ни одна поисковая система не дает возможность описать какой ТИП результата Вы хотите получить: освежитель воздуха "Ель", информацию о растении или предприятие с одноименным названием. Это можно сделать, используя Yahoo, List.ru, ... или прочие рубрикаторы (искать только в соответствующем разделе). Но в рубрикаторах информацию по полочкам распихивают люди ручками, а не поисковые системы автоматически. Crawler в этих системах только обновляет индекс автоматом. А как насчет ручками распихать по-полочкам весь интернет? Вот RDF/RDFS (resource description framework schema) эту проблему и решает: поисковики, которые смогут загружать документы в этом формате, будут знать что за свойства у ресурса, где брать описание типа (типов) этого документа, как этот документ связан с другими и т.д. Соответственно не будет путанницы между освежителем воздуха "Ель" и предприятием "Ель". К тому же часть схемы, описывающей ресурсы (часть онтологии), может быть на одном сервере, другая часть - еще в 10 местах. То есть можно отрубрицировать на своем сайте свои собственные документы и документы с сервера Нетоскопа используя онтологию находящуюся на Yahoo. И это описание будет корректно понято поисковой системой. Если бы уже существовал инструментарий и этот форум описывался бы в RDF, то пользователю на запрос "найти все статьи форума со словом Ель и оносящиеся к Онтологии" были бы выданы только эти сообщения...
Это все дает КАЧЕСТВЕНННО новый уровень описания содержимого. Качественно новый, даже по сравнению с XML/XMLSchema именно потому, что это универсальный формат, который может быть понят любым поисковиком, в то время как приложение работающее с XML/XMLSchema должно быть заточено под конкретную схему и формат документов.
Часть форматов уже есть. И многие еще в разработке (DAML, RDFS...). Это уже очень много. Но нет нормальных программ, с этим всем работыющих. И пока это тоже самое, что HTML без броузера.

Наиболее сильная группа (на мой взгляд), работающая с онтологиями и семантическим интернетом - в Стенфордском университете (где Сергей Брин придумал Гугл и где другой Сергей - Сергей Мельник - относитльно недавно (весной) выпустил интересную статью про сравнение и поиск по семантическим графам)

Ссылки по теме:
http://www.semanticweb.org/
http://www.daml.org/
http://www.w3.org/RDF
http://www.w3.org/TR/2000/CR-rdf-schema-20000327/
http://www7.scu.edu.au/programme/fullpapers/1921/com1921.htm (описание гуглового механизма)
http://www-db.stanford.edu/~melnik/publications.html


Рекомендую посмотреть http://askjeeves.com/ Glen (10.01.02, 22:34)
   Да, например L e x a (11.01.02, 22:42)
Давайте назовем вещи своими именами... Вахмурка (08.01.02, 17:45)
   вопросы Swart (09.01.02, 0:38)
     варианты Bot1 (09.01.02, 13:15)
     вопросы Вахмурка (10.01.02, 14:00)
   Ага, своими именами, а не вашими L e x a (09.01.02, 18:13)
     Ага, своими именами, а не вашими Вахмурка (10.01.02, 13:31)
   Кто на нас с Лехой? Марсианин (11.01.02, 12:25)
   Давайте назовем вещи своими именами... Panya (16.01.02, 22:28)
"чистые" науки? Bot1 (07.01.02, 20:33)
   фундаментальные то есть Glen (09.01.02, 4:30)
Проблема синонимов Glen (03.01.02, 21:40)
   Проблема синонимов Михаил (04.01.02, 17:11)
     Мелкое замечание Дмитрий (04.01.02, 22:39)
     Еще нужно заставить разработчиков ресурсов делать это Glen (04.01.02, 23:26)
       Зачем заставлять? Сайты делать никто не заставлял L e x a (07.01.02, 19:43)
         Проблема монополизма Glen (09.01.02, 4:28)
           Проблема монополизма L e x a (09.01.02, 18:21)
             Проблема монополизма Недобрый Вахмурка (10.01.02, 17:44)
             Re: Проблема монополизма Glen (10.01.02, 22:20)
           Проблема монополизма Недобрый Вахмурка (10.01.02, 17:38)
Ерунда. Sergey (02.01.02, 20:00)
   за человека никто думать не будет в любом случае :) Swart (02.01.02, 21:18)
     за человека никто думать не будет в любом случае :) Знайка (06.01.02, 23:51)
       за человека никто думать не будет в любом случае :) Вахмурка (08.01.02, 17:22)
         за человека никто думать не будет в любом случае :) Знайка (08.01.02, 22:51)
           ключевое слово "обычно". Swart (09.01.02, 0:15)
             ключевое слово "обычно". Знайка (09.01.02, 4:25)
             ключевое слово "обычно". Вахмурка (10.01.02, 13:43)
               Re: "Подождем с десять лет, посмотрим... " Glen (10.01.02, 22:47)
           за человека никто думать не будет в любом случае :) Вахмурка (10.01.02, 13:40)
             за человека никто думать не будет в любом случае :) Знайка (11.01.02, 13:47)
   Re: Ерунда. Glen (03.01.02, 21:33)




ПРЕСС-РЕЛИЗЫ
Yellow NewsPillow
Возрождение легендарной NewsPillow

АИСТ
Стартует дилерская программа ASP-сервиса SiteManager для веб-студий

Caravan
Караван отменяет все регистрационные платежи на виртуальном хостинге и на размещение физических серверов (Colocation)

Экспресс-Интернет
Система управления сайтом для Веб-студий, а не для Владельцев сайтов. Экспресс-Интернет.

"Логика Бизнеса"
Мария Каменнова вошла в TOP-100 отечественной ИТ-индустрии

Copyright © 2000-2002 Нетоскоп
Информация о сайте