woensdag, januari 07, 2004

Googlekiller

ibm.jpgHoewel Google steeds meer leuke gadgets krijgt, lijkt ze te worden ingehaald door zoekprogramma's die naast het pagerankmechanisme betere zoekmethoden en weergaven van zoekresultaten kennen. IBM Research ontwikkelt Webfountain, een nieuwe internetsearch en analyse-omgeving waarmee naast webpagina's ook databases, email, nieuwsgroepberichten, irc-chats, documenten en messengerberichten zijn te categoriseren. De truc is om in ongestructureerde tekst woorden te herkennen en deze te taggen (labelen). IBM heeft daarvoor 40 verschillende tag-programma's draaien die ieder gespecialiseerd zijn in een bepaald kennisdomein. Zo is er een programma dat alleen geografische informatie in tekst herkent en deze in XML-stijl labelt. Omdat de webdata gestructureerd zijn, kunnen database-georienteerde programma's als een dataminingtool de gegevens analyseren. Gelukkig voor Google is deze technologie alleen beschikbaar voor bedrijven die hiervoor willen betalen. Deze presentatie laat zien hoe Webfountain ongeveer werkt en wat je met de resultaten kunt doen. In Beyond Google: Narrow the Search staan een aantal plugins beschreven om de resultaten van o.a. Google te visualiseren.

Geen opmerkingen: