
Hoewel Google steeds meer
leuke gadgets krijgt, lijkt ze te worden ingehaald door zoekprogramma's die naast het pagerankmechanisme betere zoekmethoden en weergaven van zoekresultaten kennen.
IBM Research ontwikkelt
Webfountain, een
nieuwe internetsearch en analyse-omgeving waarmee naast webpagina's ook databases, email, nieuwsgroepberichten, irc-chats, documenten en messengerberichten zijn te categoriseren. De truc is om in ongestructureerde tekst woorden te herkennen en deze te taggen (labelen).
IBM heeft daarvoor 40 verschillende tag-programma's draaien die ieder gespecialiseerd zijn in een bepaald kennisdomein. Zo is er een programma dat alleen geografische informatie in tekst herkent en deze in XML-stijl labelt.
Omdat de webdata gestructureerd zijn, kunnen database-georienteerde programma's als een
dataminingtool de gegevens analyseren. Gelukkig voor Google is deze technologie alleen beschikbaar voor bedrijven die hiervoor willen betalen. Deze
presentatie laat zien hoe Webfountain ongeveer werkt en wat je met de resultaten kunt doen.
In
Beyond Google: Narrow the Search staan een aantal plugins beschreven om de resultaten van o.a. Google te visualiseren.
Geen opmerkingen:
Een reactie posten