Nutch es un proyecto en crecimiento soportado por la comunidad Opensourse que según palabras de ellos mismos trata de dar batalla a un mercado casi monopólico de Google y digo casi porque a pesar de la existencia de Bing, Yahoo! y proyectos experimentales como Wolfram, Google sigue teniendo la mayor parte del pastel por lo menos en la parte occidental del planeta.
Características
- No distingue entre mayúsculas y minúsculas
- Usando comillas (“) al principio y al final de un grupo de palabras o frase realiza la búsqueda de ese texto exacto
- Añadiendo el signo más (+) delante de una palabra fuerza la búsqueda de palabras no habituales
- Añadiendo el signo menos (-) delante de una palabra realiza la búsqueda excluyendo esa palabra
Actualmente no hay una versión de prueba pero el código está basado en Hadoop, un framework que permite trabajar con enormes cantidades de información y que promete un código de alto nivel para los desarrolladores.
Algunas de las personas que se encuentra detrás de este proyecto son Tim O’Reilly, Peter Savichy y Mitchell Kapor.
Así las posibilidades para trabajar colaborativamente en un algoritmo que ayude en la indexación de información desde un buscador opensourse, principal herramienta para quienes navegamos en Internet aumentan y pintan para ser sumamente interesantes.
Recordemos que este tipo de iniciativas son las que finalmente obligan a los las empresas a mejorar y crecer, ofreciendo mejoras que repercutirán en los usuarios.