domingo 28 de junio de 2009

Minipost: Presentaciones del Velocity 2009

Os dejo un enlace donde podéis bajaros las presentaciones que se hicieron en el Velocity 2009 del 22 al 24 de junio. Hay de todo un poco, desde experiencias en Flickr llegando al extremo lo que dicen de "release early, release often" haciendo 10 deploys al día, cloud, escalabilidad y todo lo relacionado con el rendimiento web.

jueves 23 de abril de 2009

Lista de DDD en español

Me hago eco de la noticia de que José Manuel Beas ha creado una lista sobre DDD (Domain Driven Design) en español.

La verdad es que sigo el tema del DDD a refilón sin entrar demasiado en detalle y como bien dice José, la lista en inglés se hace difícil de seguir por el idioma. A ver si con este nuevo grupo nos animamos todos un poco más y le doy una continuidad.

Os animo a todos a participar para hablar de values, entities, services, modules, aggreagtes, etc :)

viernes 27 de marzo de 2009

Arrancamos con empleo y Jobsket

Hace pocos días que anunciamos en el blog de jobsket su apertura y empezábamos a enviar invitaciones a los que se habían registrado hacía ya un tiempo.

Han sido unos meses de duro trabajo y sacando el tiempo de donde no lo había pero el esfuerzo a merecido la pena totalmente. A partir de ahora a seguir arreglando los errores que puedan florecer, escuchar el feedback de la gente (que nos va llegando y nos resulta de gran utilidad) y en definitiva a seguir mejorando la aplicación ya que al fin y al cabo podríamos decir que acabamos de nacer. El margen de mejora es muy grande y vamos a por él.

Si queres saber qué es jobsket, en el blog ya hicimos una introducción a la aplicación pero vuelvo a dejar algunos puntos.
  • Jobsket y el empleo van cogidos de la mano.
  • Un click y ya tienes tu CV subido para que los otros puedan verlo en un visor pdf.
  • Cómo está el mercado a vista de pájaro.
  • Con tu CV subido, el sistema valora tu currículum en función del contenido del CV y el estado del mercado.
  • ... y lo que está por llegar, que no es poco :).
Así que aquí va un pequeño resumen de lo qué es Jobsket. Os invito a todos a que os registréis para la beta, lo probéis vosotros mismos y si es posible criticar todo lo posible para poder mejorar con vuestras opiniones, que son las que cuentan.

domingo 1 de marzo de 2009

Estás aquí para ser feliz

jueves 5 de febrero de 2009

Reduciendo páginas a indexar con DUST

El otro día leí un paper bastante interesante sobre cómo un crawler puede reducir el número de páginas a analizar e indexar, todo prácticamente sin tener que visitar las páginas, simplemente analizando sus direcciones. El algoritmo en cuestión se llama DustBuster, donde DUST responde a (Differente URLs Similar Text).

La idea general es que a partir de un conjunto de direcciones, se le aplica el algoritmo y se transforman las direcciones que contienen contenido similar o duplicado en una única dirección. Un ejemplo muy claro de diferentes direcciones con contenido similar es el que proponen como ejemplo en el paper, news.google.com y google.com/news. ¿Qué sentido tiene indexar las dos páginas si contienen la misma información?, no se me ocurre nada a menos de quererse comparar por ver quién la tiene más grande perjudicando por una parte al usuario final mostrándole resultados duplicados y por otra, dejando al crawler visitando páginas ya visitadas gastando así tiempo y recursos de manera innecesaria.

El flujo vendría a ser el siguiente:
  1. Entrada: listado de todas las URL obtenidas de un sitio web
  2. Detectar las posibles reglas DUST existentes
  3. Eliminar las reglas DUST que sean redundantes
  4. Validar las reglas
Los resultados que muestran en el paper son bastante interesantes, llegando a reducir hasta un 28% en algún caso el número de páginas a visitar para ser indexadas, número nada despreciable si el número total de páginas es elevado.

Personalmente no creo que todo valga con este algoritmo pero si representa una buena alternativa para intentar reducir el trabajo a realizar por el crawler sobretodo para buscadores que no sean verticales, ya que por lo general, en estos últimos, el conjunto de páginas a visitar estan acotadas o utilizan otros formatos como el XML para obtener la información

martes 16 de diciembre de 2008

Ganamos la beca alzado.org con jobsket.com

Ayer la gente de alzado.org anunció los resultados de la su beca para este año 2008 y jobsket.com, el proyecto en el que voy trabajando, ganó. La verdad es que todo el equipo estmamos muy contentos de que la manera de enfocar jobsket.com haya gustado al jurado. De paso, aprovechar para agradecer a la gente de alzado.org la oportunidad que brindan en crear este tipo de iniciativas y felicitar a todos los otros proyectos que se presentaron, y si se me permite, hacer mención especial al equipo de debugmodeon.com que conozco a algún integrante y realmente están trabajando a tope con la red.

Dicho esto no queda nada más que seguir trabajando para tener listo al 100% jobsket.com., que aunque trabajemos desde ciudades diferentes los pasos que vamos dando son firmes y con buen ritmo. Vamos a seguir trabajando en mejorar el producto ya que al fin y al cabo al que tenemos y queremos impresionar es al usuario final e intentar seducirlo con lo que queremos proporcionarle, que realmente creemos que es de gran utilidad y quiero pensar ya a nivel personal, que el haber ganado la beca lo confirma ni que sea solo un poco.

A seguir trabajando que queda mucho camino por recorrer.

sábado 22 de noviembre de 2008

Drizzle, la base de datos optimizada para cloud y web

Siempre me entero de todo tarde y con Drizzle no podía ser menos. Hace un par de semanas me enteré de que se está trabajando en la creación de una nueva base de datos llamada Drizzle. ¿Por qué crear otra base de datos si ya tenemos buenas alternativas en el mercado?, simplemente porque el tiempo pasa y se necesitan nuevas soluciones a problemas que aparecen poco a poco.

Desde ya hace unos años el uso de Internet va siendo cada vez más grande, las aplicaciones web tienen muchos más usuarios y el problema de escalar la aplicación por un crecimiento inesperado seguro que ha quitado horas de sueño a más de uno/a. Drizzle al rescate. Como indica la página principal Drizzle es... "a lightweight SQL database for Cloud and Web"

El target de Drizzle es muy claro, aplicaciones web / cloud con una concurrencia masiva con dos pilares básicos, fiabilidad y rendimiento.

De toda la información que he revisado hasta el momento, lo que más me gusta de Drizzle es la sensación de agilidad que quieren dar al proyecto, se quiere terminar con esos grandes tiempos de espera entre versiones como pasa con el propio MySQL.

Otra cosa que me ha sorprendido es que si algo sobra, se quita y fuera. ¿Quién se imagina una base de datos sin triggers, menos tipos de datos, vistas, caché de queries, entre otros?, Drizzle. Las bases de datos que conocemos hoy en día vienen con una gran cantidad de funcionalidades que seguro que ni conocemos y no llegamos a utilizar, algo que al final acaba provocando que tengamos una base de datos pesada. La gente que está creando Drizzle es muy lista y lo tiene claro, quieren crear una base de datos simple, ligera y modular, con un micro-kernel para que se extender fácilmente.

A destacar que no es un producto propio de Sun / MySQL sino que es un proyecto de la comunidad y con el beneplácito de Sun. La licencia es GPL 2 y no habrá soporte para Windows, tal cual. Soporta 32 y 64 bits pero el target objetivo son maquinas de 64.

Tengo ganas de ver como va evolucionando Drizzle, parece como si se quisiese volver a los orígenes, una base de datos ligera, intentando adaptarse a las nuevas tendencias que vivimos en la web actualmente. Para acabar, me aventuro a decir que a largo plazo -y si funciona-, el desarrollo de Drizzle puede ayudar a mejorar el del propio MySQL.

Me despido con unas palabras textuales de Bryan Acker: "If you want more feature, go use MySQL".