Os dejo un enlace donde podéis bajaros las presentaciones que se hicieron en el Velocity 2009 del 22 al 24 de junio. Hay de todo un poco, desde experiencias en Flickr llegando al extremo lo que dicen de "release early, release often" haciendo 10 deploys al día, cloud, escalabilidad y todo lo relacionado con el rendimiento web.
domingo 28 de junio de 2009
Minipost: Presentaciones del Velocity 2009
Publicado por
jmonne
en
8:37
0
comentarios
Etiquetas: presentaciones
jueves 23 de abril de 2009
Lista de DDD en español
Me hago eco de la noticia de que José Manuel Beas ha creado una lista sobre DDD (Domain Driven Design) en español.
La verdad es que sigo el tema del DDD a refilón sin entrar demasiado en detalle y como bien dice José, la lista en inglés se hace difícil de seguir por el idioma. A ver si con este nuevo grupo nos animamos todos un poco más y le doy una continuidad.
Os animo a todos a participar para hablar de values, entities, services, modules, aggreagtes, etc :)
La verdad es que sigo el tema del DDD a refilón sin entrar demasiado en detalle y como bien dice José, la lista en inglés se hace difícil de seguir por el idioma. A ver si con este nuevo grupo nos animamos todos un poco más y le doy una continuidad.
Os animo a todos a participar para hablar de values, entities, services, modules, aggreagtes, etc :)
Publicado por
jmonne
en
2:01
0
comentarios
Etiquetas: DDD
viernes 27 de marzo de 2009
Arrancamos con empleo y Jobsket
Hace pocos días que anunciamos en el blog de jobsket su apertura y empezábamos a enviar invitaciones a los que se habían registrado hacía ya un tiempo.
Han sido unos meses de duro trabajo y sacando el tiempo de donde no lo había pero el esfuerzo a merecido la pena totalmente. A partir de ahora a seguir arreglando los errores que puedan florecer, escuchar el feedback de la gente (que nos va llegando y nos resulta de gran utilidad) y en definitiva a seguir mejorando la aplicación ya que al fin y al cabo podríamos decir que acabamos de nacer. El margen de mejora es muy grande y vamos a por él.
Si queres saber qué es jobsket, en el blog ya hicimos una introducción a la aplicación pero vuelvo a dejar algunos puntos.
Han sido unos meses de duro trabajo y sacando el tiempo de donde no lo había pero el esfuerzo a merecido la pena totalmente. A partir de ahora a seguir arreglando los errores que puedan florecer, escuchar el feedback de la gente (que nos va llegando y nos resulta de gran utilidad) y en definitiva a seguir mejorando la aplicación ya que al fin y al cabo podríamos decir que acabamos de nacer. El margen de mejora es muy grande y vamos a por él.
Si queres saber qué es jobsket, en el blog ya hicimos una introducción a la aplicación pero vuelvo a dejar algunos puntos.
- Jobsket y el empleo van cogidos de la mano.
- Un click y ya tienes tu CV subido para que los otros puedan verlo en un visor pdf.
- Cómo está el mercado a vista de pájaro.
- Con tu CV subido, el sistema valora tu currículum en función del contenido del CV y el estado del mercado.
- ... y lo que está por llegar, que no es poco :).
Publicado por
jmonne
en
9:37
0
comentarios
Etiquetas: curriculum, empleo, jobsket
domingo 1 de marzo de 2009
jueves 5 de febrero de 2009
Reduciendo páginas a indexar con DUST
El otro día leí un paper bastante interesante sobre cómo un crawler puede reducir el número de páginas a analizar e indexar, todo prácticamente sin tener que visitar las páginas, simplemente analizando sus direcciones. El algoritmo en cuestión se llama DustBuster, donde DUST responde a (Differente URLs Similar Text).
La idea general es que a partir de un conjunto de direcciones, se le aplica el algoritmo y se transforman las direcciones que contienen contenido similar o duplicado en una única dirección. Un ejemplo muy claro de diferentes direcciones con contenido similar es el que proponen como ejemplo en el paper, news.google.com y google.com/news. ¿Qué sentido tiene indexar las dos páginas si contienen la misma información?, no se me ocurre nada a menos de quererse comparar por ver quién la tiene más grande perjudicando por una parte al usuario final mostrándole resultados duplicados y por otra, dejando al crawler visitando páginas ya visitadas gastando así tiempo y recursos de manera innecesaria.
El flujo vendría a ser el siguiente:
La idea general es que a partir de un conjunto de direcciones, se le aplica el algoritmo y se transforman las direcciones que contienen contenido similar o duplicado en una única dirección. Un ejemplo muy claro de diferentes direcciones con contenido similar es el que proponen como ejemplo en el paper, news.google.com y google.com/news. ¿Qué sentido tiene indexar las dos páginas si contienen la misma información?, no se me ocurre nada a menos de quererse comparar por ver quién la tiene más grande perjudicando por una parte al usuario final mostrándole resultados duplicados y por otra, dejando al crawler visitando páginas ya visitadas gastando así tiempo y recursos de manera innecesaria.
El flujo vendría a ser el siguiente:
- Entrada: listado de todas las URL obtenidas de un sitio web
- Detectar las posibles reglas DUST existentes
- Eliminar las reglas DUST que sean redundantes
- Validar las reglas
Los resultados que muestran en el paper son bastante interesantes, llegando a reducir hasta un 28% en algún caso el número de páginas a visitar para ser indexadas, número nada despreciable si el número total de páginas es elevado.
Personalmente no creo que todo valga con este algoritmo pero si representa una buena alternativa para intentar reducir el trabajo a realizar por el crawler sobretodo para buscadores que no sean verticales, ya que por lo general, en estos últimos, el conjunto de páginas a visitar estan acotadas o utilizan otros formatos como el XML para obtener la información
Personalmente no creo que todo valga con este algoritmo pero si representa una buena alternativa para intentar reducir el trabajo a realizar por el crawler sobretodo para buscadores que no sean verticales, ya que por lo general, en estos últimos, el conjunto de páginas a visitar estan acotadas o utilizan otros formatos como el XML para obtener la información
Publicado por
jmonne
en
4:16
0
comentarios
Etiquetas: algoritmos, buscadores
martes 16 de diciembre de 2008
Ganamos la beca alzado.org con jobsket.com
Ayer la gente de alzado.org anunció los resultados de la su beca para este año 2008 y jobsket.com, el proyecto en el que voy trabajando, ganó. La verdad es que todo el equipo estmamos muy contentos de que la manera de enfocar jobsket.com haya gustado al jurado. De paso, aprovechar para agradecer a la gente de alzado.org la oportunidad que brindan en crear este tipo de iniciativas y felicitar a todos los otros proyectos que se presentaron, y si se me permite, hacer mención especial al equipo de debugmodeon.com que conozco a algún integrante y realmente están trabajando a tope con la red.
Dicho esto no queda nada más que seguir trabajando para tener listo al 100% jobsket.com., que aunque trabajemos desde ciudades diferentes los pasos que vamos dando son firmes y con buen ritmo. Vamos a seguir trabajando en mejorar el producto ya que al fin y al cabo al que tenemos y queremos impresionar es al usuario final e intentar seducirlo con lo que queremos proporcionarle, que realmente creemos que es de gran utilidad y quiero pensar ya a nivel personal, que el haber ganado la beca lo confirma ni que sea solo un poco.
A seguir trabajando que queda mucho camino por recorrer.
Dicho esto no queda nada más que seguir trabajando para tener listo al 100% jobsket.com., que aunque trabajemos desde ciudades diferentes los pasos que vamos dando son firmes y con buen ritmo. Vamos a seguir trabajando en mejorar el producto ya que al fin y al cabo al que tenemos y queremos impresionar es al usuario final e intentar seducirlo con lo que queremos proporcionarle, que realmente creemos que es de gran utilidad y quiero pensar ya a nivel personal, que el haber ganado la beca lo confirma ni que sea solo un poco.
A seguir trabajando que queda mucho camino por recorrer.
Publicado por
jmonne
en
4:52
2
comentarios
Etiquetas: jobsket
sábado 22 de noviembre de 2008
Drizzle, la base de datos optimizada para cloud y web
Siempre me entero de todo tarde y con Drizzle no podía ser menos. Hace un par de semanas me enteré de que se está trabajando en la creación de una nueva base de datos llamada Drizzle. ¿Por qué crear otra base de datos si ya tenemos buenas alternativas en el mercado?, simplemente porque el tiempo pasa y se necesitan nuevas soluciones a problemas que aparecen poco a poco.
Desde ya hace unos años el uso de Internet va siendo cada vez más grande, las aplicaciones web tienen muchos más usuarios y el problema de escalar la aplicación por un crecimiento inesperado seguro que ha quitado horas de sueño a más de uno/a. Drizzle al rescate. Como indica la página principal Drizzle es... "a lightweight SQL database for Cloud and Web"
El target de Drizzle es muy claro, aplicaciones web / cloud con una concurrencia masiva con dos pilares básicos, fiabilidad y rendimiento.
De toda la información que he revisado hasta el momento, lo que más me gusta de Drizzle es la sensación de agilidad que quieren dar al proyecto, se quiere terminar con esos grandes tiempos de espera entre versiones como pasa con el propio MySQL.
Otra cosa que me ha sorprendido es que si algo sobra, se quita y fuera. ¿Quién se imagina una base de datos sin triggers, menos tipos de datos, vistas, caché de queries, entre otros?, Drizzle. Las bases de datos que conocemos hoy en día vienen con una gran cantidad de funcionalidades que seguro que ni conocemos y no llegamos a utilizar, algo que al final acaba provocando que tengamos una base de datos pesada. La gente que está creando Drizzle es muy lista y lo tiene claro, quieren crear una base de datos simple, ligera y modular, con un micro-kernel para que se extender fácilmente.
A destacar que no es un producto propio de Sun / MySQL sino que es un proyecto de la comunidad y con el beneplácito de Sun. La licencia es GPL 2 y no habrá soporte para Windows, tal cual. Soporta 32 y 64 bits pero el target objetivo son maquinas de 64.
Tengo ganas de ver como va evolucionando Drizzle, parece como si se quisiese volver a los orígenes, una base de datos ligera, intentando adaptarse a las nuevas tendencias que vivimos en la web actualmente. Para acabar, me aventuro a decir que a largo plazo -y si funciona-, el desarrollo de Drizzle puede ayudar a mejorar el del propio MySQL.
Me despido con unas palabras textuales de Bryan Acker: "If you want more feature, go use MySQL".
Desde ya hace unos años el uso de Internet va siendo cada vez más grande, las aplicaciones web tienen muchos más usuarios y el problema de escalar la aplicación por un crecimiento inesperado seguro que ha quitado horas de sueño a más de uno/a. Drizzle al rescate. Como indica la página principal Drizzle es... "a lightweight SQL database for Cloud and Web"El target de Drizzle es muy claro, aplicaciones web / cloud con una concurrencia masiva con dos pilares básicos, fiabilidad y rendimiento.
De toda la información que he revisado hasta el momento, lo que más me gusta de Drizzle es la sensación de agilidad que quieren dar al proyecto, se quiere terminar con esos grandes tiempos de espera entre versiones como pasa con el propio MySQL.
Otra cosa que me ha sorprendido es que si algo sobra, se quita y fuera. ¿Quién se imagina una base de datos sin triggers, menos tipos de datos, vistas, caché de queries, entre otros?, Drizzle. Las bases de datos que conocemos hoy en día vienen con una gran cantidad de funcionalidades que seguro que ni conocemos y no llegamos a utilizar, algo que al final acaba provocando que tengamos una base de datos pesada. La gente que está creando Drizzle es muy lista y lo tiene claro, quieren crear una base de datos simple, ligera y modular, con un micro-kernel para que se extender fácilmente.
A destacar que no es un producto propio de Sun / MySQL sino que es un proyecto de la comunidad y con el beneplácito de Sun. La licencia es GPL 2 y no habrá soporte para Windows, tal cual. Soporta 32 y 64 bits pero el target objetivo son maquinas de 64.
Tengo ganas de ver como va evolucionando Drizzle, parece como si se quisiese volver a los orígenes, una base de datos ligera, intentando adaptarse a las nuevas tendencias que vivimos en la web actualmente. Para acabar, me aventuro a decir que a largo plazo -y si funciona-, el desarrollo de Drizzle puede ayudar a mejorar el del propio MySQL.
Me despido con unas palabras textuales de Bryan Acker: "If you want more feature, go use MySQL".
Publicado por
jmonne
en
10:58
0
comentarios
Suscribirse a:
Entradas (Atom)
