La extracción de datos web (Web Scraping) es una técnica de computación para extraer información de paginas web. Esta puede ser realizada desde un protocolo Http o directamente de un navegador. El Web Scraping se enfoca en la transformación de datos no estructurados en formato HTML en datos estructurados o categorizados que pueden ser utilizados para un registro o un análisis.
El Web Scraping requiere capacidades para el procesamiento de datos, la comprensión de la semántica pudiendo llegar a la inteligencia artificial. En esta conferencia mostraremos dos herramientas populares para el Web Scraping en Python como es Scrapy y Beautiful Soup.
Ya no hay vacantes
Contenido:
Esta conferencia cubre los siguientes temas:
- Instalación de Scrapy y Beautiful Soup
- Configuración de un crawler en Scrapy
- Configuración de un crawler en Beautiful Soup
- Comparación entre Scrapy y Beautiful Soup
- Manejo de excepciones
- Opciones de Python relacionados al Web Scraping
Contenido:
Saul Montoya M.Sc.
El Sr. Montoya está relacionado con lenguajes de programación para recursos hídricos, siendo su especialidad Python y sus librerías.
Él ha realizado algoritmos para la parametrización de cuencas como insumo de modelos distribuidos, para el análisis de patrones de precipitación regional sobre largos periodos de tiempo, para la calibración de modelos hidrogeoquímicos, para la regresión no lineal de propiedades hidráulicas, entre otros.
Actualmente el Sr. Montoya trabaja en el desarrollo de códigos para la automatización del análisis espacial y la generación de planos.
Lugar y Fecha
Miercoles 20 de Julio del 2016 a las 7 p.m.
Av. Caminos del Inca 288 dpto 302, Surco, Lima
Requisitos
Se requiere que tengan una computadora con sistema operativo Linux o una Mac
Inscripción
Este taller es gratis, no tiene costo.
Ya no hay vacantes
Existen certificados electrónicos con un costo de 40 soles para profesionales y 25 soles para estudiantes.
Antes de inscribirse, les pedimos estar seguros de su participación ya que su ausencia le quitaría una vacante a otra persona. Puede cancelar su participación mandado un email gestiondelagua@gidahatari.com.
Para inscribirse por favor rellene sus datos en este formulario: