Taller de extracción de datos web (Web Scraping) con Python Scrapy y Beautiful Soup

La extracción de datos web (Web Scraping) es una técnica de computación para extraer información de paginas web. Esta puede ser realizada desde un protocolo Http o directamente de un navegador. El Web Scraping se enfoca en la transformación de datos no estructurados en formato HTML en datos estructurados o categorizados que pueden ser utilizados para un registro o un análisis.

El Web Scraping requiere capacidades para el procesamiento de datos, la comprensión de la semántica pudiendo llegar a la inteligencia artificial. En esta conferencia mostraremos dos herramientas populares para el Web Scraping en Python como es Scrapy y Beautiful Soup.

Ya no hay vacantes

Contenido:

Esta conferencia cubre los siguientes temas:

  • Instalación de Scrapy y Beautiful Soup
  • Configuración de un crawler en Scrapy
  • Configuración de un crawler en Beautiful Soup
  • Comparación entre Scrapy y Beautiful Soup 
  • Manejo de excepciones 
  • Opciones de Python relacionados al Web Scraping

 

Contenido:

Saul Montoya M.Sc.

El Sr. Montoya está relacionado con lenguajes de programación para recursos hídricos, siendo su especialidad Python y sus librerías.

Él ha realizado algoritmos para la parametrización de cuencas como insumo de modelos distribuidos, para el análisis de patrones de precipitación regional sobre largos periodos de tiempo, para la calibración de modelos hidrogeoquímicos, para la regresión no lineal de propiedades hidráulicas, entre otros.

Actualmente el Sr. Montoya trabaja en el desarrollo de códigos para la automatización del análisis espacial y la generación de planos.

 

Lugar y Fecha

Miercoles 20 de Julio del 2016 a las 7 p.m.

Av. Caminos del Inca 288 dpto 302, Surco, Lima

 

Requisitos

Se requiere que tengan una computadora con sistema operativo Linux o una Mac

 

Inscripción

Este taller es gratis, no tiene costo. 

Ya no hay vacantes

Existen certificados electrónicos con un costo de 40 soles para profesionales y 25 soles para estudiantes.

Antes de inscribirse, les pedimos estar seguros de su participación ya que su ausencia le quitaría una vacante a otra persona. Puede cancelar su participación mandado un email gestiondelagua@gidahatari.com.

Para inscribirse por favor rellene sus datos en este formulario:

Nombre *
Nombre