Aprenda a extraer datos web con Python y Beautiful Soup

06/11/2021

Aprenda a extraer datos web con Python y Beautiful Soup
Índice
  1. Aprenda a extraer datos web con Python y Beautiful Soup
    1. Extraer (raspar) datos de sitios web

Aprenda a extraer datos web con Python y Beautiful Soup

Extraer (raspar) datos de sitios web

Lo que aprenderás

Aprenda a extraer datos web con Python y Beautiful Soup

  • Configurar el entorno de desarrollo de Python
  • Instalar Beautiful Soup
  • Crear script de extracción de datos
  • Script de extracción de datos de prototipo
  • Extraer datos

Requisitos

  • Se requiere acceso a una ordenador y a Internet
  • El conocimiento básico de HTML sería útil pero no obligatorio

Descripción

Pitón es un lenguaje de programación de uso general que se está volviendo cada vez más popular para la ciencia de datos. Las empresas de todo el mundo están utilizando Python para recopilar información de sus datos y obtener una ventaja competitiva.
En este curso, Extracción de datos de HTML con BeautifulSoup *, obtendrá la capacidad de crear soluciones de raspado web sólidas y fáciles de mantener utilizando la biblioteca Beautiful Soup en Python.

Sopa hermosa es un puro Pitón biblioteca para extrayendo estructurado datos desde un sitio web. Te permite analizar datos desde archivos HTML y XML. Actúa como un módulo auxiliar e interactúa con HTML de una manera similar y mejor en cuanto a cómo interactuaría con una página web utilizando otra herramienta de desarrollo disponible.

Aprenda a extraer datos web con Python y Beautiful Soup

En un momento en el que Internet es rico en tantos datos, y aparentemente, los datos se han convertido en el nuevo aceite, el web scraping se ha vuelto aún más importante y práctico de usar en varias aplicaciones. El raspado web se ocupa de extraer o raspar la información del sitio web. El web scraping también se conoce como recolección web o extracción de datos web. Copiar texto de un sitio web y pegarlo en su sistema local también es raspado web. Sin embargo, es una tarea manual. Generalmente, el web scraping se ocupa de extraer datos automáticamente con la ayuda de rastreadores web. Los rastreadores web son scripts que se conectan a la red mundial mediante el protocolo HTTP y le permiten obtener datos de forma automatizada.

LEER
Uso del aprendizaje automático en React Native, la guía práctica

Ya sea que sea un científico de datos, un ingeniero o cualquiera que analice grandes cantidades de conjuntos de datos, la capacidad de extraer datos de la web es una habilidad útil. Supongamos que encuentra datos en la web y no hay una forma directa de descargarlos, el raspado web con Python es una habilidad que puede usar para extraer los datos en un formulario útil que luego se puede importar y usar de varias maneras.

Más Información

Subir

Este sitio web utiliza cookies para ofrecerle una mejor experiencia de navegación, si continua en navegando consideramos que acepta su uso.