#0003 Quail data: El Reinicio

#0003 Quail data: El Reinicio

Quail Data 0003 - El Reinicio

Sergio #1: streamlit.io - Aplicaciones web para tus proyectos de ciencia de datos (Python)

  • Un framework para crear aplicaciones web en python especificamente disenado para Aprendizaje de Maquina y Ciencia de Datos. Es super facil de utilizar, yo lo use para un proyecto en la oficina donde tenia que analizar, visualizar un dataset muy grande y hasta entrenaba un decision tree en la misma app. Tiene capacidades de “cache” entonces es super rapida.
  • Puedes usar la CLI para ejecutar github Gists desde tu compu, eso esta super padre
  • Tienen discuss.streamlit.io - apenas van empezando entonces esta cambiando rapidamente pero son muy activos los developers ahi.
  • Puedes usar f-strings con Markdown 😱

Rodo #2: ¿Qué es scikit learn? — Una guía para principiantes sobre el paquete popular de Python en Machine Learning https://dev.to/duomly/what-is-scikit-learn-a-beginner-guide-to-popular-machine-learning-python-library-1f06

  • En dev.to, a través del usuario duomly, podemos encontrar un excelente post que además funciona como tutorial porque nos explica un poco sobre la estructura y funcionamiento de scikit-learn.
  • Scikit-learn es uno de los paquetes de Python más utilizados para la ciencia de datos y el aprendizaje automático. Además de permitirnos realizar muchas operaciones y proporcionarnos una gran variedad de algoritmos, scikit-learn cuenta con una excelente documentación.
  • Entre otras cosas, scikit-learn soporta: preprocesamiento de datos, reducción de dimensionalidad, selección de modelos, regresión, clasificación, análisis de clustering.
  • En particular, en este post podemos encontrar un breve ejemplo con código para cada uno de estos tópicos ya mencionados.
  • Échale un ojo si tienes interés en comenzar en este mundo o si quieres conocer más a fondo sobre scikit-learn.

Sergio #3: geojson.io - Crea shapefiles, geojsons y archivos geográficos en tu navegador

  • Esta herramienta la descubri cuando estaba trabajando con Datawrapper (la pagina web para crear visualizaciones de datos). Te permite editar shapefiles, geojsons etc etc y lo mas chido es que puedes crear geojson/shapefiles ahi!
  • Literal tienes un mapa del mundo y le pones ok quiero un poligono de aqui a aqui a aqui a aqui. Un punto aqui. Una linea aqui. Es como paint pero para crear archivos geograficos.
  • GRATIS.

Rodo #4: labelme – Anotación poligonal de imágenes con Python (polygon, rectangle, circle, line, point and image-level flag annotation). https://github.com/wkentaro/labelme

  • Si has trabajado en problemas de segmentación, seguro te habrás tomado tu tiempo para escoger tu herramienta de anotación, con esto en mente es que queremos compartirte labelme.
  • Labelme es una herramienta de anotación gráfica de imágenes inspirada en http://labelme.csail.mit.edu. Está escrito en Python y usa Qt para su interfaz gráfica.
  • Features:
    • Anotación de imagen para polígono, rectángulo, círculo, línea y punto.
    • Anotación de video.
    • Personalización de la GUI (etiquetas / “flags” predefinidas, guardado automático, validación de etiquetas, etc.).
    • Exportación de dataset en formato VOC para segmentación semántica / instancia.
    • Exportación de dataset en formato COCO, por ejemplo, segmentación.
    • Funciona en Ubuntu / macOS / Windows con Python2 / Python3 haciendo uso de PyQt4 / PyQt5

Sergio #5: aidungeon.io - Un juego basado en texto como dungeons and dragons producido por inteligencia artificial en un Google colab (Python)

  • “Imagina un mundo infinitamente generado que podrías explorar infinitamente, encontrando continuamente contenido y aventuras completamente nuevas. ¿Qué pasaría si también pudieras elegir cualquier acción en la que puedas pensar en lugar de estar limitado por la imaginación de los desarrolladores que crearon el juego?”
  • UN JUEGO INFINITO! Creado con la plataforma OpenAI (usa python oh yeah). Puedes jugarlo en tu navegador en un notebook de google colab o descargar la app.
  • Es un juego de texto de aventuras como Dungeons and Dragons me imagino (no he jugado D&D) pero literalmente, infinito. Este es el tipo de cosas que te inspiran porque esta increible el concepto aunque sea solo un juego jajaj.

Rodo #6: 24 Métricas de evaluación para la clasificación binaria (y cuándo usarlas) https://neptune.ml/blog/evaluation-metrics-binary-classification

  • ¿No estás segura o seguro de qué métrica de evaluación debes elegir para su problema de clasificación binaria? Pues bien, seguro habrás escuchado de Neptune.ML, el hub de colaboración online para ciencia de datos.
  • Y es que hace poco compartieron un post en su blog sobre 24 métricas de evaluación para la clasificación binaria (y cuándo usarlas).
  • En este post nos comparten un conjunto de métricas y gráficos de evaluación comunes e incluso menos conocidos para comprender cómo elegir la métrica de rendimiento del modelo para tu problema. En particular, para cada métrica explican:
  • ¿Cuál es la definición y la intuición detrás de esto?
  • La explicación no técnica que puede comunicar a las partes interesadas del negocio,
  • Cómo se calcula o traza,
  • ¿Cuándo deberías usarlo?

Extras: Rodo:

  • ¡Se acerca la PyCon en Colombia!
  • https://github.com/joelibaceta/pix-to-xls – Una herramienta simple para hacer arte ascii a partir de una imagen usando celdas de color Excel.
  • Un pequeño spoiler sobre un evento que habrá en Mérida: Datostada. :D

Sergio:

  • tacosdedatos el podcast regresa en enero.
  • datawrapper.readthedocs.io (hice un wrapper para Datawrapper) wrapper-ception
  • ando trabajando en unos mini cursos (micromódulos) para aprender Python y R para el análisis de datos - el plan es que salgan en enero. más info más tarde. https://tacosdedatos.academy/