#0006 Quail data: [[100],[010],[001]]

#0006 Quail data: [[100],[010],[001]]

Sergio #1: City Roads

  • Un sitio web para renderizar todas las calles de una ciudad a la vez
  • Es una app de javascript usa Vue y TurboPass la API de OpenStreetMap
  • En python existe OSMNx que utiliza la misma API para crear ese tipo de mapas pero mucho mucho más lento jajaja
  • Codigo abierto en GitHub https://github.com/anvaka/city-roads

Rodo #2: Facebook Prophet

  • Prophet es una herramienta de pronósticos para series de tiempo. Se basa en un modelo aditivo donde las tendencias no lineales se ajustan estacionalidades.
  • Prophet es robusto ante los datos faltantes y los cambios en la tendencia, y generalmente maneja bien los valores atípicos.
  • Prophet se utiliza en muchas aplicaciones en Facebook para producir pronósticos confiables para la planificación y el establecimiento de objetivos.
  • Prophet es robusto para los valores atípicos, los datos faltantes y los cambios dramáticos en su serie temporal.
  • Y lo mejor, se encuentra disponible para R y Python, por lo que incluye una documentación muy concisa y varios ejemplos de cómo utilizar esta herramienta con ambos lenguajes.

Sergio #3: ggstatsplot

  • Un paquete de R para agregar estadísticas a tus gráficos de ggplot2
  • Muy bueno si estas creando graficos para un contexto más académico
  • Te permite agregar fórmulas y estadísticas descriptivas de tus datos (Confidence Interval, mu, etc)

Rodo #4: Mathe Carlo - Una exploración y explicación del método de Monte Carlo.

  • Este es un ensayo computacional sobre el método de Monte Carlo. La premisa del método es calcular las probabilidades dando una simulación de muchas entradas aleatorias.
  • El cuaderno interactivo se encuentra en Observable, e incluye un método de aproximación de pi, así como un método para aproximar el valor a la integral de la ecuación y=x^2, y finalmente, concluye con una explicación de por qué se llaman métodos Monte Carlo.

Sergio #5: Google Dataset search https://blog.google/products/search/discovering-millions-datasets-web/

  • ha indexado casi 25 millones de estos conjuntos de datos, lo que le brinda un solo lugar para buscar conjuntos de datos y encontrar enlaces a dónde están los datos.
  • Bajo Google research como colab https://datasetsearch.research.google.com/

Rodo #6: Textblob y SDAL - Lo prometido es deuda… ¿NLP en español? El “Spanish Dictionary of Affect in Language

  • Como mencionamos el capítulo anterior, tidytext es una herramienta que ofrece funcionalidad para análisis de polaridad sentimental, entre otras cosas… Pero funciona sólo texto en inglés.
  • Como prometimos, hoy les compartimos el paquete Textblob escrito para Python, que ofrece funcionalidades de NLP para texto. Lo interesante es que resulta ser muy sencillo de utilizar y puede ser utilizado para distintos idiomas, entre ellos, español.
  • Como complemento, les comparto el SDAL (Spanish Dictionary of Affect in Language), que incluye un listado de palabras en español con un score asociado sobre que tan positivo/negativo, etc. es cada palabra. (Saludos a Beto Barradas.)
  • El SDAL resulta ser un buen complemento a las funcionalidades de Textblob y en conjunto son buenas herramientas que vale la pena explorar.

Extras: Sergio:

Rodo: