Desafíos estadísticos en la evaluación y el fomento de la reproducibilidad de los resultados científicos

Statistical Challenges in Assessing and Fostering the Reproducibility of Scientific Results: Summary of a Workshop | The National Academies Press

Statistical Challenges in Assessing and Fostering the Reproducibility of Scientific Results: Summary of a Workshop.  [e-Book] (2016) Washington, DC, The National Academies Press. National Academies of Sciences, 2016

DESCARGAR PDF

Las preguntas sobre la reproducibilidad de la investigación científica se han planteado en numerosos contextos y han ganado visibilidad a través de varias revistas de alto perfil y artículos de prensa populares. Se han considerado cuestiones cuantitativas que contribuyen a los desafíos de la reproducibilidad (como la medición y el análisis inadecuados de los datos, los conocimientos estadísticos inadecuados y los datos incompletos, entre otros), pero no existe un consenso claro sobre la mejor manera de abordar o reducir al mínimo estos problemas.

Desarrollo de flujos de trabajo para científicos de datos

development-workflows-1

Development Workflows for Data Scientists. O’Reilly Media, 2017

Texto completo

GitHub se asoció con O’Reilly Media para examinar cómo los equipos de análisis de datos de varias organizaciones están mejorando la forma en que definen, aplican y automatizan los flujos de trabajo basados en servicios de datos.

  • Definición de la estructura y las funciones del equipo
  • Preguntas interesantes
  • Examen de trabajos previos
  • Recolección, exploración y modelado de datos
  • Prueba, documentación e implementación de códigosde producción
  • Comunicación de los resultados

Este informe esclarecedor muestra cómo, a pesar de que el ritmo de cambio es rápido y el deseo por el conocimiento y la visión de los datos es cada vez mayor, las disciplinas duales de ingeniería de software y la ciencia de los datos están a la altura de la tarea.

The field of data science has taken all industries by storm. Data scientist positions are consistently in the top-ranked best job listings, and new job opportunities with titles like data engineer and data analyst are opening faster than they can be filled. The explosion of data collection and subsequent backlog of big data projects in every industry has lead to the situation in which «we’re drowning in data and starved for insight.”