Interesante curso de introducción a la ciencia de datos ( Data Science)

Interesante curso de introducción a la ciencia de datos ( Data Science)

A lo largo de los últimos años, fruto de la rapidísima evolución tecnológica, la capacidad de procesar datos para poder extraer información y conocimiento, se ha desarrollado de una forma sin precedentes, gracias a parte a todo un universo de herramientas opensource/gratuitas que han permitido democratizar todo el proceso de data science hasta unos limites insospechados hace unos años a atrás.

Durante mucho tiempo, este tipo de tratamiento estaba reservado a aplicaciones de negocio, bastante caras y bastante complejas, que acotaban las posibilidades de trabajar con los datos a un numero muy reducido personas, y que generalmente trabajan para consultoras o para proveedores de soluciones de negocio. Con el pasar del tiempo, y con el aumento de las capacidades de sistemas personales, de nuevas tecnologías y nuevas formas de procesar, todo es cambio hasta al punto en que utilizando una herramienta como Excel, se puede hacer toda una primera análisis de los datos. Esta primera análisis nos permitirá entender mejor los datos disponibles, como se estructuran dentro del modelo de negocio que modelan, y de algunas forma, empezar a hacernos una primera conjunto de preguntas para las cuales queremos obtener respuestas lo mas objetivas posibles.

Esta primera exploración, nos permitirá de alguna forma tener una primera visión mas cercana de las posibilidades de analisis que tenemos, y de plantear un poco el alcance de lo que podemos aspirar a conseguir, o de si disponemos de los datos correctos disponibles para conseguir los objetivos planteados. Si la respuesta es negativa, entonces habrá de alguna forma buscar generar nuevos datos o buscar nuevas referencias de de datos que nos permitan conseguir nuestro objetivo de analisis. Un buen ejemplo de esto, son los llamados OpenData, que son registros de datos generados por terceros, que los disponibilizan de forma gratuita, o a cambio de algún cambio de referencias, para de esta forma poder avanzar los mas posible en el análisis. No es algo exclusivamente de los bajos o inexistentes presupuestos, dado que muchas grandes integradoras de soluciones de big data y data science los utilizan muchas veces para arropar una resultados menores que las expectativas conseguidas.

Pero como lo podemos hacer con Excel, o que es necesario para ser un datascientist, o durante cuanto tiempo es necesario estudiar para conseguir los propósitos de transformarse en un cientista de los datos a prueba de bala?

Una primera aproximación puede ser realizada a través de cursos como los que pongo a continuación de Microsoft Excel, que permitirá poder contar una formación amplia sobre como el emprender el primer paso de una formación compleja pero con inmensas oportunidades de negocio.

El curso está estructurado con diversos bloques que van introduciendo con ejemplos, los diversos pasos a realizar y las diversas precauciones que hay que tener en cuenta a los hora de juntar los datos, seleccionar/ordenar las herramientas, o en el peor de los casos entender la imposibilidad de conseguir alcanzar unos objetivos predefinidos.