Be Data be AI4SG.

Trabajar en ciencia de datos, o adquirir conocimientos de ciencia de los datos, no depende de un título o de una trayectoria profesional tradicional.

Una combinación de aprendizaje no tradicional con las habilidades y la experiencia adecuadas, puede llevarte a comenzar tu carrera profesional en la ciencia de los datos, o aplicarlas en tu profesión actual para crecer en ella.

A continuación compartimos contigo consejos para comenzar y las habilidades de la ciencia de datos.

En todos los campos. Les digo a los estudiantes que todos tienen que salir con este conjunto de habilidades. Vas a ser mucho más poderosos en cualquier carrera que realices.
— Eric Van Dusen, coordinador del plan de estudios para la enseñanza de la ciencia de datos en la Universidad de California (UC), Berkeley.
  • En la actualidad la ciencia de datos está llena de oportunidades.

    El de científico de datos no es el único puesto de trabajo en el que las habilidades de la ciencia de datos son valiosas.

    Los expertos creen que el aprendizaje de las habilidades de la ciencia de datos ayudará a los candidatos a añadir valor a cualquier función, dando a los solicitantes de empleo con este conjunto de habilidades una ventaja sobre la competencia, sobre todo si perteneces a un departamento de marketing, finanzas o recursos humanos.

  • No hay una "forma correcta" de seguir una carrera o educación en la ciencia de datos.

    El propio proceso te enseñará dónde están tus puntos fuertes y tus intereses.

    No tienes que saberlo todo. Los científicos de datos aprenden haciendo, así que elige un proyecto y sumérgete en él.

  • No se puede aprender ciencia de datos sin aprender programación.

    Los científicos de datos construyen algoritmos y entornos para ejecutar esos algoritmos.

    Te recomendamos para comenzar Python.

    Es fácil de usar para los principiantes, imita la sintaxis inglesa, ofrece abundantes bibliotecas y apoyo de la comunidad.

    Es un lenguaje de propósito general con suficientes complementos que permiten realizar una amplia gama de tareas de ciencia de datos, desde el análisis estadístico hasta la visualización.

  • El método de la ciencia de los datos es similar al método científico, pero con el mayor énfasis en garantizar que todos los datos utilizados sean de la máxima calidad.

    La gestión de los datos constituye la mayor parte de la ciencia de datos, ya que sin datos de calidad, la información no tiene sentido o es incorrecta.

    Sin Datos no hay Inteligencia Artificial.

    Este es el aspecto de un flujo de trabajo en la ciencia de datos:

    • Haz una pregunta y encuentra los datos.

    • Limpia los datos.

    • Analiza y explora.

    • Comunica y/o visualiza los resultados.

  • Algunos conceptos esenciales para los científicos de datos son:

    Álgebra lineal: te enseña los fundamentos de los algoritmos de la ciencia de los datos. Te facilita la comprensión del cálculo y la estadística.

    Cálculo: te enseña la teoría subyacente de los algoritmos de aprendizaje automático. El cálculo diferencial estudia la forma en que las cosas cambian con el tiempo.

    Probabilidad y Predicción: es vital para analizar los datos afectados por el azar y el cambio, es decir, la gran mayoría de los datos actuales.

    Estadística: nos desvela la estructura subyacente de los datos y les da forma para su comprensión.

    Análisis de regresión: nos proporciona una comprensión dinámica de las relaciones entre los puntos de datos.

  • Sí planeas quedarte en la analítica de datos o convertirte en un analista de datos, seguramente que no necesites profundizar en temas de inteligencia artificial.

    Temas Avanzados en Ciencia de Datos:

    • Neural networks: Construir máquinas que puedan aprender sin una intervención humana seria implica construir máquinas que se comporten como el cerebro humano. El estudio de las tres redes neuronales:

      • Redes neuronales artificiales (RNA),

      • Redes neuronales de convolución (CNN)

      • Redes neuronales recurrentes (RNN) es el estudio de poner la cognición humana en la mente de las máquinas.

    • Machine Learning: Las aplicaciones de aprendizaje automático implican la creación de algoritmos que pueden procesar datos y aprender de ellos, mejorando con el tiempo sin mucha intervención humana. Esto tiene aplicaciones en una variedad de industrias y es una especialización donde hay mucho empleo.

    • Deep Learning: Dando un paso más allá del aprendizaje automático, el aprendizaje profundo utiliza varias capas de algoritmos para acercarse a la cognición humana.

    • Procesamiento del lenguaje natural: La construcción de la cognición de las máquinas implica que éstas entiendan la comunicación humana y la capacidad de las máquinas para comunicarse con un lenguaje similar al humano.

  • Hay muchas herramientas que los científicos de datos pueden utilizar para procesar, analizar y visualizar los datos. Algunas herramientas comunes son:

    • Github: no sólo proporciona el control de versiones, sino que también puede hacer que tu nombre se conozca para futuros empleadores. Es una plataforma de colaboración y es una de las primeras cosas que debes configurar en tu viaje de ciencia de datos.

    • Jupyter notebooks: Imprescindible para trabajar y compartir proyectos de software de código abierto.

    • Python: descarga los paquetes para desbloquear toda su capacidad. Pandas, NumPy, MatPlotLib, Scikit-Learn.

    • TensorFlow: El estándar de oro para las plataformas de aprendizaje automático de código abierto.

    • Apache Spark and Hadoop: dos herramientas de big data esenciales para la computación a gran escala y las tareas de uso intensivo de datos.

    • MySQL: Un sistema de gestión de bases de datos relacionales de código abierto que funciona con SQL.

    • Stack OverFlow: Una plataforma de colaboración para proyectos de ciencia de datos.

  • Con todo este énfasis en las habilidades técnicas, es fácil olvidar las Power Digital Skills.

    Tanto si te dedicas a la investigación como si trabajas para una empresa, tendrás que confiar en tus habilidades para obtener resultados.

    Ser un Profesional de Ciencia de datos con éxito, tiene que ver tanto con las habilidades personales, como con las técnicas.

    Cualidades como la empatía, el trabajo en equipo y la capacidad de contar historias (Storyteelling basado en Datos, Periodismo de Datos) pueden diferenciarte y ayudarte mucho a crecer profesionalmente.

Sea cual sea tu campo de interés, puedo asegurar que hay datos para mejorarlo. Ser capaz de extraer información de los datos es, en realidad, una posición muy poderosa con los datos que se recogen en todos los aspectos de la sociedad, que van desde el marketing a la salud e incluso a los deportes y el entretenimiento.
— Philippe Rigollet, Profesor Asociado del Departamento de Matemáticas y del Centro de Estadística y Ciencia de Datos del MIT.

4 Especialidades en Ciencia de Datos; Elige la tuya.

Data Scientific

Data Scientist

Se encargan de entender al negocio y sus datos para agregar valor a la organización con toma de decisiones basadas en datos e incorporar datos a los productos de software.

Para ello su día a día contiene actividades como las siguientes:

  • Obtener, limpiar y procesar datos estructurados y no estructurados de distintas fuentes.

  • Diseñar y utilizar modelos de machine learning para generar predicciones sobre los datos.

  • Desarrollar herramientas para monitorear la precisión de los datos.

  • Automatizar procesos para recolectar y transformar datos que utilicen.

  • Crear reportes en tableros con visualizaciones de información valiosa.

  • Ayudar a incorporar datos a los productos de la mano con el equipo de ingeniería.

Data Analyst

Su principal misión es extraer datos recolectados y analizarlos. Para ello su día a día tiene estas actividades:

  • Colaborar con managers y otras personas de la organización para identificar necesidades de información.

  • Extraer datos de fuentes con SQL o Python.

  • Limpiar y organizar los datos para su análisis.

  • Analizar los datos para identificar patrones y tendencias que se puedan convertir en información accionable.

  • Comunicar los hallazgos en tableros con visualizaciones fáciles de entender para la toma de decisiones y generación de estrategias.

A diferencia de una Data Scientist, una Data Analyst no suele utilizar machine learning ni colabora con ingeniería para incorporar datos a los productos, sino que se enfoca en analizar el presente de la organización.

Responde los requisitos de información de colaboradores buscando datos en las bases de datos de la organización, analizándolos y reportándolos en gráficas y tablas.

Data Engineer

El rol de Data Engineer trabaja para que los demás roles en un equipo de Data Science tengan datos para analizar.

Se preocupan en crear flujos ETL (Extracción, Transformación y Carga de datos) para que analistas y científicas de datos puedan recuperar fácilmente los datos desde bases de datos especializadas para análisis.

Su día a día consiste en las siguientes actividades:

  • Desarrollar y mantener bases de datos y data pipelines de ETL que manejan gran volumen de datos brutos.

  • Extraer datos de diferentes fuentes como bases de datos estructuradas y no estructuradas, API y archivos.

  • Preparar los datos para que sean usados para análisis.

  • Almacenar los datos en data warehouse.

  • Crear automatizaciones para ejecutar periódicamente esos procesos.

Machine Learning Engineer

Funciona dentro de equipos que construyen productos fuertemente basados en inteligencia artificial como los sistemas de recomendación de YouTube o Netflix.

Para que esto sea posible, una Machine Learning Engineer tiene como tarea escalar y robustecer modelos de inteligencia artificial para funcionar en sistemas de producción de software.

Estas son las actividades que encontramos en su día a día:

  • Generar una evaluación extensiva de métricas de modelos de machine learning.

  • Diseñar y construir sistemas de machine learning.

  • Crear y ejecutar pruebas A/B de los modelos de machine learning.

  • Monitorear el desempeño y funcionalidad de los sistemas de machine learning.

  • Colaborar directamente con Data Scientists y otras áreas de ingeniería de software para asegurar la funcionalidad del producto final.

Herramientas y Micro-Certificaciones

A continuación te recomendamos para comenzar

Herramientas No-Code y Micro-Certificaciones, para que puedas ir sumando a tu CV y ser “Be Data be AI4SG