Cómo es el trabajo de un ingeniero de Big Data

ingeniero de big data

Para transportar grupos reducidos de personas a través de distancias cortas y sin mucho apuro podrías arreglártelas conduciendo un autobús. Pero si necesitas transportar a muchas personas, a través de grandes distancias y en tiempos mínimos, deberás aprender a pilotear un avión. De seguro te será más difícil, tendrás más responsabilidades, pero te dará más satisfacciones y ganarás mucho más dinero. Esa misma diferencia es la que existe entre el trabajo de un ingeniero de datos convencional y el de un ingeniero de Big Data.

Big Data se refiere, como podrás imaginarlo, a conjuntos de datos muy grandes. La definición exacta de “muy grandes” puede variar según a quién le preguntes, pero es común que los repositorios de Big Data superen holgadamente los 10 terabytes de datos. Y es cada vez más habitual escuchar hablar de volúmenes que alcanzan el orden de los petabytes (1 petabyte = 1,024 terabytes).

Pero no se trata sólo de alto volumen. Otros atributos de Big Data incluyen amplia variedad de datos (estructurados, semiestructurados y desestructurados) y altas velocidades de procesamiento y acceso. Comúnmente se hace referencia a estas cualidades como “las tres V”: Volumen, Velocidad y Variedad. 

ingeniería de big data
Big Data no se trata sólo de gigantescos volúmenes de información. Otros de sus atributos incluyen amplia variedad de datos (estructurados, semiestructurados y desestructurados) y altas velocidades de procesamiento y acceso. Imagen: NightCafe.

A las tres «V» mencionadas arriba se les suelen agregar otras dos, para abarcar otros importantes aspectos que debe tener toda solución de Big Data: Veracidad, o confiabilidad de los datos (para evitar información incompleta, sucia o imprecisa) y Valor, refiriéndose a la importancia de extraer descubrimientos valiosos que posibiliten decisiones informadas y generen valor de negocio.

Esas particularidades hacen que un ingeniero de Big Data deba utilizar frameworks especiales, además de las herramientas que usa un ingeniero de datos convencional. Más adelante en este artículo veremos en detalle las tecnologías que debe dominar todo ingeniero de Big Data.

Leer más

Cómo es el trabajo de un científico de datos

El trabajo de los científicos de datos

Los científicos de datos están entre los perfiles más buscados actualmente en el mercado laboral informático.

¿Por qué las empresas tienen tanto interés en los científicos de datos?

Por que necesitan extraer verdades y descubrir conocimientos críticos de negocios a partir de enormes cantidades de datos. Además necesitan hacerlo a gran velocidad, para ganarles a sus competidores. El científico de datos es quien sabe cómo lidiar con esas grandes cantidades de información y cómo extraer de ella lo que las empresas necesitan.

Habilidades que se buscan en un científico de datos
Habilidades que se buscan en un científico de datos.

Un buen científico de datos debe reunir conocimientos de informática, modelado/análisis de datos, estadísticas, matemáticas y machine learning, además de contar con un sentido empresarial sólido. Con este arsenal de habilidades, el científico de datos puede encontrar respuestas a las grandes preguntas que ayudan las organizaciones a tomar mejores decisiones.

¿Cuál es la aplicación práctica de las ciencias de datos?

Hoy en día, las ciencias de datos se aplican con finalidades muy dispares. Puede ser ayudar en la búsqueda de nuevos tratamientos para la diabetes, o identificar e interceptar amenazas de seguridad. El análisis exhaustivo de grandes cantidades de datos puede facilitar notablemente dichas tareas. Es por eso que tanto empresas como agencias gubernamentales buscan constantemente contratar profesionales de las ciencias de datos, puesto que son ellos quienes tienen las llaves para develar conocimientos ocultos en océanos de Big Data.

Leer más