Ana Peña

Ana Peña

Tech Talk

El otro día, me di cuenta de que en muchas de mis columnas hablo sobre datos y su relevancia, pero me parece que nunca me tomé el tiempo de explicar qué son o qué tipo de datos existen, mostrar ejemplos de datos y contar por qué son parte esencial de nuestra vida. Los utilizamos en cada aspecto, desde la computación hasta la estadística, e incluso para ir al súper. Todo lo que hacemos puede medirse en datos y es por ello que cada día encontramos nuevas maneras de cuantificarlos, medirlos, almacenarlos y procesarlos.

En las definiciones más básicas sobre qué es un dato, se describe como una representación simbólica de un atributo cuantitativo o cualitativo. Personalmente también me encanta el origen de su palabra. Viene del latín datum, que significa “lo que se da”, y se refiere a un documento, información o testimonio que permite llegar al conocimiento de algo o deducir las consecuencias legítimas de un hecho. En resumen, datos son la expresión mínima de contenido respecto a un tema.

Procesar los datos

Lo que debes tener en consideración sobre un dato es que no tiene sentido de manera aislada; por sí solo no nos puede indicar nada, sin embargo, al tener un conjunto de ellos, se transforma en información. Y ésta a su vez, nos ayuda a cuantificar y a tomar mejores decisiones. En resumen, procesar los datos es acumularlos y estudiarlos para producir información significativa.

Pero procesar los datos no sucede de la nada, existen varios pasos para que esto suceda:

  • Validación: asegurar que los datos suministrados son limpios, correctos y útiles
  • Clasificación: ordena los elementos en conjuntos o secuencias
  • Análisis: el estudio de estos conjuntos de datos
  • Información: el resultado o conclusión que resulta del análisis de datos

¿Y por qué son equiparables con el petróleo?

Los datos hoy en día compiten con los hidrocarburos como el mayor punto de inflación económica del mundo empresarial. Son un activo valioso que aún no se explota por completo. Al igual que el petróleo, quienes vean el valor de los datos pueden aprender a extraerlos y utilizarlos. Es un recurso que se multiplica minuto a minuto. De hecho, se estima que para el 2025, el mundo generará​ 175 zettabytes​ de datos. Es decir, 1 zettabyte son 1,000,000,000,000,000,000,000 bytes, o, dicho de otra manera, si grabáramos una película HD en la mayor resolución posible y nos ocupara 1 ZB, la película duraría al menos 36 millones de años.

Vivimos en la era de la economía digital donde los datos se han vuelto mucho más valiosos que antes sobre todo con las tecnologías emergentes, como machine learning. Podemos decir que hoy, los datos son la clave para la toma de mejores decisiones y una pieza fundamental para el mejor funcionamiento de prácticamente todo lo que nos rodea. Sin ellos, el mundo como lo conocemos sería muy diferente. Es decir, los datos han mejorado la vida de cada ser humano en la tierra. 

¿Y a quién le interesan mis datos?

Es probable que en las noticias hayas escuchado recientemente que se filtraron los datos de varios usuarios de Facebook (otra vez), o incluso te suene el escándalo de Cambridge Analytica donde supuestamente se utilizaron datos de los usuarios de esta red social para manipular la intención de voto en 2016, donde Donald Trump resultó electo presidente.

¿Pero de dónde salieron los datos? Seguramente te habrás encontrado con jueguitos o tests en esta red social que te pide permiso para acceder a tu información personal, sin embargo, lo que sucedió con Cambridge Analytica es que también se accedió a la información personal de terceros, obvio sin su consentimiento. 

Ahora, recordemos que lo que nos interesa es saber cómo utilizar los datos de mejor manera, pues bien, lo que sucedió en este caso, es que esta información fue utilizada para inferir los perfiles psicológicos de los usuarios “indecisos” para así ponerlos a favor del candidato Donald Trump. Esto lo lograron mediante la generación de contenido personalizado, así como la divulgación de noticias falsas, que se reprodujeron de forma viral en las redes sociales.

Inteligencia artificial y machine learning

Machine Learning (ML por sus siglas en inglés), es una rama de la inteligencia artificial, cuyo objetivo es desarrollar técnicas que permitan que las computadoras aprendan por sí mismas. Lo que hace esta rama es reconocer patrones para automatizar partes del método científico.

Actualmente tiene muchas aplicaciones

  • Motores de búsqueda como Google, Explorer, Bing, Ecosfera, Duck Duck Go, o el que sea de tu preferencia
  • Detección de fraude en el uso de tarjetas de crédito
  • Clasificación de secuencias de ADN
  • Predicciones en el mercado de valores
  • Predicciones de texto
  • Detección temprana de enfermedades

¿Por qué te cuento todo esto? Pues bien, como mencioné anteriormente, todas las acciones que realizamos generan datos. El volumen de datos que hay en el mundo es enorme y unos de los mayores retos es aprender a procesar estas cantidades y saber interpretarlas en un tiempo razonable ya que los datos cambian rápidamente y eso hace que tengan una validez muy corta. Es por ello por lo que necesitamos un poder de procesamiento muy alto, si no lo hacemos, podemos llegar a conclusiones erróneas, que pueden llevar a cometer errores en la toma de decisiones. 

En un mundo donde todo cada vez más se parece a una computadora, la calidad y análisis de datos es la clave. No sólo para obtener ventajas competitivas, sino para impedir que cometamos errores estratégicos y operacionales basándonos en datos erróneos.

Si quieres platicar más sobre este tema, no dudes en contactarme en anapena.techtalk@gmail.com 

Las opiniones publicadas en esta columna son responsabilidad del autor y no representan ninguna posición por parte de Business Insider México.

Descubre más historias en Business Insider México

Síguenos en Facebook , Instagram y Twitter

Consulta a más columnistas en nuestra sección de Opinión