Ana Pe√Īa

Ana Pe√Īa

Tech Talk

El otro d√≠a, me di cuenta de que en muchas de mis columnas hablo sobre datos y su relevancia, pero me parece que nunca me tom√© el tiempo de explicar qu√© son o qu√© tipo de datos existen, mostrar ejemplos de datos y contar por qu√© son parte esencial de nuestra vida. Los utilizamos en cada aspecto, desde la computaci√≥n hasta la estad√≠stica, e incluso para ir al s√ļper. Todo lo que hacemos puede medirse en datos y es por ello que cada d√≠a encontramos nuevas maneras de cuantificarlos, medirlos, almacenarlos y procesarlos.

En las definiciones m√°s b√°sicas sobre qu√© es un dato, se describe como una representaci√≥n simb√≥lica de un atributo cuantitativo o cualitativo. Personalmente tambi√©n me encanta el origen de su palabra. Viene del lat√≠n datum, que significa ‚Äúlo que se da‚ÄĚ, y se refiere a un documento, informaci√≥n o testimonio que permite llegar al conocimiento de algo o deducir las consecuencias leg√≠timas de un hecho. En resumen, datos son la expresi√≥n m√≠nima de contenido respecto a un tema.

Procesar los datos

Lo que debes tener en consideración sobre un dato es que no tiene sentido de manera aislada; por sí solo no nos puede indicar nada, sin embargo, al tener un conjunto de ellos, se transforma en información. Y ésta a su vez, nos ayuda a cuantificar y a tomar mejores decisiones. En resumen, procesar los datos es acumularlos y estudiarlos para producir información significativa.

Pero procesar los datos no sucede de la nada, existen varios pasos para que esto suceda:

  • Validaci√≥n: asegurar que los datos suministrados son limpios, correctos y √ļtiles
  • Clasificaci√≥n: ordena los elementos en conjuntos o secuencias
  • An√°lisis: el estudio de estos conjuntos de datos
  • Informaci√≥n: el resultado o conclusi√≥n que resulta del an√°lisis de datos

¬ŅY por qu√© son equiparables con el petr√≥leo?

Los datos hoy en d√≠a compiten con los hidrocarburos como el mayor punto de inflaci√≥n econ√≥mica del mundo empresarial. Son un activo valioso que a√ļn no se explota por completo. Al igual que el petr√≥leo, quienes vean el valor de los datos pueden aprender a extraerlos y utilizarlos. Es un recurso que se multiplica minuto a minuto. De hecho, se estima que para el 2025, el mundo generar√°‚Äč 175 zettabytes‚Äč de datos. Es decir, 1 zettabyte son 1,000,000,000,000,000,000,000 bytes, o, dicho de otra manera, si grab√°ramos una pel√≠cula HD en la mayor resoluci√≥n posible y nos ocupara 1 ZB, la pel√≠cula durar√≠a al menos 36 millones de a√Īos.

Vivimos en la era de la econom√≠a digital donde los datos se han vuelto mucho m√°s valiosos que antes sobre todo con las tecnolog√≠as emergentes, como machine learning. Podemos decir que hoy, los datos son la clave para la toma de mejores decisiones y una pieza fundamental para el mejor funcionamiento de pr√°cticamente todo lo que nos rodea. Sin ellos, el mundo como lo conocemos ser√≠a muy diferente. Es decir, los datos han mejorado la vida de cada ser humano en la tierra. 

¬ŅY a qui√©n le interesan mis datos?

Es probable que en las noticias hayas escuchado recientemente que se filtraron los datos de varios usuarios de Facebook (otra vez), o incluso te suene el escándalo de Cambridge Analytica donde supuestamente se utilizaron datos de los usuarios de esta red social para manipular la intención de voto en 2016, donde Donald Trump resultó electo presidente.

¬ŅPero de d√≥nde salieron los datos? Seguramente te habr√°s encontrado con jueguitos o tests en esta red social que te pide permiso para acceder a tu informaci√≥n personal, sin embargo, lo que sucedi√≥ con Cambridge Analytica es que tambi√©n se accedi√≥ a la informaci√≥n personal de terceros, obvio sin su consentimiento. 

Ahora, recordemos que lo que nos interesa es saber c√≥mo utilizar los datos de mejor manera, pues bien, lo que sucedi√≥ en este caso, es que esta informaci√≥n fue utilizada para inferir los perfiles psicol√≥gicos de los usuarios ‚Äúindecisos‚ÄĚ para as√≠ ponerlos a favor del candidato Donald Trump. Esto lo lograron mediante la generaci√≥n de contenido personalizado, as√≠ como la divulgaci√≥n de noticias falsas, que se reprodujeron de forma viral en las redes sociales.

Inteligencia artificial y machine learning

Machine Learning (ML por sus siglas en inglés), es una rama de la inteligencia artificial, cuyo objetivo es desarrollar técnicas que permitan que las computadoras aprendan por sí mismas. Lo que hace esta rama es reconocer patrones para automatizar partes del método científico.

Actualmente tiene muchas aplicaciones

  • Motores de b√ļsqueda como Google, Explorer, Bing, Ecosfera, Duck Duck Go, o el que sea de tu preferencia
  • Detecci√≥n de fraude en el uso de tarjetas de cr√©dito
  • Clasificaci√≥n de secuencias de ADN
  • Predicciones en el mercado de valores
  • Predicciones de texto
  • Detecci√≥n temprana de enfermedades

¬ŅPor qu√© te cuento todo esto? Pues bien, como mencion√© anteriormente, todas las acciones que realizamos generan datos. El volumen de datos que hay en el mundo es enorme y unos de los mayores retos es aprender a procesar estas cantidades y saber interpretarlas en un tiempo razonable ya que los datos cambian r√°pidamente y eso hace que tengan una validez muy corta. Es por ello por lo que necesitamos un poder de procesamiento muy alto, si no lo hacemos, podemos llegar a conclusiones err√≥neas, que pueden llevar a cometer errores en la toma de decisiones. 

En un mundo donde todo cada vez más se parece a una computadora, la calidad y análisis de datos es la clave. No sólo para obtener ventajas competitivas, sino para impedir que cometamos errores estratégicos y operacionales basándonos en datos erróneos.

Si quieres platicar más sobre este tema, no dudes en contactarme en anapena.techtalk@gmail.com 

Las opiniones publicadas en esta columna son responsabilidad del autor y no representan ninguna posición por parte de Business Insider México.

Descubre m√°s historias en Business Insider M√©xico

S√≠guenos en Facebook , Instagram y Twitter

Consulta a m√°s columnistas en nuestra secci√≥n de Opini√≥n