
  
{"id":1823,"date":"2016-10-21T10:10:46","date_gmt":"2016-10-21T08:10:46","guid":{"rendered":"https:\/\/www.integratecnologia.es\/la-innovacion-necesaria\/?p=1823"},"modified":"2023-12-26T17:37:35","modified_gmt":"2023-12-26T16:37:35","slug":"big-data-el-poder-de-la-informacion-y-los-datos-que-nos-rodean","status":"publish","type":"post","link":"https:\/\/www.integratecnologia.es\/la-innovacion-necesaria\/big-data-el-poder-de-la-informacion-y-los-datos-que-nos-rodean\/","title":{"rendered":"Big Data: El poder de la informaci\u00f3n y los datos que nos rodean"},"content":{"rendered":"<p>Desde hace tiempo el t\u00e9rmino <strong>Big Data<\/strong>\u00a0est\u00e1 adquiriendo notoriedad y relevancia hasta convertir esta tecnolog\u00eda en uno de los paradigmas tecnol\u00f3gicos disruptivos de este siglo.<\/p>\n<p>Big Data hace referencia al <strong>almacenamiento<\/strong> de grandes cantidades de datos y a los procedimientos usados para encontrar <strong>patrones repetitivos<\/strong> dentro de esos datos.<\/p>\n<p>La primera vez que o\u00edmos este t\u00e9rmino fue en 2004 cuando dos ingenieros de Google publicaron un art\u00edculo titulado <a href=\"https:\/\/static.googleusercontent.com\/media\/research.google.com\/es\/\/archive\/mapreduce-osdi04.pdf\" target=\"_blank\" rel=\"noopener\"><strong><em>\u00abMapReduce: Simplified Data Processing on Large Clusters\u00bb.<\/em><\/strong><\/a><\/p>\n<p>En \u00e9l describ\u00edan\u00a0un modelo de programaci\u00f3n que daba respuesta a necesidades del propio Google y que permit\u00eda <strong>simplificar el procesamiento<\/strong> de grandes vol\u00famenes de datos y al que bautizaron como <em><strong>MapReduce<\/strong><\/em> (hablaremos de \u00e9l en pr\u00f3ximos posts).<\/p>\n<p>Haciendo un poco de historia el primer proceso que podr\u00edamos calificar como Big Data naci\u00f3\u00a0para hacer estad\u00edsticas y en \u00e9l\u00a0se usaban\u00a0<strong>tarjetas perforadas<\/strong> creadas por <strong>operadores.<\/strong><\/p>\n<p>Con el paso del tiempo, los usuarios empezaron a interactuar directamente con las m\u00e1quinas, ya no eran operadores. Nada era m\u00e1s importante para los departamentos IT que atender las peticiones de esos usuarios, que demandaban r\u00e1pidas respuestas en el tratamiento y uso de esos datos.\u00a0La <strong>informaci\u00f3n crec\u00eda<\/strong> de manera exponencial y cada vez era m\u00e1s <strong>accesible<\/strong> para los usuarios que demandaban gran cantidad de informes.<\/p>\n<p>Aparecieron las primeras herramientas de consulta, el usuario pod\u00eda generarse sus propios informes, se empezaron a manejar conceptos como el de <strong><em>Datawarehouse, Datamars<\/em><\/strong> o la <strong>Anal\u00edtica de negocio<\/strong>. Hab\u00eda empezado a nacer el Big Data, un\u00a0modelo que ha\u00a0venido para quedarse y con el que tendremos que familiarizarnos y saber d\u00f3nde y c\u00f3mo est\u00e1 presente.<\/p>\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_82_2 counter-hierarchy ez-toc-counter ez-toc-custom ez-toc-container-direction\">\n<div class=\"ez-toc-title-container\">\n<p class=\"ez-toc-title\" style=\"cursor:inherit\">\u00cdndice de contenidos <\/p>\n<span class=\"ez-toc-title-toggle\"><a href=\"#\" class=\"ez-toc-pull-right ez-toc-btn ez-toc-btn-xs ez-toc-btn-default ez-toc-toggle\" aria-label=\"Alternar tabla de contenidos\"><span class=\"ez-toc-js-icon-con\"><span class=\"\"><span class=\"eztoc-hide\" style=\"display:none;\">Toggle<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #3acdef;color:#3acdef\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewBox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #3acdef;color:#3acdef\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewBox=\"0 0 24 24\" version=\"1.2\" baseProfile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/span><\/a><\/span><\/div>\n<nav><ul class='ez-toc-list ez-toc-list-level-1 ' ><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/www.integratecnologia.es\/la-innovacion-necesaria\/big-data-el-poder-de-la-informacion-y-los-datos-que-nos-rodean\/#la-importancia-de-la-categorizar-los-datos\" >La importancia de la categorizar los datos<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-3'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/www.integratecnologia.es\/la-innovacion-necesaria\/big-data-el-poder-de-la-informacion-y-los-datos-que-nos-rodean\/#internet-de-las-cosas-y-big-data\" >Internet de las Cosas y Big Data<\/a><\/li><\/ul><\/nav><\/div>\n<h3><span class=\"ez-toc-section\" id=\"la-importancia-de-la-categorizar-los-datos\"><\/span>La importancia de la categorizar los datos<span class=\"ez-toc-section-end\"><\/span><\/h3>\n<p>Es muy importante clasificar los datos cuando vamos\u00a0a trabajar con grandes vol\u00famenes de informaci\u00f3n. Dos de las categor\u00edas m\u00e1s utilizadas en Big Data son las relacionadas con la <strong>estructura<\/strong> de los datos y con el <strong>origen<\/strong> de los mismos.<\/p>\n<p>En lo que a estructura se refiere, los tipos de datos suelen organizarse en dos categor\u00edas: <strong>datos no estructurados <\/strong>y<strong> datos estructurados.<\/strong><\/p>\n<p>La gesti\u00f3n de los<strong> datos no estructurados<\/strong> se ha convertido en uno de los principales retos a los que hacen frente las compa\u00f1\u00edas en lo relativo a gesti\u00f3n de la informaci\u00f3n y Big Data. Son aquellos datos <strong>no almacenados<\/strong> en una base de datos tradicional y su \u00edndice de crecimiento es muy superior al de los datos estructurados.<br \/>\nHablamos de <strong>datos estructurados<\/strong> cuando tienen bien definidas su <strong>longitud<\/strong> y su <strong>formato<\/strong>. Vienen a representar el 20% de los datos que maneja una compa\u00f1\u00eda.<\/p>\n<p>En cuanto al <strong>origen<\/strong> es muy diverso, hablamos de datos generados en redes sociales, datos procedentes del correo electr\u00f3nico, documentos tipo Word, Excel, Power Point, etc. Para su tratamiento, es necesario utilizar arquitecturas espec\u00edficas donde la <strong>escalabilidad<\/strong> es una caracter\u00edstica imprescindible debido a las necesidades crecientes de procesamiento y almacenamiento.<\/p>\n<p>No existe un \u00fanico criterio para clasificar el origen de los datos pero si podemos pensar en estos grupos:<\/p>\n<ul>\n<li><strong>Internet:<\/strong> informaci\u00f3n de clics, b\u00fasquedas en buscadores, contenido web e informaci\u00f3n de las diferentes redes sociales ( Twitter, Facebook, Linkedin,\u2026 ).<\/li>\n<li><strong>Machine to Machine (M2M):<\/strong> Comunicaci\u00f3n entre m\u00e1quinas, hablamos de datos RFID, GPS, sensores que capturan temperatura, luz, altura, presi\u00f3n, sonido, etc.<\/li>\n<li><strong>Biom\u00e9tricos<\/strong>, reconocimiento facial e informaci\u00f3n gen\u00e9tica.<\/li>\n<li>Creados por el <strong>ser humano:<\/strong> Hablamos de informes m\u00e9dicos, grabaciones, emails, etc.<\/li>\n<li><strong>Transacciones:<\/strong> registro de comunicaciones, registros de facturaci\u00f3n, operaciones bancarias, etc.<\/li>\n<\/ul>\n<h3><span class=\"ez-toc-section\" id=\"internet-de-las-cosas-y-big-data\"><\/span>Internet de las Cosas y Big Data<span class=\"ez-toc-section-end\"><\/span><\/h3>\n<p>Otro concepto muy relacionado con el Big Data es el de\u00a0<strong>Internet de las Cosas<\/strong> (<em>Internet of Things<\/em> o IoT) y que se refiere a la tecnolog\u00eda que permite que todas las cosas est\u00e9n conectadas a internet. El a\u00f1o pasado IBM ya anunci\u00f3 que la primera fuente de informaci\u00f3n para el Big Data ser\u00eda el Internet de las Cosas.<\/p>\n<p>Si unificamos las dos tecnolog\u00edas, Big Data e Internet de las Cosas, conseguimos desarrollar proyectos como el llevado a cabo por la escuder\u00eda de <strong>F\u00f3rmula 1 McLaren &#8211; Honda,<\/strong> en colaboraci\u00f3n con IBM, donde a trav\u00e9s de 160 sensores incorporados en el monoplaza se ha recogido\u00a0informaci\u00f3n, la cual se ha transmitido en tiempo real a unos servicios cloud y se ha analizado por la aplicaci\u00f3n de computaci\u00f3n cognitiva <strong>IBM Watson.<\/strong><\/p>\n<p>El uso de esta tecnolog\u00eda ha permitido al equipo tomar decisiones en tiempo real durante una carrera, basadas en informaci\u00f3n recogida y analizada a trav\u00e9s del Big Data y la computaci\u00f3n cognitiva.<br \/>\nSi los an\u00e1lisis y las estad\u00edsticas no fallan, Fernando Alonso volver\u00e1 a ser Campe\u00f3n del Mundo de F\u00f3rmula 1, as\u00ed lo predice el Big Data.<\/p>\n<p><iframe loading=\"lazy\" src=\"https:\/\/www.youtube.com\/embed\/uOJDROEZ0p8\" width=\"560\" height=\"315\" class=\"aligncenter\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\"><\/iframe><\/p>\n<p>Si quer\u00e9is saber m\u00e1s sobre Big Data e Internet de las Cosas os animo a inscribiros en alguno de los <strong>cursos<\/strong> que organizamos peri\u00f3dicamente, puedes solicitar m\u00e1s informaci\u00f3n en <a href=\"http:\/\/formacion.efor.es\/\" target=\"_blank\" rel=\"noopener\">formacion.efor.es<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Desde hace tiempo el t\u00e9rmino Big Data\u00a0est\u00e1 adquiriendo notoriedad y relevancia hasta convertir esta tecnolog\u00eda en uno de los paradigmas tecnol\u00f3gicos disruptivos de este siglo. Big Data hace referencia al almacenamiento de grandes cantidades de datos y a los procedimientos usados para encontrar patrones repetitivos dentro de esos datos. La primera vez que o\u00edmos este [&hellip;]<\/p>\n","protected":false},"author":31,"featured_media":8741,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"om_disable_all_campaigns":false,"_genesis_hide_title":false,"_genesis_hide_breadcrumbs":false,"_genesis_hide_singular_image":false,"_genesis_hide_footer_widgets":false,"_genesis_custom_body_class":"","_genesis_custom_post_class":"","_genesis_layout":"","footnotes":""},"categories":[396],"tags":[144],"class_list":{"0":"post-1823","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-iot-data-ai","8":"tag-iot","9":"entry"},"acf":[],"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/www.integratecnologia.es\/la-innovacion-necesaria\/wp-json\/wp\/v2\/posts\/1823","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.integratecnologia.es\/la-innovacion-necesaria\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.integratecnologia.es\/la-innovacion-necesaria\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.integratecnologia.es\/la-innovacion-necesaria\/wp-json\/wp\/v2\/users\/31"}],"replies":[{"embeddable":true,"href":"https:\/\/www.integratecnologia.es\/la-innovacion-necesaria\/wp-json\/wp\/v2\/comments?post=1823"}],"version-history":[{"count":0,"href":"https:\/\/www.integratecnologia.es\/la-innovacion-necesaria\/wp-json\/wp\/v2\/posts\/1823\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.integratecnologia.es\/la-innovacion-necesaria\/wp-json\/wp\/v2\/media\/8741"}],"wp:attachment":[{"href":"https:\/\/www.integratecnologia.es\/la-innovacion-necesaria\/wp-json\/wp\/v2\/media?parent=1823"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.integratecnologia.es\/la-innovacion-necesaria\/wp-json\/wp\/v2\/categories?post=1823"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.integratecnologia.es\/la-innovacion-necesaria\/wp-json\/wp\/v2\/tags?post=1823"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}