Analís de caso: replega, almazenamiento, estruturazión y emplego de datos masibos (big data) de conzentrazión de CO2 en un puesto trancato.

This post is also available in: Spanish

Iste ye un d´os analís de caso proposaus ta o mio proyeuto de M.B.A., encara en prozeso de rebision.

Os antezedens  á iste analís -aintro de a resta de o proyeuto- en son:

  • un estudeo de a chestión de a conoxedura, con espezial orientazión á lo suyo planteyamiento teunoloxico y, como esisten bellas dembas en as organizazions que en presentan zierto despenche teunoloxico, entre as que se’n troba o desembolique sostenible;
  • un analís de o desembolique sostenible de as organizazions, prebando de trobar un binclo entre os suyos aspeutos e indicadors sozials, meyoambientals y economicos con as teunoloxías de a conoxedura; un binclo que risuelba a suya situazión de despenche teunoloxico y, en consecuenzia, o escaso balor adubito alportato á la organizazión en traza de conoxedura.

Sobre os menzionatos alazets, iste analís de caso pretende confirmar iste binclo y comprebar que o desembolique sostenible puede fer alportazions baliosas á os prozesos de conoxedura establexitos en las organizazions.

Analís de caso 1: replega, almazenamiento, estruturazión y emplego de datos masibos (big data) de conzentrazión de CO2 en un puesto trancato

O diósido de carbono (CO2) ye un gas presén en l’atmosfera de traza natural en una conzentrazión de, alto u baxo 300 a 400 ppm (Scripps Institute of Oceanography, 2016). Antimás d’estar o gas d’efeuto imbernadero referén como mida de o cambeo climatico global, ye un de os gases á os que más atenzión se lis presta dende o punto d’ambista de a seguranza y salú laboral por o suyo impauto en a salú umana:
  • en conzentrazions de 350 á 1000 ppm en un puesto trancato, a calidá de l’aire se considera azeutable;
  • en conzentrazions de 1000 á 2000 ppm, a calidá de l’aire se considera baxa:
  • conzentrazions de 2000 ppm á 5000 ppm, empezipian a causar problemas (dolor de tozuelo, insonnio, ansias). Ye aire embiziauto;
  • conzentrazions á partir de 5000 ppm, cambean a presenzia d’atros gases presens en l’aire, fendo-se un atmosfera tosica u defizién en osigen de consecuenzias fatals seguntes puya a conzentrazión.

Por ista dople demba meyoambiental (global) y de salú laboral (y presonal) y por o importán impauto de a suya conzentrazión, o diosido de carbono risulta un adecuato elemén ta un analís de caso.

A estazión meteoroloxica NetAtmo ye un sistema eleutronico de consumo, alazetau en o conzeuto de big data, que costa de barios sensors capables de medir (NetAtmo, 2016):

  • temperatura ambién en un rango de -40 á 65°C, con una marguin d’error de +/- 0.3°C;
  • umedá de 0 á 100% con una marguin d’error de +/-3%;
  • presión atmosferica en un rango de 260 dica 1160 mbar, con una marguin d’error de +-1 mbar;
  • co2 presén en l’ambién en un rango dende 0 dica 5000 ppm (partis por millón) con una marguin d’error de +/- 50 ppm u +/-5%;
  • rudio ambiental en un rango de 35 dB dica 110 dB;
  • endiz de calidá de l’aire en l’atmosfera parando cuenta de os contaminans más determinans: partículas (PM10 y PM2.5), diosido de nitroxeno (NO2), ozono (O3), monosido de carbono (CO) y diosido d’isufre (SO2). Istos datos no en son medidos por a propia estazión, si no que en son os que reculle de o proyeuto europeyo CITEAIR (Informazión Común sobre l’aire en Europa).

MicroStrategy ye una plataforma alazetata en business intelligence y analís preditibo, ta la busca, captura, almacenamiento, compartizión y emplego de grans cantidaz de datos, big data (MicroStrategy Inc., 2016).

O caso consistió en a captura, almazenamiento, estruturazión y analís con a plataforma MicroStrategy Desktop 10.3, de os datos prozedens de a estazión NetAtmo istalata en un zentro de treballo (estudiet) en a localidá d’Ontinar de o Salz, Zaragoza, con o siguién alcanze:
  • o rango de datos abarca una añada: dende o 1º d’abril de 2015 á lo 31 marzo de 2016, alchuntatos por trimestres;
  • os atributos encluyitos estión: ora, día, día de a semana y mes de as medizions;
  • as métricas encluyitas estioron: conzentrazión de CO2 en partis por millón (ppm),  conzentrazión de CO2 en partis por millón redondeata a múltiplos de 50 ppm, temperatura en ºC, umedá relatiba en %.

O prozeso consistió en:

1. Estrazión de datos en formato alazet de datos Excel, con o rango y alcanze establexitos, dende o panel de control de a estazión NetAtmo dica l’ordenador local. O set de datos estrayito aconsiguió 857.452 balors;
2. Una begata almazenato localmén o set de datos en formato Excel, se prozedió á la estruturazión de a informazión, emplegando ta isto un programa de fuella de calculo (Numbers). A informazión s’estruturó en cuatro atributos (ora, día, día de a semana y mes de as predizions) y cuatro métricas (concentración de CO2 en partis por millón ppm, conzentrazión de CO2 en partis por millón redondeata a múltiplos de 50 ppm, temperatura en ºC, umedá relatiba en %;
3. Una begata estruturata a informazión, se fazió a cautura de o set de datos con a plataforma MicroStrategy Desktop;
4. Con a informazión capturata se fazioron esferens prebas y analís, dica plegar á os risultatos amostratos auto contino. As siguiens feguras amostran belún de os risultatos sinnificatibos obtenitos.

A fegura 1 amuestra ripresentazions en formato “heat map” (Wikipedia, 2016) de as metricas agrupatas baxo l’atributo “ora”, deseparatas por trimestres:

  • conzentrazión de CO2 redondeata a multiplos de 50 ppm, ripresentata por a grandaria de cada fratal;
  • temperatura meya en ºC, ripresentata por a color (berde-royo) y a intensidá de cada fratal.
Fegura 1: ripresentazión en formato “heat map” de as metricas CO2(50) y temperatura meya, agrupatas baxo l'atributo“ora” (clic en a imaxen ta ubrir-la a grandaria completa)
Fegura 1: ripresentazión en formato “heat map” de as metricas CO2(50) y temperatura meya, agrupatas baxo l’atributo“ora” (clic en a imaxen ta ubrir-la a grandaria completa)
Un primer analís de a fegura premite beyer que a conzentrazión de CO2  y a ora de o día tienen zierta rilazión , a lo menos en o 1er. trimestre de 2016, y o 2º y 4eno. de 2015. Ista rilazión endica que as mayors conzentrazions de CO2 se’n produzen en as zagueras oras de cada día, sin dembargo, con ista ripresentazión tipo “heat map” ye á asaber complicato prezisar a rilazión.

Ta prezisar dita rilazión, ye más apropiato l’emplego d’atra mena de ripresentazión, como a que s’amostra en a figura 2, una tabla combinata en a que s’amostran, deseparatas por trimestres:

  • a conzentrazión de CO2 redondeata a multiplos de 50 ppm se ripresenta con barras berticals;
  • a temperatura meya en ºC se ripresenta con una ringlera tamién en l’exe bertical, y con codigo de colors berde-royo;
  • a distribuzión oraria, en l’exe orizontal.

A ripresentazión de os datos en ista tabla combinata premite beyer millor a rilazión entre a conzentrazión de CO2  y a ora de o día. Pero, antimás, premite beyer que a conzentrazión de CO2 tiene tamién una rilazión con a temperatura: a más temperatura, más conzentrazión.

Anque ista zaguera zercustanzia puede estar en zierta mida por as propias carauteristicas de o diosido de carbono, o importán ye que a ripresentazión premite prezisar dita rilazión, que podrá (u no pas) deber-se á atros fautors ambientals antimás de á lo propio comportamién de o gas.

Fegura 2: ripresentazión en formato "tabla combinata" de as metricas CO2(50) y a temperatura meya, alchuntatas baxo o l'atributo "ora" (clic en a imachen ta ubrir-la á grandaria completa)
Fegura 2: ripresentazión en formato “tabla combinata” de as metricas CO2(50) y a temperatura meya, alchuntatas baxo o l’atributo “ora” (clic en a imachen ta ubrir-la á grandaria completa)

Iste analís de caso ye muito exemplificator de o balor adubito que as teunoloxías de a conoxedura pueden adubir á la informazión d’aspeutos rilazionatos con a sostenibilidá de una interpresa.

En o caso concreto analizato, antiparti de que o lumero d’atributos y metricas ye limitato, s’han consiguito oserbazions difizilmén azesibles de no pas haber contato con os dos sistemas emplegatos: a estazión NetAtmo (big data) y a plataforma MicroStrategy (analís). Por exemplo, solo que parando cuenta de a rilazón obserbata entre a conzentrazión de CO2 con a ora de o día en determinatas estazions de l’añada y a temperatura, se puede interbenir con muita más eficazia sobre dembas como a bentilazión de o puesto, a planificazión d’orarios d’estanzia u á climatizazión.

Atro aspeuto á parar cuenta ye o bolumen de datos con os que s’ha treballato. Como se nombra á lo prenzipio d’iste caso, o set de datos ye de más de 857.000 rechistros, o cualo suposa una muestra sinnificatiba que proporziona  una fuen suporte á una de as aplicazions más importans aintro de as teunoloxías de a conoxedura: os analís preditibos. Por exemplo, en o caso concreto analizato, risulta muito probable que, si no s’ha interbenito sobre fautors como a temperatura, climatizazión u emplego de o puesto en o que s’han feito as medizions, as conzentrazions de CO2 en añadas sucesibas continen o patrón marcato en os trimestres analizatos.

Sin dembargo, esta ye solo que una muestra esferenzial, a ran cuasi d’emplego domestico, de o potenzial d’ista mena de teunoloxías. En iste suposato caso pero perfeutamén posible, en o que una interpresa tiene á disposizión muitos atros atributos y metricas como puedan estar ratios de produtibidá, inzidens, consumo enerxetico de as instalazions de climatizazión, ezetera, se pueden prexinar muitos más analís, rilazions, predizions, etz., que den suporte á la toma de dezisions estrateuchicas ta la organizazión.

Ta rematar, combiene nombrar tamién o sobrebueno funzionamién en a realizazión de o caso por a plataforma MicroStrategy, en continparazión con ferramientas teunoloxicas más tradizionals como en son as fuellas de calculo (Excel y Numbers). Isto s’ha puesto oserbar espezialmén en a fase prozeso de cautura y estruturazión de os datos: o rendimiento de l’ordenador baxaban sinnificatibamén tanimientres s’emplegaban as fuellas de calculo, antiparti de que os datos con os que se’n treballaban yeran datos brutos; sin dembargo, o rendimién de l’ordenador cuan os datos s’importaron á la plataforma MicroStrategy tasamén se beyeba afeutato, á pesar de a mayor complexidá de as operazions feitas (graficos, calculos, bisualizazions,…)

Bibliografía:

MICROSTRATEGY INC. (2016). Introducing MicroStrategy 10. http://www.microstrategy.com/us/capabilities. Online. Consultato 11.may.2016;
NETATMO S.A. (2016). Estazión meteoroloxica NetAtmo. https://www.netatmo.com/es-ES/producto/estacion-meteorologica/specifications. Online. Consultato 11.may.2016;
Scripps Institute of Oceanography (2016). The Keeling Curve. https://scripps.ucsd.edu/programs/keelingcurve/. Online. Consultato 11.may.2016; 
WIKIPEDIA (2016). Heat Map. https://en.wikipedia.org/wiki/Heat_map. Online. Consultato 11.may.2016.