lunes, 6 de febrero de 2017

big data 



Es un concepto que hace referencia al almacenamiento de grandes cantidades de datos.

                                                             
Existen unos diferentes tipos de herramientas que tratan el big data.

- Datos estructurados: Datos que tienen bien definidos su longitud y su formato. Se almacenan en tablas.

-Datos no estructurados:  Datos en el formato tal y como fueron recolectados, carecen de un formato específico. No se pueden almacenar dentro de una tabla ya que no se puede desgranar su información a tipos básicos de datos.

- datos semiestructurados:  Datos que no se limitan a campos determinados, pero que contiene marcadores para separar los diferentes elementos.


Los datos provienen de la captura que se realiza de estos, que son generados por:

-  Personas: por las búsquedas que hacemos e incluso por nuestras redes sociales. Es decir todo aquello que hagamos o busquemos estará registrado y se utilizara como análisis de mercado.

- Transacciones de datos:La facturación, las llamadas o las transacciones  entre cuentas generan información que tratada pueden ser datos relevantes.

- Biométrica: Son el conjunto de datos que provienen de la seguridad, defensa y servicios de inteligencia. Se usan principalmente para "facilitar" la seguridad.

Una vez encontradas las fuentes de los datos necesarios, muy posiblemente dispongamos de un sinfín de tablas de origen sin estar relacionadas. El siguiente objetivo consta en hacer que los datos se recojan en un mismo lugar y darles un formato.
El almacenamiento NoSQL nos permite un almacenamiento mas flexible  para poder manipular   estas  grandes cantidades de datos.
Para saber que datos deberemos de utilizar necesitamos analizar los datos, para ello hay diferentes sistemas como por ejemplo: Minería de datos, Agrupación, etc.