Cassandra

Escrito por JAVIER27ADS 08-03-2018 en Cassandra. Comentarios (0)

Qué es Apache Cassandra

Apache Cassandra es una base de datos de código abierto,  NoSQL (No sólo SQL, no relacional), especialmente diseñada para el manejo de grandes cantidades de datos, sobre clientes en configuración de clusters distribuidos en diferentes datacenters, linealmente escalable y de alta disponibilidad (tolerancia a fallas).

Cassandra nació en Facebook, para permitir la búsqueda en sus buzones de entrada. Fue dirigida a código abierto en 2008, bajo la administración de la organización Apache.

Apache Cassandra nace de la necesidad de usar modelos de datos diferentes a los usados en las bases de datos relacionales, como por ejemplo con Oracle, MySQL o SQL Server; con el fin de permitir muy bajas latencias, tener millones de datos distribuidos globalmente, leer y escribir desde cualquier lugar, escalar los nodos de manera flexible, poseer una mayor disponibildad frente a fallas, y reducir los costos operacionales de equipos y software.

Las bondades de Cassandra han sido suficientemente probadas por compañías como  CERNConstant Contact , eBayNetflixRedditHuluInstagramGitHubGoDaddyIntuitThe Weather Channel, y 1500 compañías más,  que manejan grandes volúmenes de datos diariamente.

Apache Cassandra es actualmente usada por grandes corporaciones para sus aplicaciones, como es el caso de Apple, con 75.000 nodos que guardan más de 10 PB de datos, Netflix con 2500 nodos, almacenando 420 TB o eBay con 100 nodos y 250 TB.