Ondernemingen maken steeds vaker en meer gebruik van open source software. Niet verwonderlijk, want doordat open source door een brede gemeenschap gedragen wordt, kan veel sneller op ontwikkelingen worden ingesprongen dan bij traditionele proprietary software het geval is. Bovendien kun je flink besparen op kosten doordat je industriestandaard hardware gebruikt. Waar Linux inmiddels de standaard is op servers, Open Stack voor cloud computing en Docker en CoreOS voor applicatie-containers, is Ceph het aangewezen open source platform voor Software Defined Storage. Ondernemingen kunnen zodoende een complete infrastructuur opzetten met open source software.

De applicatie centraal De open source gemeenschap promoot een software-defined infrastructuur die applicaties centraal stelt. Lees verder in deze whitepaper: Zet de applicatie centraal

Opslagmarkt verandert dramatisch

Waar de servermarkt compleet op zijn kop is gezet doordat steeds meer bedrijven de overstap maakten van Unix naar Linux, gebeurt nu hetzelfde met de opslagmarkt door de opkomst van Software Defined Storage (SDS). Analisten zoals Gartner, IDC en Forrester verwachten dat rond 2020 maar liefst een derde van alle bedrijven zal zijn overgegaan op SDS. "Proprietary opslagsystemen zijn onevenredig duur. Dus ondernemingen kunnen enorm op kosten besparen door SDS in te zetten", licht Larry Morris toe, productmanager bij SUSE. "De marges op traditionele opslagsystemen zijn enorm hoog. Voor componenten zoals harde schijven betaal je al snel drie keer zoveel als wanneer je dezelfde schijven bij een industriestandaard hardware-leverancier zoals HP, Dell, of Lenovo koopt. Daardoor nemen de opslagkosten met vijftig tot zestig procent af als je voor SDS kiest."

Toekomstvast

Het verklaart meteen waarom overal SDS-bedrijven uit de grond schieten met elk hun eigen oplossing. Hoe weet je met welke je veilig in zee kunt gaan? "Het is moeilijk om bij te houden welke bedrijven er allemaal zijn. Momenteel zijn er alleen al iets van vijftig startups." Als je voor SDS kiest zijn er twee aspecten om goed in de gaten te houden, benadrukt Larry Morris: "Allereerst moet je een lock-in voorkomen. Daarnaast moet je je afvragen welke bedrijven er over een jaar of vijf nog bestaan." Essentiële punten, want als je de verkeerde keuze maakt, moet je over enkele jaren alle data migreren en dat is een gigantische klus.

"Hier zie je meteen het grote voordeel van SDS via open source software," gaat Morris verder. "Met Ceph loop je geen risico op een lock-in en het is toekomstbestendig. Er wordt al tien jaar serieus aan ontwikkeld en het is een zeer elegante en robuuste architectuur. Er is bijvoorbeeld geen bovengrens, zodat je altijd kunt blijven opschalen. Ceph is echt ontworpen om te groeien tot in de exabytes. Daarnaast is er geen enkel single point of failure. Alle elementen in de cluster zijn dubbel uitgevoerd, wat voor een hoge beschikbaarheid en betrouwbaarheid zorgt."

Lees ook: Het pad naar een software defined datacenter

Ceph wordt breed gedragen door een betrokken gemeenschap en heeft een adviesraad waarin de acht oprichters deelnemen, zoals Intel, Cisco, Fujitsu, Sandisk, SUSE en Red Hat. "Ook belangrijke grote klanten zoals CERN zijn nauw betrokken," vervolgt Morris. "Met ongeveer vijfentwintig petabyte draait bij CERN een van de grootste Ceph-configuraties ter wereld. Zelf zeggen ze hierover: 'Alles onder de tien petabyte werkt feilloos met Ceph.'"

Unified architectuur

Doorgaans zijn SDS-producten alleen geschikt voor de opslag van objecten, blokken, of bestanden en worden combinaties hiervan niet ondersteund. Ceph is uniek omdat het wel raad weet met alle drie de opslagmethoden. "Momenteel worden zowel objecten als blokken ondersteund," vertelt Larry Morris. "In de volgende versie die deze zomer uitkomt wordt het Possix-bestandssysteem ondersteund via Ceph FS, waarmee het een echte unified architectuur wordt voor objecten, blokken en bestanden."

Enterprise ready

Er zijn veel slimme dingen gedaan om ervoor te zorgen dat er geen beperkende factoren zijn, wat vooral belangrijk is voor grote ondernemingen. Zo schaalt Ceph zonder grenzen, wordt de data automatisch gebalanceerd over de cluster voor de beste performance en is data redundancy volledig gegarandeerd. Binnenkort kan Ceph op elke denkbare plek de taak van een traditioneel opslagsysteem overnemen. Morris: "Je kunt Ceph nu al inzetten als SAN-systeem en zodra Ceph FS beschikbaar komt ook als NAS-systeem. Daarnaast past Ceph naadloos in een Open Stack-oplossing, zodat het zowel on premise als voor cloud computing is te gebruiken." Ceph biedt heterogene toegang vanuit Windows, Unix en Linux.

Lees ook: Combineer OpenStack met Ceph

Groot voordeel van open source, is dat elke deelnemer features kan bouwen, die vervolgens beschikbaar worden gesteld aan de overige deelnemende partijen. Zo heeft SUSE de veelgebruikte LIO-interface waar Linux-systemen gebruik van maken in de kernel ingebouwd, zodat toegang tot een fabric mogelijk is via onder andere iSCSI, fiber channel en fiber channel over Ethernet. Data kan nu ook encrypted worden en er wordt gewerkt aan data compressie. Data de-duplicatie is zeer complex in een gedistribueerde opslagcluster, maar de gemeenschap werkt hard om het over enkele jaren beschikbaar te hebben. Tot die tijd is lokale data de-duplicatie een optie.

Active active data replicatie

Doordat Ceph breed gedragen wordt door de gemeenschap, waaronder zich veel gevestigde bedrijven bevinden die al heel lang bestaan, komen steeds meer geavanceerde features beschikbaar die goed van pas komen in grote ondernemingen. Neem Erasure Coding, de nieuwste generatie RAID-technologie. Larry Morris: "Het stelt je in staat om afhankelijk van je data-behoefte te kiezen uit twee, drie, vier, vijf, of zelfs zes redundancy-niveaus. Dankzij deze verhoogde redundancy ontstaan ongekende mogelijkheden voor replicatie naar externe locaties."

Momenteel is synchrone replicatie tot ongeveer dertig kilometer mogelijk. In komende versies komt daar asynchrone replicatie over lange afstanden bij. "In de versie die deze zomer uitkomt zit al een federated object gateway. Daarmee kun je een active active configuratie opzetten om kopieën van de data op meerdere locaties te bewaren." Er wordt begonnen met twee locaties en dat wordt later uitgebouwd. "Straks kun je de data op elke locatie benaderen en wordt het actief tussen alle locaties gesynchroniseerd. Dit soort ontwikkelingen laat de enorme kracht van Ceph en open source software zien."

Zet de applicatie centraal: download de whitepaper