Met GitHub's REST API scrapte de developer openbare profielinformatie van 2.060.011 GitHub-gebruikers die in 2017 actief waren ('actief' betekent tien of meer commits aan publieke projecten) en daarmee kon hij de resultaten verfijnen op zakelijke bijdragers. De resultaten zijn verrassend.

Eerste poging

Vorig jaar analyseerde Google-developer Felipe Hoffa GitHub PushEvents om een beeld te krijgen van welke bedrijven het meeste bijdragen aan open source-projecten. Volgens zijn schatting kwam Microsoft als grootste participant uit de bus (1300 bijdragers) ten opzichte van de nummer twee, Google, met ongeveer 900 bijdragers. Google kwam als hoogste uit met daadwerkelijk gepushte code naar repo's (1100 ten opzichte van Microsofts 825).

Dat was een uitstekende poging, maar er klopte iets niet helemaal. Waarom kwam Red Hat, een bedrijf dat zeer met open source bezig is, bijvoorbeeld zoveel lager uit dan Microsoft en Google. (Hoffa berekende 442 bijdragers en 338 repository's van Red Hat). Was het mogelijk dat Amazon, ook volop aan boord van de open source-trein, in de praktijk echt zo weinig actief was als Hoffa schatte (134 bijdragers en 158 repo's)? Waarschijnlijk niet.

Nieuwe dataset

Sterker nog, met Maj's data kun je stellen: zeker niet. Hij analyseerde profielinformatie (met name de opgegeven bedrijfsnaam) van GitHub's 2 miljoen developers. Microsoft heeft 4550 bijdragers, gevolgd door Google met 2267 bijdragers. Red Hat staat op de derde plaats met 2027 bijdragers, wat relatief bijzonder veel is, daar de organisatie een flink stuk kleiner is dan een techreus als Google of Microsoft.

Hierna: De volledige ranglijst volgens het onderzoek.

Hieronder volgt de aangepaste ranglijst van GitHub-bijdragers, met achter elke bedrijfsnaam het totale aantal werknemers dat code toevoegt aan GitHub-projecten:

  1. Microsoft 4,550
  2. Google 2,267
  3. Red Hat 2,027
  4. IBM 1,813
  5. Intel 1,314
  6. Amazon.com 881
  7. SAP 747
  8. ThoughtWorks 739
  9. Alibaba 694
  10. GitHub 676
  11. Facebook 619
  12. Tencent 605
  13. Pivotal 591
  14. EPAM Systems 585
  15. Baidu 584
  16. Mozilla 469
  17. Oracle 455
  18. Unity Technologies 414
  19. Uber 388
  20. Yandex 351
  21. Shopify 345
  22. LinkedIn 343
  23. Suse 325
  24. ESRI 324
  25. Apple 292
  26. Salesforce.com 291
  27. VMware 271
  28. Adobe Systems 270
  29. Andela 259
  30. Cisco Systems 233

Let wel dat het mogelijk is dat het ook mogelijk kan zijn dat bijvoorbeeld werknemers van Google hun bedrijfsnaam niet in hun profiel zetten, terwijl werknemers van Microsoft daar extra goed op letten.

Met zulke mitsen in het achterhoofd, zien we wel een veel grotere hoeveelheid zakelijke bijdragers dan bleek uit de dataset van Hoffa vorig jaar. Ook interessant om op te merken is dat zowel Hoffa als Maj GitHub's eigen bevindingen negeren. De organisatie stelde in 2016 dat er meer dan 16.000 Microsoft-bijdragers zijn, maar GitHub's methodologie om dat getal te bereiken is onduidelijk en is ook niet herhaald in 2017.

Op de laatste pagina staan we stil bij development-trends in zakelijke organisaties en nog een punt wat we moeten aanstippen: de relatieve bijdrages aan open source ipv de absolute.

In deze resultaten zien we dat Microsoft twee keer zoveel ontwikkelaars heeft die open source-code bijdragen dan de dichtsbijzijnde concurrent, Google. Voor mensen die nog hebben meegemaakt dat Ballmer open source-licentiëring een kankergezwel in de softwarewereld noemde, is dat nog steeds een verbijsterende omslag. Microsoft heeft al lang het belang van ontwikkelaars benadrukt en het is logisch met cloudplatform Azure om markttrends te volgen, zoals open source, om developers naar zijn platform te trekken.

Red Hat relatief én absoluut groot

Ondertussen heeft Amazon, zo vaak gezien als stille open source-gigant, de zesde plaats ingenomen met bijna 900 bijdragers. Amazon is publiekelijk niet zo op de open source-tour gegaan als Microsoft en Google, maar is een belangrijk deelnemer van de ontwikkelcommunity met bijdrages die open source code verder stuwen.

En Red Hat? Volgens Maj's data staat het bedrijf in de top drie, zoals het hoort. Maar houd er rekening mee dat de organisatie véél minder engineers in dienst heeft dan Microsoft en Google. Daarom is het nog indrukwekkender dat Red Hat zo hoog uitkomt. Vrijwel elke ontwikkelaar van het bedrijf werkt aan open source-projecten.

En zelfs Oracle

Chinese bedrijven als Baidu, Tencent en Alibaba worden over het algemeen gezien als gebruikers van open source, maar uit deze gegevens blijkt dat ze ook behoorlijk wat bijdragen. Zelfs Oracle, wat vaak onder vuur heeft gelegen voor zijn gesloten aanpak van open source-projecten, komt in de ranglijst terug, wat deels te danken is aan bijdrages met MySQL en Linux.