Existiert der dritte Sektor tatsächlich und wenn ja in welcher Form? Zeichnet er sich zum Beispiel durch die Steuerbefreitheit der Organisationen aus? Durch die Freiwilligkeit der Helfenden? Oder ist es doch das Aktivitätsfeld, dass Organisationen aus dem «dritten Sektor» am stärksten von Organisationen der Privatwirtschaft unterscheidet? Die Forscher Salamon and Sokolowski (2016) merken an, dass der “dritte Sektor” wahrscheinlich eines der komplexesten Konstrukte im modernen politischen und gesellschaftlichen Diskurs sei.
In einer noch nicht publizierten Arbeit am CEPS haben wir das Konstrukt «dritter Sektor» mittels machine learning Algorithmen aus einer neuen Perspektive beleuchtet. Machine learning eignet sich hier besonders gut, da diese Algorithmen sehr komplexe Strukturen und Muster aufdecken können. Um das zu bewerkstelligen, brauchen diese Algorithmen jedoch auch sehr viel Daten. Da wir untersuchen wollten, ob sich Organisationen des dritten Sektors in ihrem Aktivitätsfeld von Organisationen des privaten Sektors unterscheiden, lieferten wir diese Daten in Form von Text. Als Input fungierten die auf zefix.ch von mehr als 600’000 Organisationen gelisteten Organisationszwecke. Darunter befinden sich auch Zwecke von Vereinen und Stiftungen; also Organisationen des «dritten Sektors».
Der erste machine learning Algorithmus hatte die Aufgabe, die Ähnlichkeiten zwischen den Organisationszwecken zu berechnen. Nun kann man identifizieren, welche Organisationszwecke einander besonders ähnlich sind und welche nicht. Man könnte nun von Hand nach Mustern suchen und schauen, ob und inwiefern sich die Organisationszwecke von Organisationen aus dem dritten Sektor von Organisationen aus dem privaten Sektor unterscheiden. Doch, Sie ahnen es, auch diese Aufgabe haben wir machine learning Algorithmen überlassen. Die können das nicht nur besser, sondern auch schneller. Nun wendeten wir sogenanntes «unüberwachtes Lernen» an. Man gibt dem Algorithmus also kein Ziel vor, sondern der Algorithmus selbst versucht in den Daten Muster zu erkennen. Der Algorithmus versuchte nun Muster in den Ähnlichkeiten der Organisationszwecken zu erkennen. So kann man entdecken, ob sich Gruppen von sehr ähnlichen Organisationen bilden. Unser Ziel war zu schauen, ob der Algorithmus von sich aus Organisationen des dritten Sektors als separate Gruppe identifiziert.
In der untenstehenden Abbildung sieht man, dass sich Organisationen aus dem dritten Sektor (Stiftungen und Vereine) tatsächlich als separate Gruppe oben rechts angesiedelt haben. Die Farben widerspiegeln die Rechtsformen, nicht die vom Algorithmus entdeckten Gruppen. Sie erlauben uns zu sehen, dass der Algorithmus den dritten Sektor tatsächlich als eher separaten und kohärenten Cluster entdeckt hat. Unsere Analyse scheint also die Existenz des «dritten Sektors», zumindest bezogen auf die Organisationszwecke, zu bestätigen.

Übrigens: falls auch Ihre (gemeinnützige) Organisation von Datenanalyse und machine learning profitieren soll, helfen Ihnen Organisationen wie datacross gerne dabei!