Følgende artikkel ble publisert før lanseringen av ApeeScape Female Developer Scholarship. For å støtte stipendssøkere har ApeeScape også gitt ut en guide for å lage ditt første Open Source Contribution.
Kvinner tilhører et underrepresentert kjønn på det teknologiske området. Dette er imidlertid ikke noe nytt. Bare se på tallene som er publisert av store selskaper som Facebook , Google , Intel , Slakk og mange, mange flere.
På et nylig teknisk arrangement hørte jeg en samtale om mangelen på kjønnsdiversitet i teknologibransjen. Den lille gruppen diskuterte det faktum at selv om kvinner utgjør omtrent 30% av arbeidsstyrken innen teknologi, har ingeniørteam på høyere nivå sjelden mer enn et par kvinner.
En av deltakerne i denne samtalen kommenterte at dette var fordi mannlige utviklere vanligvis er dyktigere enn kvinnelige utviklere. Ingen i gruppen protesterte.
Hmm ...
På grunn av både min erfaring fra ApeeScape og min lavere grad som studerte ingeniør ved Princeton University, var det nesten 50/50 mann vs. kvinne, jeg vet at dette er helt usant. Jeg har jobbet med en rekke utrolige ingeniører, dypt intelligente i alle slags roller. Imidlertid ser ikke tallene ut til å stemme overens med min egen erfaring, spesielt når høyere tekniske funksjoner begynner å bli observert.
Og å takle denne forskjellen er viktig. Det er ikke bare mangfold for den skyld. Hvis menn og kvinner er like intelligente, statistisk sett, av de ti mest intelligente i verden, bør fem være kvinner og fem menn. Derfor, hvis et lag ikke har like balanse mellom menn og kvinner, er dette laget definitivt ikke sammensatt på best mulig måte. I et perfekt system er mangfold et sannsynlig resultat. Men dette er ikke resultatene vi ser.
Etter å ha hørt denne samtalen, ønsket jeg å se på figurene for å bedre forstå om det var på grunn av feilkonstruksjon av utstyret at de var i dårlig form. Jeg har googlet en oversikt over kjønnstrender på tvers av alle ferdighetsnivåer innen programvareteknikk, men har ikke klart å finne mye, så jeg bestemte meg for å se på tallene som er offentlig tilgjengelige på GitHub. Jeg har skrapt 5000 profiler for å få navn, antall følgere, bidrag og arkiver. Så brukte jeg open source-pakken genderize.io, for å finne ut kjønnet til hver profil. Det var så få kvinner i denne første batchen at jeg måtte legge til mer data for å lage enkle, til og med meningsfulle grafer. Så jeg skrapte 15 000 ekstra profiler.
Dette er hva jeg fant:
Allerede før vi gikk inn i noen videre analyse, var det åpenbart at kvinneandelen var ekstremt lav. Av 20 000 profiler var genderize.io i stand til trygt å bestemme kjønnet på 15 374. Av disse var bare 6,0% (926) kvinner. Ulikheten blir mer alvorlig når du ser på brukeraktivitet.
La oss bruke 10 bidrag som avskjæringspunkt for å kontrollere forskjellen mellom en bruker som nylig har opprettet en profil og kanskje litt erfaren og en som har fordypet seg i et open source-prosjekt. Resultatet: 5,4% kvinner.
Bare 5,4% av GitHub-brukere med mer enn 10 bidrag fra vårt tilfeldige utvalg er kvinner.Faktisk, hvis vi deler brukere opp i fragmenteringer i henhold til antall bidrag (med minimum 1000 brukere i hver kube), har andelen kvinnelige brukere en tendens til å reduseres når bidragene øker.
Ikke bare er det langt færre kvinner på GitHub enn tall for kjønnsmangfold i teknologibransjen kan antyde, men det ser ut til at kvinneandelen synker når brukeraktiviteten øker.
Jeg fortsatte å grave, og tok hensyn til sjangeren gjennom antall følgere og arkiver, og så det samme mønsteret. Dette var spesielt tydelig når man så på antall arkiver.
Nok en gang ser vi at kvinneandelen synker når vi går til fragmenteringer med flere arkiver.
Så hva skjer her? Er aktivitet på GitHub en rimelig måler for programmeringsevner? (Jeg tror det). Er talentfulle kvinnelige ingeniører mindre sannsynlig å aktivt bidra til Open Source enn sine mannlige kolleger? Er disse resultatene en annen indikator på oppstarts- eller oppbevaringsproblemer i teknologibransjen når det gjelder kvinnelige ingeniører?
Statistisk sett er antall kvinner i teknologibransjen allerede ganske dystre, men de er enda verre i Open Source-prosjekter.
Mye tidligere forskning har fokusert på årsakene til at kvinner ikke er villige til å ta fatt på vitenskap, teknologi, ingeniørfag og matematikkrelaterte emner og karrierer. Noen konkluderer med at det generelt er mangel på interesse for disse spørsmålene. Andre mener at kvinner bestemmer seg for ikke å gjøre karrierer av denne typen etter å ha blitt stereotyp av familien og / eller lærerne, mens andre fremdeles snakker om mangelen på forbilder eller kombinasjonen av flere årsaker.
I følge en studie om kjønn på Stack Overflow, “Problemet med kjønnsulikhet og spørsmål knyttet til vitenskap, teknologi, ingeniørfag og matematikk har blitt studert i flere år, og spesielt med tanke på hvorfor kvinner ikke forplikter seg til vitenskapelige studier. . Inntil nå var det lagt vekt på å kvantifisere fenomenet og representasjonen av kvinner i nettsamfunn (som brukere av teknologibrukere), hva nivået av deltakelse de har, og om forskjeller kan oppdages på kjønnsnivå. Bare anekdotisk bevis er samlet inn for å finne ut hvordan spesifikke samfunn aktivt fraråder kvinner å delta.
Men når vi bruker så mye tid på å konsentrere oss om hvorfor færre kvinner studerer naturfag, teknologi, ingeniørfag og matematikk, blir fokuset tapt på en annen viktig forskjell: hvis 28% av mastergrader er rettet mot kvinner, hvorfor er tallene i åpen kildekode samfunnet så lavt?
Det er noen muligheter å vurdere når vi tenker på et svar på dette spørsmålet:
I teknologibransjen bruker mange utviklere GitHub tidlig i karrieren, da det er en forutsetning for å bli tatt på alvor. Imidlertid ser det ut til at få håper kvinnelige utvikling ser Open Source på denne måten. Er det mulig at disse dataene er en tilfeldighet, og at de ikke betyr mye i forhold til antall kvinnelige talenter innen programvareutvikling i teknologibransjen?
Jeg har diskutert problemet med to ApeeScape-ingeniører, Anna-Chiara Bellini og Bozhidar Batsov. Anna-Chiara har mer enn 20 års erfaring innen programvareteknikk på tvers av en rekke akademiske og forretningsinnstillinger, og Bozhidar er nummer 98 på listen over de beste aktive GitHub-bidragsyterne i verden.
De var begge enige om at det å være aktiv på GitHub normalt er en god indikator på ingeniørkompetanse, og likevel er det motsatte også sant da de uttalte at de kjenner gode ingeniører som ikke er aktive på GitHub. På den annen side er også teknologibransjen enig, ettersom mange selskaper vurderer GitHub-profiler under ansettelsesprosesser (selv om denne praksisen ser ut til å være ganske partisk, noe som egentlig ikke er en overraskelse med tanke på resultatene av studien min).
GitHub-aktivitet er generelt en god indikator på ingeniørkompetanse, men det motsatte er sant ... Mange gode ingeniører er ikke på GitHub.Bozhidar foreslo at Open Source-bidragsytere ofte er den mest sannsynlige typen mennesker som presser på for at store interne endringer skal skje i bedriftsmiljøet. Anna-Chiara kommenterte at det er nødvendig med stor tillit for å bidra til Open Source, noe som ifølge henne kan være vanskeligere for kvinnelige utviklere, gitt at teknologibransjen historisk har vært ubehagelig med dem.
Det er sant at det er flere skjevheter som potensielt kan være i spill med disse GitHub-dataene (inkludert det faktum at nesten 25% av navnene ikke kunne klassifiseres som mann / kvinne med tillit).
Imidlertid var Bozhidar, Anna-Chiara og jeg enige om at nivået på GitHub-aktivitet generelt er en god indikator på programmeringsferdigheter. På samme måte antyder disse dataene en trend hos talentfulle kvinnelige programmerere som bestemmer seg for å avbryte (eller aldri starte) sine Open Source-søk, og erstatte dem med andre alternativer.
Mange selskaper i teknologibransjen sier at de sysselsetter 25 til 30 prosent av kvinnene. Dette tallet kan imidlertid være misvisende. De fleste av disse større tallene - ja, de er de største - inkluderer både tekniske og ikke-tekniske funksjoner.
Når du begynner å se på andelen kvinner i tekniske stillinger, faller tallene ytterligere.
På Facebook er 32% av de ansatte kvinner, men bare 16% av de tekniske rollene tilhører kvinner. Hos Google er det et tilsvarende fall fra 30% av kvinnelige ansatte i selskapet som helhet til 18% i tekniske roller. Slakk er redusert fra 39% i den kvinnelige befolkningen til 18% som faktisk jobber med ingeniørfunksjoner. Av selskapene jeg har undersøkt, har Intel det minste spranget, med 24,1% kvinnelig befolkning og 19,4% som jobber i tekniske roller.
Så selv om mange selskaper har en andel kvinner som er omtrent en fjerdedel eller til og med en tredjedel av selskapet, er antallet kvinner i tekniske stillinger faktisk mye lavere. Det ser ut til at utsagn på 15 til 20 prosent ville være mer nøyaktige.
Men det etterlater fortsatt en stor forskjell mellom prosentandelen kvinner som deltar i tekniske eller tekniske roller i teknologibedrifter og andelen kvinner som bidrar ved å åpne kodeprosjekter på GitHub.
Hvis aktiviteten på GitHub er korrelert med profesjonalitet og erfaring, er antallet kvinnelige bidragsytere ekstremt lavt; Dette kan forklares med den alarmerende utgangsraten for kvinnelige ingeniører fra bransjen.
Blant kvinner som slutter seg til teknologibransjen, forlater 56% karrieren halvveis, dette tallet er doblet sammenlignet med det for den mannlige befolkningen.Hvis teknologibransjen ikke kan beholde flertallet av kvinner fra begynnelsen av karrieren, vil de mest sannsynlig ikke bidra til mange Open Source-prosjekter.
Men denne tankegangen reiser også spørsmålet: Er sammenhengen mellom erfaring og bidrag virkelig sant? Mange av de hyppige OSS-deltakerne er relativt nye programmerere som prøver å etablere et navn for seg selv, men hvor er kvinnene i den gruppen?
Kommenterer en artikkel om kvinner innen teknologi, sier en utvikler: “Når det gjelder åpen kildekode-prosjekter - jeg har tenkt på dette nylig. Jeg har egentlig ikke gjort noe, og dette setter absolutt en knute i karrieren min ... Jeg føler at det er en sirkel som jeg ikke helt kan gå inn i. Men fremfor alt frykter jeg å være sentrum for oppmerksomhet for å være den eneste kvinnen i teknologibransjen som jobber med et prosjekt tilgjengelig for publikum. På grunn av hvordan kvinner blir behandlet på internett, finner jeg at resonnementet mitt ikke er feil.
Anna-Chiara mener at denne typen frykt er et vanlig tema blant kvinnelige ingeniører, spesielt når det gjelder OSS. Da jeg spurte henne om hun trodde det var mindre sannsynlig at kvinner ville bidra til åpen kildekode-prosjekter, svarte hun at de var det.
Anna-Chiara reiste også muligheten for at kvinnelige GitHub-abonnenter kan prøve å vedta et kjønnsnøytralt eller maskulin navn for å sikre at de blir tatt på alvor (husk at genderize.io ikke var i stand til å bestemme kjønnet på rundt en fjerdedel av de reviderte profilene. ).
Det betyr imidlertid ikke at skattebetalerne ikke er til stede. Bozidhar bringer Exercism.io, et populært prosjekt startet av Katrina Owen som har flere samarbeidspartnere. Den nevner også Bodil Stokke, en utvikler fra Norge med en lang historie med populære open source-bidrag.
Anna-Chiara antyder også at hvis et prosjekt har hatt kvinner blant de beste bidragsyterne eller lederne, kan det være mer sannsynlig at utviklerne vil bidra til det. Dessverre, i forhold til antall prosjekter dominert av menn, er det vanskelig å finne et programvareprosjekt rettet mot kvinner.
Men problemet er større enn OSS. “Hvis jeg tenker på kvinnene jeg kjenner som har et programvareutviklingsyrke, er de på ingen måte nær å representere 20% i et selskap. Jeg tror ikke engang de er nær 10%, sier Anna-Chiara. 'Resultatet av denne GitHub-analysen overrasker meg ikke.'
Eric Ries peker på implisitte skjevhetsproblemer i teknologibransjen. Selv om de samme menneskene i systemene ikke er partiske, er det ekstremt enkelt for disse systemene å ha en forhåndsbestemt skjevhet. I tillegg har folk også ubevisste preferanser, noe som ytterligere kompliserer problemet.
I sin artikkel bruker Eric eksemplet på orkestre, som hovedsakelig var sammensatt av menn frem til 1970. Folk tror at mannlige artister hadde en overlegen evne til musikk enn kvinnelige artister. Men når de begynte å skille musikerne fra dommerne med en fysisk skjerm under auditions, endret tallene seg betydelig, og folk begynte å akseptere at i gjennomsnitt både menn og kvinner gjør jobben sin bra.
Hvis lignende skjevheter spiller inn med ansettelsessystemer i teknologibransjen, kan dette bidra til å forklare den lavere prosentandelen kvinnelige programvareingeniører jeg har diskutert ovenfor. Og hvis færre kvinnelige programvareingeniører blir ansatt, kan disse effektene strømme inn i Open Source-fellesskap som GitHub. Når noen blir avvist for en heltids programmeringsrolle, kan denne personen tro at de ikke er dyktige nok, og vil også miste tilliten til å bidra til Open Source-prosjekter.
Nedenfor er noen spørsmål knyttet til emnet.
Å få flere kvinner involvert i teknologibransjen er et stadig diskutert tema akkurat nå; økningen i Coding Bootcamps burde ha en positiv innvirkning, selv når det gjelder Open Source. Hvor effektive er disse diskusjonene og de forskjellige nye initiativene? Hvordan vil disse tallene være om 3 år? Om 5 år? Og om et år?
Anna-Chiara foreslo å se på kjønnsfordelingen av brukere basert på antall grener for å gi deg en ide om hvor ofte kvinner eksperimenterer med GitHub-portalen. I tillegg er det andre faktorer som spiller, for eksempel aldersgruppen som kan påvirke resultatene våre. Open Source har vært en stift i teknologiindustrien i lang tid, men GitHub ble grunnlagt for bare 8 år siden.
Hvis prosentandelen kvinner som bruker et pseudonym er større enn prosentandelen kvinner på GitHub generelt, vil dette generere et ganske sterkt faktum om hvor inkluderende (og teknologibransjen generelt, til en viss grad) GitHub er som et samfunn.
Dette er relativt, siden interaksjon på GitHub er teoretisk uavhengig av plassering. Men kan vi lære noe av de høyteknologiske miljøene i land som har et høyere forhold enn gjennomsnittet av GitHub-brukere?
Her er noen ideer for å forbedre disse tallene (igjen, selvfølgelig, det er mange flere):
Da jeg diskuterte dette emnet med Bozhidar, nevnte han at de fleste av prosjektene / samfunnene på GitHub har ledere som er ekstremt tålmodige, imøtekommende og glade for å veilede nye Open Source-bidragsytere gjennom de tidlige stadiene av prosjektet. Dette ser ikke ut til å være vanlig resonnement for ingenting (husk kommentaren nevnt tidligere som understreket at kvinner mangler selvtillit).
Er disse nye GitHub-brukerne klar over at denne typen veiledning og støtte eksisterer (forutsatt at den er så utbredt som han hevder), og at denne nye brukeren ville vite hvordan han skulle finne denne typen veiledning? Kan du gjøre forbedringer i de populære GitHub-lagringsgrensesnittene for å gjøre dette mer åpenbart og innbydende? For eksempel, hvis populære arkivsider inneholder noe som en offisiell 'Repository Mentor' -rolle, ville det kanskje være mye tydeligere at en erfaren bruker ville være tilgjengelig for å svare på spørsmål.
Det er mange innlegg der ute som lærer deg hvordan du skal håndtere GitHub; å komme i gang, kjenne det 'å bruke' og mye mer, men det virker nesten ingenting for meg når det gjelder retningslinjer for interaksjon i GitHub-samfunnet (hvis du vet om noen, vennligst legg lenken i kommentarene).
En trinnvis veiledning om hvordan du implementerer riktig tag i GitHub-fellesskapet og dets beste praksis i henhold til ferdighetsnivået til hver bruker, kan bidra til å bryte isen og gi kunnskap om de beste elementene som kan bidra til Open Source. Dette er definitivt noe som kan stimulere flere ambisiøse utviklere til å bli involvert. Følg med for guider som dette fra ApeeScape.
Bozhidar kommenterte viktigheten av at utviklerne som er involvert i dette prosjektet er villige til å hjelpe nykommere med å komme i gang med grunnleggende oppgaver, mens Anna-Chiara diskuterer hvordan det kan være ganske skremmende å hoppe rett inn i et prosjekt og holde fast med kritikk. Det må absolutt gjøres mye for å gjøre disse teknologisamfunnene mer imøtekommende og mer imøtekommende for kvinner. Følg med for et ApeeScape-initiativ om dette!
Er du overrasket over resultatene fra GitHub? Hva tror du de mener?