Power Law Distributions og Entrepreneurship Research

Anonim

Bedriftsskolens forskere har gjort en grunnleggende feil i deres innsats for å forstå entreprenørskap. De har feil antatt at de fleste utfall av interesse i oppstartsverdenen blir distribuert normalt når de generelt følger en kraftlovsfordeling, finner Chris Crawford og hans kollegaer et nytt papir i Journal of Business Venturing.

Sosialforskere antar generelt at fenomenene de søker å forklare, følger en normal fordeling. Dette fungerer ganske bra for å forklare mange ting i denne verden, som høyden på voksne menn eller matvarepriser, men de jobber ganske dårlig for å forklare utførelsen av oppstart.

$config[code] not found

Crawford og andre, som Jerry Neumann, rapporterer om de viktigste indikatorene for resultatene til nye selskaper - inkludert inntektsvekst og sysselsettingsvekst, faste verdsettelser og engasjements- og risikovillig kapitalavkastning - følger en kraftlovsfordeling. Med en kraftlovfordeling står noen få ekstreme tilfeller for nesten alle resultatene, om hva du måler er brøkdelen av Y-Kombinatorens avkastning som kommer fra investering i Airbnb, overskuddskilden i Sequoia Capitals siste fond eller jobbene skapt av amerikansk industri.

Crawford og hans kollegaer gjør et dristig krav i abstrakt av deres papir. De sier, "våre resultater krever utvikling av ny teori for å forklare og forutsi mekanismene som genererer disse fordelingene og utjevnene deri."

For å forstå hvorfor de har rett, la jeg merke til tre implikasjoner av funnene deres:

• Den statistiske antakelsen om det store flertallet av entreprenørskapsforskning som gjennomføres i dag, er feil, noe som gjør deres funn mistenkt. Ta for eksempel denne linjen fra en vitenskapelig artikkel av Johan Wiklund fra Syracuse University og Dean Shepherd of Indian University som skriver (2011: 927) "I noen utvalg av firmaer kan det med rimelighet antas at ytelsen varierer normalt rundt et gjennomsnitt. ”

Forutsetningen om fordelingen av fast ytelse fører forskere som Wiklund og Shepherd til å bruke inferensiell statistikk basert på normale distribusjoner. Men Crawford og kollegaer viser at dataene om oppstart av fast ytelse normalt ikke distribueres, men følger en kraftlovsfordeling. Som figuren som jeg lånte fra deres papirutstillinger, er normale distribusjoner og kraftloverfordeler svært forskjellige dyr. Forutsatt at dataene følger ett mønster når det faktisk følger en annen, vil det bety at de statistiske analysene dine blir feil.

• Forskeres arbeid for å sikre at dataene deres "passer" til forutsetningene om normalitet, fører dem til å kaste bort de aller fleste dataene som inneholder mest informasjon om entreprenørskap. Statistisk analyse som er avhengig av forutsetningen om en normal fordeling, er svært følsom overfor avvikere - som Ubers siste verdsettelse eller Facebooks markedsverdi. For å unngå "forspenning" som kommer fra å forsøke å inkludere utelukker i analyser som er avhengige av normale utbredelser, fjerner forskere typisk dem. Men når det du måler følger en kraftlovfordeling, er denne tilnærmingen besluttet å kaste babyen ut i stedet for badevannet.

• Politikk beslutningstakere bekymringer om folks privatliv gjør det svært vanskelig for forskere å nøyaktig bruke regjeringsdata for å forklare entreprenørskap. De fleste regjeringsdatabaser, som de som ble gitt av Census Bureau eller Federal Reserve, rutinemessig "toppkode" - eller fjerner de aller høyeste utøverne - i offentlige versjoner av datasettene for å hindre brukere i å identifisere studiedeltakere. Den store innsatsen for å beskytte personvern undergraver nøyaktig måling av entreprenørskap når nøkkelvariablene forskerne forutsier følger en kraftlovsfordeling. De viktigste delene av informasjonen i databasen er de mange tallene som er skjult for analyse.

Oppstart av foto via Shutterstock

Kommentar ▼