Utnyttelse av Google Data Mine

Anonim

Har du "googled" i dag? Gikk du til denne siden med "googling"?

I så fall har du sett fremtiden, og du er en del av det, selv om du ikke skjønner det enda. Faktisk skjer det mye mer på Google enn bare å søke. Jeg skal snakke om hva Google gjør, vet - så vel som hva du bør gjøre og vet for å få mest mulig ut av det.

$config[code] not found

Sann nok er Google best kjent for sin kraftige søkemotor, som bygger på en massiv database av nettsider, videoer, bilder, aksjekurser, telefonnumre, adresser og andre biter av media og data for å gi relevant informasjon - alt i tid det tar å slå en nøkkel.

Navnet på verdens største søkemotor har blitt synonymt med å søke på Internett. Det er til og med blitt et verb i vårt daglige språk (selv om Google ikke liker oss å bruke det på den måten): vi «google» bilanmeldelser, vår barndomsvenns nåværende adresse og, i flukt med fancy og storhet, oss selv.

Det er lett å glemme at vi ikke er alene når vi søker. Alt vi gjør i Google-miljøet (og noen ting vi gjør utenfor det) registreres, lagres og analyseres. Når du vet at et selskap har så mye data tilgjengelig, tar det ikke lang tid å innse at all denne informasjonen kan brukes til langt mer enn bare en hyggelig søkeopplevelse.

For å fullt ut forstå Googles potensielle kraft, lene deg tilbake et øyeblikk og se hvordan Google fungerer litt mer detaljert. Hvordan Google fungerer

Til den uformelle søkeren er det ikke umiddelbart tydelig hvordan Google søker på Internett så raskt og med så gode resultater. Hemmeligheten er at når du skriver inn et søk, søker de ikke på Internett i det hele tatt; I stedet søker Google en database som kontinuerlig vokser og oppdaterer, 24 timer i døgnet, 7 dager i uken.

Alt dette skjer uten noen menneskelig inngrep. Små programmer kalt "edderkopper" eller "crawlere" følger uavhengig av hverandre koblinger fra en side til en annen, slik en edderkopp følger trådene på nettet. Som edderkoppene kryper gjennom nettsider, samler de informasjon om hver setning, bilde, telefonnummer og alt annet de kan støte på. De skanner hver side de besøker, indekser søkeord og notatlenker til og fra siden. Deretter lagres denne informasjonen i en massiv database. De samme koblingene og sidene gjennomsøkes igjen og igjen, slik at Google-informasjonen forblir nåværende.

Google rangerer sider med informasjonen som edderkoppene samler inn. Inkludert i denne rangeringsprosessen er følgende:

  • søkeordfrekvens og plassering (flere søkeord på mer fremtredende steder er bedre);
  • siden på siden (jo mer veletablerte siden er, jo bedre);
  • Antall sider som lenker til en side (jo flere lenker jo bedre).

Det er andre faktorer som Google vurderer også, men disse holdes hemmelige for å hindre de som ville prøve å spille systemet og score høye rangeringer uten å faktisk gi nyttig informasjon. I tillegg, hvis du overdriver det og bare fyller siden din med overflødig informasjon, vil lister over søkeord og søppelkoblinger, Google, straffe deg eller kanskje til og med slippe nettstedet ditt fra databasen. Det må klart treffes en fin balanse. Denne balansen mellom faktorer på siden er like mye kunst som vitenskap.

Jo bedre en side score i henhold til disse kriteriene, desto høyere er det i søkeresultatene. De høyest rangerte sidene vises på den første siden av et Google-søk; siden de fleste Google-brukere aldri våger forbi den første siden, får de høyt rangert sidene en uforholdsmessig mengde internettrafikk.

Alt dette for å si at når du kjører et søk på Google, kan det svare så raskt fordi det ikke prøver å søke på hele Internett i det øyeblikket; Det rådfører seg med sin svært organisert og prioritert database. Men enda viktigere enn å skape lynrask søk, betyr at Google har et stort lagringssted for data om hva som er på Internett, og enda viktigere, hvem bruker hva, når og for hvilket formål.

Hva kjenner Google?

Google "vet" mye, faktisk. Google holder styr på søk, og beholder til og med en fil på dine bestemte søk basert på din IP-adresse eller Google-pålogging. Det gir dem et lite vindu i tankene dine, avslører hva som interesserer deg, bekymrer deg, spenner deg og skremmer deg. Dette alene er kraftig markedsføringsinformasjon.

Hvis du kunne tappe inn i databasen, ville du kunne konstruere detaljerte profiler om enkeltpersoner - deres interesser, kjøpevaner, helseproblemer, familieproblemer og mer. Du kan avdekke tegn som tyder på om et selskap lykkes eller feiler, enten det vurderer en fusjon eller oppkjøp, og hvilke produktlinjer det kan utvides til. Du kan følge historiske trender i valg, økonomi, helsevesen og noen andre områder som har betydelig sosial, økonomisk og politisk verdi.

Videre, hvis du bevisst eller uvitende bruker andre Google-tjenester, gir du fremdeles mer informasjon. De skanner Gmail, får samme informasjon fra korrespondansen din som dine søk, samt hvem vennene dine og samarbeidspartnere er. Hvis du deler dokumenter via Google-dokumenter, vet de hvem du jobber med, og på hvilke prosjekter. Google Checkout legger til data om innkjøpsmønstre, forbruksvaner og budsjettet.

Det er også informasjon du sender til Google uten å være klar over at du gjør det. Google samler, som med andre Internett-tjenester, din IP-adresse og muligens din MAC-adresse. Din IP-adresse forteller dem omtrent hvor du er i verden geografisk, og MAC-adressen din er en signatur som er unik for maskinen din. Dette lar dem spore om du alltid bruker samme maskin, hvor mange maskiner du bruker, og så videre. Så ikke bare Google vet hva du søker etter, og hvem du kommuniserer med, selskapet vet også hvor du er og hvilken maskin eller maskin du bruker.

Selvfølgelig, la oss ta et skritt tilbake og innrømme at nesten alle nettsteder har tilgang til noen eller all denne informasjonen. For eksempel samles IP-adresser regelmessig for å forsvare seg mot hackere og angrep på tjenesten. Informasjon om hvor du går på en persons nettsted, når du ankommer og går, og hvor du kommer fra og går til, er all standard webstatistikk tilgjengelig for selv det minste personlige nettstedet.

Det som gjør Google annerledes, er dets rene størrelse og mangfold av tjenester, slik at det kan samle et større utvalg av informasjon fra mange flere personer.

Når stash av informasjon går fra hundrevis av deler av data til milliarder, har du innsikt om at ingen andre gjør det. Det som gjør Google virkelig kraftig, er at det kan observere folk i flere sammenhenger enn noen andre. Google ser på deg selv når du ikke er på datamaskinen. Google Maps gir bilder med høy oppløsning av de fleste av USA, så vel som noen andre områder i verden. Det er sannsynlig at ditt hjem kan ses på Google Maps, og hvis du tilfeldigvis vann gården da satellitten fløy forbi, kan du også se deg selv i ditt ratteste par shorts!

Hva Google kan gjøre

Det er noen ganske åpenbare bruksområder for Googles database, AdWords er kanskje den mest populære og synlige en for øyeblikket.

Hver gang du kjører et søk på Google, er de første oppføringene øverst på siden og oppføringene på høyre side "sponsede lenker" betalte annonser som er kjøpt av folk som mener at søkere som kjører et søk som din ville være interessert i sine varer og tjenester. Denne teknikken har spredt seg til andre websider, noe som forklarer "Annonser fra Google" -monikeren du ser å levere relevante annonser for sidene på andre nettsteder.

Å selge dette annonseringsområdet er klart en god kilde til inntekter for Google. I 2007 brakte AdWords Google over 16 milliarder dollar i inntekter, noe som gjør det til Googles største inntektskilde hittil. Til sammenligning er Google datalager en gullgruve som nesten ikke har blitt tappet.

Så langt har de Google-funksjonene vi har sett fokusert primært på å reagere på dagens markedstrender. Folk blir interessert i noe - den nye versjonen av X-Box, finne en elektriker på nettet, Super Bowl-memorabilia, etc. - og Google er posisjonert for å hjelpe folk til å koble med sine potensielle kunder.

Men med nok informasjon kan et selskap som Google gjøre mer enn bare reagere på nåtiden med lynhastighet. Det kan også se fremtiden, eller til og med skape fremtiden. Før du tror dette er bare en paranoid science-fiction daydream, gi problemet litt hensyn.

La oss ta en enkel sak. Anta at du setter opp et program for å legge merke til søk som ikke oppdager noen høyt rankede sider mislykkede søk som ikke gir noen nyttig informasjon til søkeren. Programmet som følger disse feilene, merker hva søkeren ønsket, og setter de mislykkede søkene i kategorier.

Ser gjennom disse tallene, hva om Google merker at det er et stort antall mislykkede søk som alle har å gjøre med å finne en gjør-det-selv-supermarked i Thermopolis, WY. Litt mer om, og jeg har en liste over steder der det er mange mislykkede søkere for DIY-supermarkedslokaler. Denne listen vil være utrolig verdifull for et selskap som franchiserer DIY butikker (ikke navngi noen navn, men tenk på de store oransje varehusene i hver forstad: vil de ikke like å vite?).

De ville ikke bare vite at det ikke var noen DIY butikk der, men at et bestemt antall mennesker lette etter en slik butikk. Og de ville nok ha en ide om hva de håpet å kjøpe der: apparater, byggematerialer, gassgriller, etc. Dette er smertefri markedsundersøkelse, sortert og analysert av Google automatisk.

På samme måte kan denne informasjonen brukes til å identifisere potensielle kjøpere for et bestemt produkt, spore forbrytere engasjert i barnepornografi, og fange potensielle tyver som omslutter et hjem eller en butikk. Det kan hjelpe utviklere til å velge steder for nye hjem og butikker, advare deg om alvorlig vær i ditt område, finne registrerte velgere og lære om deres vaner og interesser, og hjelpe IRS finne folk som jukser på sine skatter. Det kan også være feil i tolkning: En rekke søk om kreft fra en liten by kan bety mange kreftpasienter, men det kan like godt bety at det er en medisinsk skole der.

Som du kan se, kan vi applaudere noen av bruken av denne informasjonen og dekke andre. Men de er alle mulige, og alle bruker de samme grunnleggende teknikkene. Du kan finne nesten alt du vil, du må bare vite hvordan du skal se etter det.

I min neste artikkel vil vi se på hva alt dette betyr for deg som individ … og som gründer. Gå til: Google Data Mine og din bedrift.

* * * * *

Om forfatteren: Hamlet Batista er president for NEMedia S.A, en leverandør av SEO-automatiseringsprogramvare som hjelper entreprenører og små bedrifter til å øke kvaliteten på deres naturlige søketrafikk mens de fokuserer på det de gjør best. Hamlets blogg, Hamlet Batista dot Com, utforsker den mest avanserte SEO-undersøkelsen, samt strategier og taktikker som kan gi deg en viktig kant over konkurrentene dine.

17 kommentarer ▼