Hvordan søke Amazon for millioner av offentlige dokumenter, bilder og mer
Amazon Web Services (AWS) er den blå hval av cloud computing. Du kan ikke innse det, men de fleste nettsteder og webtjenester kjører på denne plattformen. Og faktisk er AWS offentlig sky større enn Microsoft, Google og IBM kombinert.
AWS, som en annen massiv skyplattform, er vert for en rekke offentlig tilgjengelige data. For eksempel kan du finne store 100 millioner sterke datasett av Creative Commons bilder og videoer fra Flickr. Få tilgang til den ved hjelp av YFCC100m Browser.
Prøv et søk med Google. Du vil bli overrasket over den enorme mengden offentlige dokumenter du kan finne på AWS. En av de raskeste måtene å søke AWS for PDF-filer er å bruke god gammel Google og en av sine avanserte søkoperatører.
[Søkeord] filetype: PDF-nettsted: amazonaws.com
Selvfølgelig er filene åpne for publikum og kan være tilgjengelige fra søkeportaler av nettstedene som er vert for dem på AWS. Men dette søkeordet tilnærming er en “eksperimentelt søk” som hjelper deg med å grave inn i den store høstacken på en gang i stedet for å gå til hvert nettsted.
Du kan også bruke Googles Avansert søk-side til å bygge spørringen mer presist og deretter utføre den for å søke i Amazonas sky. Jeg foretrekker et lite søkeverktøy som heter Advangle. Slik øker du nøyaktigheten av søkeresultatene på Google og Bing. Slik øker du øyeblikkelig nøyaktigheten av søkeresultatene på Google og Bing. Det er derfor den beste måten å søke fremdeles krever bruk av booleske søkoperatører. Men hvem vil huske alle de forskjellige søkoperatørene? Heldigvis er det en løsning! Les mer, som hjelper deg med å bygge søk på en visuell måte.
en “Usynlig” Plass til webforskning
En søkemotor er en inngangsdør til nettet. Men det er mange måter å søke etter dype data på. Reisen til den skjulte websiden: En guide for nye forskere. Reisen til den skjulte websiden: En veiledning for nye forskere. Denne håndboken tar deg på en tur gjennom de mange nivåene av den dype weben: databaser og informasjon tilgjengelig i akademiske tidsskrifter. Til slutt kommer vi til Tors porte. Les mer og legg til dine forskningsferdigheter. Selvfølgelig må du ikke bruke informasjonen (spesielt bilder) blindt. Finn nettstedet som eier informasjonen og kontroller deres opphavsrettsbegrensninger.
Jeg tror at Googles avanserte søkoperatører bør være en del av våre vaner. Hva tror du? Nevn noen åpne kataloger hvor du liker å gjøre din online forskning.
Utforsk mer om: Amazon Web Services, Google Søk, Websøk.