Begynners veiledning for å forhindre blogginnholdsskraping i WordPress

Begynners veiledning for å forhindre blogginnholdsskraping i WordPress / Beginners Guide

Hvis du skriver opprinnelig innholdsdag i og dag ut, er du allerede klar over det faktum at innleggene dine vil ende opp med en rekke SPAM-nettsteder innen noen få dager, noen ganger i noen få minutter. Noen brukere bemerket selv at nettstedet med stjålet innhold har skrevet ut det opprinnelige innlegget. Det er veldig frustrerende som en webområdeeier for å se at noen stjeler innholdet ditt uten tillatelse, tjene penger på det, utranger deg i SERP, og stjele publikum. Innholdsskraping er et stort problem i disse dager, med tanke på at det er så enkelt for noen å stjele innholdet ditt. I denne artikkelen vil vi dekke hva som er innhold i bloggen, hvordan du får innholdsskrapere, hvordan du kan håndtere innholdsskrapere, hvordan du kan redusere og forhindre innholdsskraping, hvordan du kan dra nytte av innholdsskraping, hvordan du tjener penger fra innholdskraper , og er innholdsskraping alltid bra?

Hva er innhold i bloggen?

Skrap av blogginnhold er en handling som vanligvis utføres med skript som trekker ut innhold fra mange kilder og trekker det inn i ett nettsted. Det er så enkelt nå at alle kan installere et WordPress-nettsted, sette et gratis eller kommersielt tema, og installere noen plugins som vil gå og skrape innhold fra utvalgte blogger, så det kan bli publisert på deres nettsted.

Hvorfor stjeler de mine innhold?

Noen av brukerne våre har bedt oss hvorfor stjeler de mine innhold? Det enkle svaret er fordi du er AWESOME. Sannheten er at disse innholdskrapene har ulterior motiver. Nedenfor er bare noen få grunner til at noen ville skrape innholdet ditt:

  • Affiliate-kommisjon - Det er noen skitne affiliate markedsførere der ute som bare vil utnytte systemet for å få noen ekstra penger. De vil bruke innholdet ditt og andres innhold til å bringe trafikk til nettstedet deres via søkemotoren. Disse nettstedene er vanligvis rettet mot en bestemt nisje, så de har relaterte produkter som de fremmer.
  • Ledende generasjon - Ofte ser vi advokater og realtors å gjøre dette. De vil virke som bransjeledere i sine små samfunn. De har ikke båndbredden til å produsere kvalitetsinnhold, så de går ut og skraper innhold fra andre kilder. Noen ganger er de ikke engang klar over dette fordi de betaler litt scumbag $ 30 / month for å legge til innhold og hjelpe dem med å få bedre SEO. Vi har møtt ganske mange av disse i fortiden.
  • Reklameinntekter - Noen mennesker vil bare lage et "hub" av kunnskap. En one-stop-shop for brukere i en bestemt nisje. Hvis jeg hadde en krone for hver gang noen har gjort dette med innholdet vårt, så ville vi ha noen få hundre kroner. Ofte oppdager vi at innholdet på nettstedet vårt blir skrapt. Skraberen svarer alltid, jeg gjorde dette til samfunnets gode. Bortsett fra at nettstedet er plastered med annonser.

Dette er bare noen få grunner til at noen ville stjele innholdet ditt.

Slik tar du av innholdsskrapere?

Catching content scrapers er en kjedelig oppgave og kan ta opp mye tid. Det er få måter du kan bruke til å fange innholdskraper.

Søk på Google med posttittene dine

Yup som er så smertefullt som det høres ut. Denne metoden er sannsynligvis ikke verdt det, spesielt hvis du skriver om et veldig populært emne.

Trackbacks

Hvis du legger til interne linker i innleggene dine, vil du legge merke til en trackback hvis et nettsted stjeler innholdet ditt. Denne måten er ganske mye skraperen som forteller deg at de skraver innholdet ditt. Hvis du bruker Akismet, vil mange av disse trackbackene dukke opp i SPAM-mappen. Igjen, dette vil bare fungere hvis du har interne linker i innleggene dine.

Verktøy for nettredaktører

Hvis du bruker google verktøy for nettredaktører, er du sannsynligvis klar over linkene til nettstedet ditt. Hvis du ser under «Trafikk», vil du se en side som sier Linker til nettstedet ditt. Sjansene er at skraperne dine vil være blant de øverste der. De vil ha hundrevis hvis ikke tusenvis av koblinger til sidene dine (med tanke på at du har interne lenker).

FeedBurner Mindre vanlige

Hvis du har setup Feedburner for WordPress-bloggen din, kan du se noen uvanlige bruksområder. I Analyser-fanen under Feed Stats, vil du se "Uncommon Uses". Der vil du se en liste over nettsteder.

Hvordan håndtere innholdsskrapere

Det er få tilnærminger som folk tar når det gjelder innholdsskrapere. The Do Nothing Approach, drep dem alle tilnærminger, dra nytte av dem tilnærming.

Det gjør ingenting tilnærming

Dette er uten tvil den enkleste tilnærmingen du kan ta. Vanligvis vil de mest populære bloggerne anbefale dette fordi det tar mye tid på å kjempe mot skrapene. Denne tilnærmingen anbefaler rett og slett at "istedenfor å bekjempe dem, tilbringe tiden din med å produsere enda mer kvalitetsinnhold og ha det gøy". Nå er det åpenbart at hvis det er en kjent blogg som Smashing Magazine, CSS-Tricks, Problogger eller andre, så trenger de ikke å bekymre seg for det. De er autoritetsnettsteder i Googles øyne.

Men under Panda Update, vet vi at noen gode nettsteder ble flagget som skraper fordi google trodde at skrapene deres var originalt innhold. Så denne tilnærmingen er ikke alltid den beste etter vår mening.

Drep dem alle tilnærmingen

Det nøyaktige motsatt av "Gjør ingenting tilnærming". I denne tilnærmingen kontakter du bare skraperen og ber dem om å ta innholdet ned. Hvis de nekter å gjøre det eller bare ikke svarer på dine forespørsler, så legger du inn en DMCA (Digital Millennium Copyright Act) med verten. Etter vår erfaring har flertallet av skrapende nettsteder ikke et kontaktskjema tilgjengelig. Hvis de gjør det, så bruk det. Hvis de ikke har kontaktskjemaet, må du gjøre et Whois Lookup.

Du kan se kontaktinformasjonen på den administrative kontakten. Vanligvis er administrativ og teknisk kontakt den samme. Whois viser også domeneregistratoren. Mest kjente web hosting selskaper og domeneregistratorer har DMCA skjemaer eller e-post. Du kan se at denne bestemte personen er med Hostgator på grunn av deres navneservere. HostGator har et skjema for DMCA-klager. Hvis navneserveren er noe som ns1.theirdomain.com, må du grave dypere ved å gjøre omvendt IP-oppslag og søke etter IP-er.

Du kan også bruke en tredjepartstjeneste for DMCA.com for takedowns.

Jeff Starr i sin artikkel tyder på at du bør blokkere den dårlige manns IP-adresser. Få tilgang til loggene dine for deres IP-adresse, og deretter blokkere det med noe slikt i din root .htaccess-fil:

Nekter fra 123.456.789

Du kan også omdirigere dem til en dummy feed ved å gjøre noe slikt:

RewriteCond% REMOTE_ADDR 123 \ .456 \ .789 \. RewriteRule. * Http://dummyfeed.com/feed [R, L]

Du kan bli virkelig kreativ her som Jeff foreslår. Send dem til virkelig store tekststrømmer fulle med Lorem Ipsum. Du kan sende dem noen motbydelige bilder av dårlige ting. Du kan også sende dem rett tilbake til sin egen server og forårsake en uendelig sløyfe som vil krasje deres nettsted.

Den siste tilnærmingen vi tar er å ta fordel av dem.

Hvordan dra nytte av innholdsskrapere

Dette er vår tilnærming til å håndtere innholdsskrapere, og det viser seg ganske bra. Det hjelper vår SEO, så vel som hjelper oss med å tjene ekstra penger. Flertallet av skraperne bruker RSS-feeden til å stjele innholdet ditt. Så dette er noen av tingene du kan gjøre:

  • Intern kobling - Du må knytte sammen CRAP ut av innleggene dine. Med den interne koblingsfunksjonen i WordPress 3.1, er det nå enklere enn noensinne. Når du har interne koblinger i artikkelen din, hjelper det deg med å øke sidevisninger og redusere avvisningsfrekvensen på ditt eget nettsted. For det andre får du tilbakekoblinger fra folk som stjeler innholdet ditt. Til slutt lar det deg stjele publikum. Hvis du er en talentfull blogger, så forstår du kunsten til intern linking. Du må plassere linkene dine på interessante søkeord. Gjør det fristende for brukeren å klikke på den. Hvis du gjør det, vil scraperens publikum også klikke på den. På samme måte tok du en besøkende fra deres nettsted og brakte dem tilbake til hvor de burde vært i utgangspunktet.
  • Auto Link Søkeord med Affiliate Linker - Det er få plugins som Ninja Affiliate og SEO Smart Links som automatisk erstatter tilordnede søkeord med tilknyttede lenker. For eksempel: HostGator, StudioPress, MaxCDN, Gravity Forms << These all will be auto-replaced with affiliate links when this post goes live.
  • Bli kreativ med RSS Footer - Du kan enten bruke RSS Footer eller WordPress SEO ved Yoast Plugin for å legge til egendefinerte elementer i RSS-foten din. Du kan legge til omtrent alt du vil ha her. Vi kjenner noen mennesker som liker å markedsføre sine egne produkter til sine RSS-lesere. Så vil de legge til bannere. Gjett hva, nå vil disse bannene vises på disse skraperens nettsted også. I vårt tilfelle legger vi alltid til en liten ansvarsfraskrivelse nederst på våre innlegg i våre RSS-feeder. Det leser ganske enkelt som "Slik setter du ditt WordPress-område i kun skrivebeskyttet State for Site Migrations and Maintenance er et innlegg fra: WPBeginner som ikke må kopieres på andre nettsteder." Ved å gjøre dette får vi en tilbakekobling til den opprinnelige artikkelen fra skraperens nettsted som lar Google og andre søkemotorer vite at vi er autoritet. Det lar sine brukere også vite at nettstedet stjeler innholdet vårt. Hvis du er god med koder, kan du helt få nøtter. Slik legger du til relaterte innlegg bare for RSS-leserne dine, og en rekke andre ting. Sjekk ut vår guide for å fullstendig manipulere WordPress RSS-feed.

Hvordan du kan redusere innholdet i bloginnhold og muligens forhindre det

Tatt i betraktning om du tar vår tilnærming til mange interne koblinger, legger du til tilknyttede lenker, rss-bannere og slike sjanser er at du vil redusere innholdsskraping til et godt mål. Hvis du tar Jeff Starrs forslag om omdirigering av innholdskraper, vil det også stoppe disse skrapene. Bortsett fra det vi har delt over, er det noen få andre triks som du kan bruke.

Full versus oppsummering RSS-feed

Det har vært en debatt i bloggingssamfundet om å ha full RSS-feed eller sammendrag RSS-feed. Vi kommer ikke til å gå inn i mye detaljer om den debatten, men en av PROS for å ha et sammendrag bare RSS-feed er at du forhindrer innholdsskraping. Du kan endre innstillingene ved å gå til WordPress admin panel og gå under Innstillinger »Reading. Endre deretter innstillingen For hver artikkel i et feedspor: Sammendrag.

Merk: Vi har full feed fordi vi bryr oss mer om våre RSS-lesere enn spammerne.

Trackback SPAM

Trackbacks og Pingbacks hadde definitivt gode bruksområder, men de blir stadig misbrukt. Ofte viser temaer trackbacks og pingbacks under eller blant kommentarene. Dette gir spammeren et incitament til å skrape ditt nettsted og sende trackbacks. Hvis du feilaktig godtar det, får de en tilbakekobling og nevner fra nettstedet ditt. Slik kan du deaktivere Trackbacks på alle fremtidige innlegg. Her er en artikkel som viser deg hvordan du deaktiverer trackbacks og pings på eksisterende WordPress-innlegg også.

Er innholdsskraping noensinne bra?

Det kan bli. Hvis du ser at du tjener penger på skraperens nettsted, så vær sikker på at det kan være. Hvis du ser mye trafikk fra en skrapes nettsted, så kan det være. I de fleste tilfeller er det imidlertid ikke. Du bør alltid prøve å få innholdet tatt av. Men du vil innse at bloggen din blir større, det er nesten umulig å holde styr på alle innholdskraper. Vi sender fremdeles ut DMCA-klager, men vi vet at det er tonnevis med andre nettsteder som stjeler innholdet vårt, som vi ikke bare kan holde tritt med.

Hva er dine tanker? Bruker du noen annen mekanikk for å forhindre innholdsskraping? Ville elske å høre tankene dine.