WordPress sociālo mediju parsētājs spraudnis. Bezmaksas satura parsētājs — AftParser

Diezgan jaudīgs universāls parsētājs WordPress. Ļauj apkopot saturu no viena vai vairākiem avotiem un apstrādāt, pielāgojot to vajadzīgajam formātam, izmantojot visas PHP valodas iespējas. Pastāv aizkavētas parsēšanas iespēja. Šobrīd labākais bezmaksas Wordpress parsētājs — AftParser vienmēr ir jūsu rīcībā!

Īss funkcionalitātes apraksts:

Parsētājs sastāv no 4 lapām: Galvenā lapa, Saites parsētāja lapa, Parsētāja lapa RSS plūsmas un iestatījumu lapas. Lūk, kā tas izskatīsies pēc instalēšanas:

Uzmanību: Varat lasīt, kā iestatīt AftParser.

Sāksim ar mājas lapa. Tas parāda pašlaik darbojošos parsētāju sarakstu.

Paskaidrojumi ir sniegti blokos katrā lapā. Visa dokumentācija tiek piegādāta no kastes, pietiek rūpīgi izlasīt, lai viss būtu skaidrs.

Vietnes parsētājs:

Vietnes parsētāja lapa ļauj parsēt datus gan no viena, gan vairākiem avotiem. Nepieciešams tikai nodrošināt saites uz materiāliem.

Kas? Vai esat pārāk slinks, lai raktos pa tīklu un manuāli savāktu materiālus? Neesiet izmisumā – viss ir automatizēts.

Ir divi rīki, kas ļauj automātiski aizpildīt saišu sarakstu.

- sava veida emulācija meklētājs. Robots izstaigās uz to pārsūtītās vietnes lapas un savāks no tām visas iekšējās saites.

Protams, saišu saraksts, kas piepildīts ar automātiskajiem algoritmiem, būs ļoti piesātināts ar nevajadzīgiem datiem. Šeit filtri nāk palīgā.

- vienkāršākais un ātrākais filtrēšanas veids. Jūs ievadāt nosacījumus, un pats filtrs veic apstrādi.

Uzlabots saišu filtrs- saišu filtrs, kas ļauj mainīt to saturu un veikt virkni citu darbību. Tikai pieredzējušiem lietotājiem. Iesaku iemācīties php pirms tur kaut ko darīt.

Ja esat pabeidzis saišu kolekciju, nākamais solis ir pievienot satura apmales.

Izmantojot šīs robežas, parsētājs noteiks apgabalus, kas jāapstrādā.

Sintakses izcelšana tiek īstenota ar līdzekļiem javascript redaktors A.C.E. Visa dokumentācija un visas pieejamās funkcijas ir norādītas spraudņa lapā. Saraksts ir ļoti iespaidīgs, un es to nevaru ienest šeit, jo šis materiāls jau ir ļoti garš. Vienkārši instalējiet spraudni un lasiet tālāk, jūs būsiet pārsteigti, es to garantēju.

Lapa izskatās tāpat RSS plūsmas parsētājs, ar vienīgo atšķirību, ka nav prasības nodrošināt saišu sarakstus.

Dažreiz nav jēgas tērēt laiku vienam WordPress vietnes teksta rakstīšanai. Šis gadījums neattiecas uz emuāriem un informācijas vietnēm, jo ​​ienākumi no tiem veidojas tieši pateicoties ievietotajām ziņām.

Un mēs runājam par tiešsaistes veikaliem, uzņēmumu vietnēm un ziņu portāliem, kas nav paredzēti organiskai satiksmei. Šādiem resursiem unikālie materiāli nav tik svarīgi kā to pastāvīga atjaunināšana.

Lai izveidotu automātiskās pabeigšanas vietni, projektam būs jāiestata ziņu parsētājs. Vispirms jums ir jāatrod piemērotas vietnes, no kurām jūs parsēsit. Tiem ir jāatbilst jūsu projekta tēmai, pretējā gadījumā nav jēgas dublēt informāciju no tiem. Ja tā, tad jums ir jāturpina parsēšanas problēmas risināšanas otrā daļa — šādi tiks klonēts teksts no citas vietnes. Primitīvākais un neērtākais veids ir manuāla kopēšana. Taču daudz saprātīgāk ir izmantot kādu no šajā rakstā sniegtajiem spraudņiem, lai aktivizētu veiksmīgu ziņu un satura parsētāju.

WP-O-Matic

Ļoti populārs WordPress modulis, kas ļaus iestatīt funkcionālu ziņu parsētāju no citām vietnēm. Instruments ir uzstādīts vienkāršā veidā: vai nu augšupielādējot tieši mitināšanas mapē, vai izmantojot cilni “Spraudņi”.

Tālāk jums ir jākonfigurē spraudnis, ja vēlaties nodrošināt satura parsēšanu. Lai to izdarītu, četras reizes noklikšķiniet uz "Tālāk" un beigās noklikšķiniet uz "Iesniegt". To darot, jūs piekrītat šī WordPress moduļa lietošanas noteikumiem. Jo īpaši piekrītiet, ka tikai jūs esat atbildīgs par citu personu materiālu zādzībām, citu vietņu saturu utt.

Ja papildus teksta komponentam jūs interesē arī attēli, tad mapē ar spraudni ir jāizveido direktorijs ar nosaukumu Cache. Iestatiet šai mapei īpašas atļaujas. Tālāk jums ir jāatgriežas WordPress administratora apgabalā. Dodieties uz spraudņa iestatījumiem un uzmanīgi pārbaudiet, vai blakus Unix cron vienumam ir atzīme. Lai ziņu parsētājs kopētu attēlus arī jūsu resursā, ir jāatzīmē izvēles rūtiņa Kešatmiņas attēls.

WP-O-Matic modulis ir labs, jo tas darbojas jebkurā vietnes lapā. Varat pievienot atsevišķu kategoriju, ja vēlaties, lai tajā tiktu parādīts analizētāja nodrošinātais ziņu un satura saraksts. Lai to izdarītu, vispirms izveidojiet nepieciešamo rubriku. Pēc tam WordPress administratora rīka WP-O-Matic iestatījumos noklikšķiniet uz Pievienot kampaņu. Rindā Kategorijas atzīmējiet izveidotās īpašās kategorijas izvēles rūtiņu. Veidlapā Plūsmas ierakstiet RSS plūsmu, kuru grasāties parsēt. Plūsmām varat norādīt vairākus URL vienlaikus, lai teksta parsētājs apkopotu informāciju no trim vai pat četriem resursiem vienlaikus.

Un vēl viens milzīgs pluss WP-O-Matic spraudņa virzienā ir automātiska materiāla publicēšana. Jums nav jāpiesakās WordPress administratorā katru stundu, lai mainītu ziņu statusu uz "Publicēts". Modulis to darīs pats. Un, ja vēlaties, tas var unikālizēt tekstu, izmantojot īpašu sinonimizācijas mehānismu. Šī ir galvenā atšķirība starp šo rīku un tā konkurentu FeedWordPress spraudni.

Datacol

Šis ir funkcionāls satvērējs, kas ir piemērots ne tikai WordPress dzinējam. Tas nav tikai vietņu lapu teksta parsētājs – tā ir vieda aplikācija, kas ļauj filtrēt kopēto materiālu. Piemēram, varat ievietot tikai tos rakstus, kuriem ir noteiktas atslēgvārdi. Jūs varat dublēt ziņas tieši no Yandex. Klonētie materiāli tiks eksportēti vienā no 15 pieejamajiem formātiem. Pakalpojums apkopos ne tikai tekstu, bet arī virsrakstus, fotogrāfijas, publicēšanas datumu, saites un citus svarīgus datus.

Bet Datacol tiek izplatīts uz maksas pamata. Tomēr tas ir daudz lētāk nekā tad, ja jūs pasūtījāt materiālus vietnē, izmantojot apmaiņu. Lietojumprogramma maksā mazāk nekā 500 rubļu, un to var izmantot gandrīz jebkuram dzinējam. Ir demo versija.

FDE Grabber

Vēl viens maksas parsētājs ar daudzām funkcijām. Tas jau ir no dārgo greiferu kategorijas, jo tas maksās aptuveni 90 USD. Taču to varēs izmantot uzreiz 10 serveros, tas ir, teorētiski dažādi tīmekļa pārziņi var iemaksāt par 9 USD, tādējādi samazinot pirkuma izmaksas.

FDE Grabber nav gluži WordPress spraudnis. Izstrādātāji sauc savu radīšanu autonoma sistēma, kas darbojas neatkarīgi no vietnē instalētās CMS veida. Šīs parsēšanas sistēmas galvenās iezīmes:

  • pilna mēroga ziņu vai atsevišķu fragmentu lejupielāde;
  • jūs varat ieplānot publikācijas;
  • ja vēlaties unikalizēt dublēto materiālu, ir iebūvēta sinonimizācijas funkcija;
  • jūs varat strādāt caur starpniekserveriem;
  • parsēšana spēj apiet novirzīšanu, kas var radīt problēmas citiem spraudņiem;
  • jūs varat automātiski lejupielādēt visu vietnes saturu un pārvietot to uz savu vietni (ja tas nav par ziņu portāliem);

Jūs varat iestatīt parsēšanu pilnībā pēc saviem ieskatiem, jo ​​programmai ir iespēja ieviest mikroprogrammas, lai labotu darbu. Piemēram, šādā veidā jūs varat pielāgot kopētā materiāla izlīdzināšanu un dizainu. Varat arī pievienot parametrus noindex un nofollow visām saitēm, kas būs lapas tekstā. Parsētājs pat ļauj kopēt un automātiski tulkot rakstus no ārvalstu resursiem. Tas ir lielisks veids, kā izveidot savās lapās vienmērīgu satura plūsmu, kas laika gaitā sāks piesaistīt apmeklētājus!

Parser for WordPress ir datu kolas iestatījums, kas paredzēts satura (ziņu, rakstu, apskatu utt.) apkopošanai un tālākai eksportēšanai uz WordPress CMS.

Šajā piemērā iegūtais saturs tiek eksportēts uz . Katras ziņas rezultāti tiek saglabāti atsevišķu failu, kuras nosaukums ir ģenerēts, pamatojoties uz ziņas nosaukumu, un kura saturs ir balstīts uz parsēto informāciju. Varat arī iestatīt tiešu eksportēšanu uz savu WordPress emuāru. Kā to izdarīt, ir parādīts video.

Programmas demonstrācijas versijā varat bez maksas pārbaudīt WordPress parsētāja darbu.
Galvenās WordPress datukolu parsētāja priekšrocības ir:

  • Iespēja pielāgot WordPress parsēšanu tieši jūsu vajadzībām (jūs vai ).
  • Iespēja papildus apstrādāt savāktos datus, izmantojot spraudņus, un arī augšupielādēt tos uz .
  • Iespēja cikliski uzsākt kampaņas. Kad pirmā parsēšanas uzdevuma rezultāti tiks ievadīti otrajā datu vākšanas uzdevumā. Lasīt vairāk.

Kā tiek izmantots WordPress parsētājs?

Ja esat izveidojis emuāru, tad pēc kāda laika jums kļūst skaidrs, ka tā popularizēšanai pastāvīgi ir nepieciešams jauns unikāls saturs. Un kļūst pārāk slinks, lai pats rakstītu rakstus un aizpildītu vietni manuāli. Bet kur iegūt jaunu saturu? Agri vai vēlu pienāk brīdis, kad vēlaties ķerties pie autoemuāru rakstīšanas. Vienkārši sakot, izmantojiet parsētāju, kas pats publicēs mums nepieciešamo informāciju. WordPress satura parsētājs mums palīdzēs tikt galā ar šo uzdevumu.

Visas vietnes jebkad ir izveidotas no nulles. Bet, ja jūsu vietnes mērķis ir sniegt informāciju, tā kļūs interesanta tikai tad, kad informācijas apjoms pārsniegs noteiktu daudzumu. WordPress emuāru parsētājs ir lielisks risinājums šim uzdevumam. Ar tās palīdzību jūs varēsiet īsā laikā panākt konkurentus, ievērojami paplašinot vietnes informācijas katalogu. WordPress parsētājs var tikt ieviests kā WordPress satvērējs no noteiktas vietnes.

Parsētājs WordPress emuārs var palīdzēt atrisināt daudzas problēmas, šeit ir dažas no tām:
– sākotnējā resursa aizpildīšana (vietņu parsētājs WordPress ļaus aizpildīt emuāru ar informāciju no nulles līdz vajadzīgajam apjomam pēc iespējas īsākā laikā);
– automātiski aizpildīta emuāra izveide (WordPress parsētājs varēs nodrošināt regulāru vietnes satura automātisku atjaunināšanu)
— satura publicēšana “pēc grafika” (varat ieplānot laiku, kad savai vietnei jāpievieno ziņas)

Lielapjoma izlikšana pakalpojumā WordPress

Pakalpojumā Datacol nodrošinātais WordPress parsētājs ir lielisks lielapjoma publicēšanas parsētāja izmantošanas piemērs. Tas ļauj automātiski saņemt saturu un publicēt to savā emuārā. WordPress parsēšanas procesu var iedalīt vairākos posmos:

1) Satura vākšanas process. WordPress parsētājs apkopo nepieciešamo informāciju katram emuāra ierakstam: virsraksts, saturs (augšupielādēts ar attēliem, kas tiek saglabāti jūsu datorā tālākai augšupielādei, izmantojot FTP serverī), kategoriju, autoru un saiti, no kuras dati tika vākti (URL) .

2) Parsētāja savāktās informācijas saglabāšana WordPress. Pēc parsēšanas savākto informāciju saglabājies TXT faili(katrs ieraksts tiek saglabāts atsevišķā teksta failā), kuru nosaukumi tiek ģenerēti atbilstoši ieraksta nosaukumam.

3) Eksportējiet WordPress. Parsēto informāciju ir iespējams arī tieši eksportēt uz savu WordPress emuāru. Tas padara uzpildīšanas procesu ļoti ātru un novērš cilvēka kļūdu iespējamību. Iespēja eksportēt uz WordPress ir nodrošināta programmas pamata funkcionalitātē. Programmas iestatījumos ir jānorāda iestatījumi savienojumam ar jūsu emuāru un jāiestata eksportējamie dati (nosaukums, saturs, kategorija utt.)

4) Informācijas apstrāde. Ja vēlaties, WordPress parsēšanas procesā savākto informāciju var apstrādāt (piemēram, pakļaut automātiskai tulkošanai vai sinonimizācijai). Šīs funkcijas tiek ieviestas, izmantojot spraudņus.

Kā parsēt vietni pakalpojumā WordPress?

Jūs varat ne tikai publicēt parsēto informāciju pakalpojumā WordPress, bet arī varat parsēt no tās. Diezgan bieži rodas uzdevums izmantot citu cilvēku WordPress emuārus kā satura avotu saviem emuāriem. Lai to atrisinātu, jums palīdzēs WordPress vietņu parsētājs. WordPress vietņu parsētāja algoritms ir līdzīgs iepriekš aprakstītajam.

WordPress vietņu skrāpja priekšrocības

Droši vien jau esat redzējis, ka WordPress emuāru parsētājs palīdzēs jums netērēt daudz laika un pūļu, manuāli aizpildot emuāru. Pateicoties tam, jūs varat ne tikai automatizēt savu darbu, bet arī palielināt tā efektivitāti. Varat lejupielādēt WordPress parsētāju, kas ieviests kā daļa no Datacol, izmantojot

Emuāra parsētāja pārbaude

Lai pārbaudītu emuāra parsētāju:

2. darbība. Kampaņas kokā ir kampaņa content-parsers/kolchaka-net.par. Atlasiet to un noklikšķiniet uz pogas Atskaņot. Pirms palaišanas varat rediģēt ievades datus. Tādējādi varat iestatīt saiti uz emuāru vai emuāra lapām, no kurām analizēsit saturu.

3. darbība. Pagaidiet, līdz tiek parādīti emuāra parsētāja rezultāti. Pēc rezultātu parādīšanās varat piespiedu kārtā pārtraukt parsēšanu (noklikšķinot uz pogas Apturēt).

noklikšķiniet uz attēla, lai palielinātu

4. darbība. Pēc parsētāja beigu / piespiedu apturēšanas mapē Mani dokumenti varat atrast teksta faili(katra ziņa tiek saglabāta atsevišķā failā), kuru nosaukumi tiek ģenerēti, pamatojoties uz ziņu nosaukumiem:

noklikšķiniet uz attēla, lai palielinātu

Ir diezgan daudz darbības jomu, kur var izmantot parseri, bet pamatā tā ir dažādas informācijas vākšana. Attēlus un saites var ātri savākt tikai programmatiski. Parsētāja izmantošana informācijas meklēšanai ļauj automatizēt šo procesu, ievērojami ietaupot laiku. Ja jums ir WordPress vietne, varat to viegli padarīt automātisku pabeigšanu, izmantojot AftParser parsētāju.

ir bezmaksas, universāls WordPress parsētājs. ļauj apkopot saturu no viena vai dažādiem avotiem, apstrādājot to vēlamajā formātā PHP valoda. Parsētājs ir izveidots kā WordPress spraudnis. Pēc parastās spraudņa instalēšanas WordPress konsolē parādīsies parsētāja izvēlne, kā attēlā.

Parsētājam ir divi galvenie rīki: WordPress vietņu parsētājs un WordPress RSS parsētājs.

Parser for WordPress var:

1. Parsē datus no saitēm

Jums vienkārši jānorāda saites uz avotu. Ja saišu nav, parsētājs tās var savākt. Norādiet ceļu uz vietnes karti, un satvērējs apkopos visas saites. Vai arī varat savākt saites no jebkura html lapas. Saites var filtrēt atbilstoši jums nepieciešamajiem kritērijiem. Ir divi saišu filtri, ar kuriem var mainīt parsēšanas nosacījumus. Jaudīgie lietotāji var izveidot makro parsēšanai, kas padara parsētāju ļoti elastīgu viņu vajadzībām.

2. Parsē RSS plūsmas datus

Šeit viss ir vienkārši, ievadiet vajadzīgās plūsmas URL un noklikšķiniet uz Sākt parsēšanu.
Viens no iespējamajiem WordPress parsētāja izmantošanas veidiem ir vietnes ziņu sleju aizpildīšana, izmantojot tādus informācijas avotus kā emuāri, RSS plūsmas, VKontakte lapas utt. Konkurenti - WP-O-Matic, FeedWordPress, CyberSyn.

Es piedāvāju jums universālu WordPress Grabber WP UniParser. Šis spraudnis ir universāls pielāgots parsētājs. Veidojot ziņas, spraudnis var tulkot saturu caur Google pakalpojums Tulko, izmantojot jebkuru valodu pāri.

Klientu atsauksmes

Meklēšanas tēmu, kurā bija apmēram 6-7 atsauksmes, moderatori izdzēsa (viņi saka, ka produkts neatbilst foruma noteikumiem). Neskatoties uz to, vienu pārskatu var izlasīt mulnet un armada forumā. Ir arī emuāru autoru atsauksmes: šeit un šeit. Nesen nejauši uzdūros šim apskatam.

Galvenā funkcionalitāte

Manis izveidotais WP UniParser spraudnis var veikt šādas darbības:
izvilkt saturu no vietnes jebkuros dzinējos(parsētājs ir konfigurēts, izmantojot regulāras izteiksmes un ierobežojumu virknes, iestatīšana ir ļoti vienkārša, es visu paskaidrošu un parādīšu, turklāt ir );
izgrieziet no satura skriptus, komentārus, saites, veidlapas, attēlus, laidumus, objektus, kā arī visus jūsu norādītos fragmentus.
publicēšanas grafiku amata vietas;
ievietojiet analizētos materiālus jūsu definētajā kategorijā (vai nejauši sadaliet tos kategorijās);
realizēt automātiskā tulkošana (jebkurā virzienā) jebkurā Google tulkotāja atbalstītajā valodā.

Vairāk par spraudņa funkciju kopu varat uzzināt tā administratora paneļa ekrānuzņēmumā:

Tāpat, lai pilnībā izprastu universālā greifera darbību, ir vērts.