Gwida għal Semalt dwar Estensjoni tal-barraxa għal Chrome

Sabiex kwalunkwe negozju jgħix u fl-aħħar jikber, huwa meħtieġ li tibqa '' l quddiem mill-kompetituri tagħha u diversi riskji. Li tieħu deċiżjonijiet ibbażati fuq dejta analitika huwa mod żgur li tinsa 'dawn il-problemi. Din id-dejta tista 'tkun akkwistata permezz ta' skrappjar ta 'dejta. Dak hu fejn tidħol estensjoni faċli tal- barraxa għal Chrome: mhux biss tiffaċilita l-proċess tal-ħsad tad-dejta imma wkoll tagħmilha possibbli li tinbarax fuq il-moviment mingħajr setup kumplikat.

Kif tuża barraxa

    1. L-ewwel ħaġa li trid tagħmel hu li tinstalla l-estensjoni, ħalli ras fuq il-maħżen tal-web chrome, tfittex "barraxa" u kklikkja fuq żid lil Chrome.

    2. Innaviga lejn il-websajt li biħsiebek tinbarax id-dejta minn, immarka l-entrata li inti interessat fiha billi tenfasizzaha. Ikklikkja dritt fuqha u agħżel "jinbarax simili" fuq il-menu li joħroġ.

    3. Meta tagħmel hekk se tniedi tieqa ta 'console separata tal-barraxa. Hawnhekk, tara lista tad- dejta mibruxa .

    4. Biex issalva l-kontenut, ikklikkja fuq "ħlief għal dokumenti Google," dan awtomatikament jesporta d-dejta lejn spreadsheet ta 'Google.

Brix estiż

Fil-każ li qed tippjana li tinbarax aktar dejta, tista 'tuża l-approċċ avvanzat. Nota, se jkun ħafna iktar faċli li taħdem ma 'l-għodda jekk għandek xi għarfien ta' HTML. Ejja ngħidu li riedu jinbarax dejta minn sors li għandu arkivju bbażat fuq dejta tas-serje tal-ħin. F'każ bħal dan, jekk tipprova l-metodu deskritt hawn fuq, ikollok id-dejta mħabbra.

Biex issolvi din il-kwistjoni, tista 'tagħmel użu minn lingwa ta' mistoqsija HTML u XML magħrufa bħala XPath. X'tagħmel? XPath jagħraf id-dejta rigward l-elementi differenti li jinsabu f'kull għażla. Is-segwenti hija gwida dwar kif se nitkellmu dwarha:

1. Mur fil-konsola tal-barraxa, fuq in-naħa ta 'fuq tax-xellug għandek tinnota buttuna "XPath", ikklikkja fuqha u kompli biex tgħaqqad it-tabella inizjali.

2. Għandek bżonn tikteb l-XPath għall-element it-tajjeb. L-XPath attwali li jinkludi l-informazzjoni kollha se jintwera f'format bħal dan "// div [3] / div [3] / div [2] / div". L-elementi <div> se jiġu rikonoxxuti fid-dokument HTML mill-kompjuter.

3. Biex tissepara d-dejta rikonoxxuta, trid tuża l-kolonni tal-barraxa. Biex tagħmel dan, trid tfittex it-tipi differenti ta 'informazzjoni li għandek disponibbli. Skont id-dejta li tkun qed toqtol, jista 'jkollok titli. Dawn it-titoli huma preżenti ħdejn kull sett ta 'dejta. Huma akkumpanjati minn tikketta, f'dan il-każ, minn tag <b>.

4. Meta tuża l-element spezzjona ssib u żid it-tag <b> mal-XPath tiegħek. Issa tista 'tikketta din l-ewwel kolonna bħala "kolonna tat-titlu" peress li se telenka t-titoli. Ipproċedi biex toħloq XPaths differenti għal kull kolonna li għandek bżonn.

5. Ikklikkja fuq il-barraxa u l-estensjoni awtomatikament taħsad id-dejta u torganizzaha fil-kolonni differenti li stabbilixxajt.