Back to Question Center
0

Trid tiftakar id-data tal-Web? Semalt Tintroduċi Software tal-Estrazzjoni tad-Dejta Ħieles tal-Web

1 answers:

L-informazzjoni minn websajt hija teknika kkumplikata użata minn kumpaniji differenti. L-organizzazzjonijiet li jixtiequ jiġbru l-volumi ta 'dejta dwar ċerti suġġetti jistgħu jibbenefikaw mill-programmi li ġejjin:

1. Scraper

Scraper hija estensjoni Chrome li għandha firxa estensiva ta 'karatteristiċi. Mhuwiex biss barraxa tad-data iżda riċerkatur ta 'keyword. Mhuwiex għodda eċċezzjonalment sofistikata li tista 'tesporta d-data tiegħek lill-Spreadsheets Google. Id-data tiegħek tiġi kkupjata u maħżuna fl-ispreadsheets tagħha, grazzi għall-OAuth biex ikun possibbli - online logo maker for free 3d. Scraper hija kbira kemm għall-programmaturi kif ukoll għan-non programmaturi.

2. Web Harvest

Web Harvest ġejja b'għażliet ta 'konfigurazzjoni differenti u huwa programm kbir ta' estrazzjoni open source data. Huwa miktub f'Java u jiġbor data minn websajts kemm bażiċi kif ukoll avvanzati. Web Harvest prinċipalment jimmira lejn il-paġni tal-web ibbażati fuq XML jew HTML.

3. Scrapy

Scrapy hija għodda oħra mill-isbaħ brix . Huwa qafas ta 'tkaxkir sħiħ b'għexieren ta' karatteristiċi u għażliet. Scrappy topera malajr u ġġib il-formati mixtieqa tad-data. Jista 'jintuża biss meta tkun installajt Python fuq it-tagħmir tiegħek. Barra minn hekk, jeħtieġ li jkollok għarfien bażiku ta 'dan il-lingwa ta' programmar.

4. FMiner

FMiner hija waħda mill-aqwa u l-iktar għodda ta 'estrazzjoni tad-data. Meta mqabbel ma 'programmi simili oħra, FMiner huwa aktar affidabbli u għandu karatteristiċi aħjar. Jestratta d-dejta anki mill-aktar websajts ikkumplikati u jappoġġja l-formati tal-JavaScript u AJAX. Jiġrilek ukoll id-data fil-formati MySQL u Oracle, skont ir-rekwiżiti tiegħek.

5. Outwit

OutWit huwa wieħed mill-aktar programmi ta 'estrazzjoni tad-data li huma l-aktar coolest u utli. Hija l-estensjoni Firefox b'ħafna proprjetajiet ta 'estrazzjoni ta' data. Outwit tissimplifika t-tfittxija fuq l-internet tiegħek u tgħinek tfittex permezz ta 'paġni tal-web differenti awtomatikament.

6. Toolbar tad-Data

Toolbar tad-Data tista 'awtomatizza l-proċess tal-brix tad-data għall-faċilità tiegħek. Jekk qed tfittex li tiġbor dejta minn paġni tal-web differenti u għandek bżonn informazzjoni fuq il-punt, trid tipprova Data Toolbar.

8. iMacros

L-aqwa karatteristika ta 'iMacros hija li tista' awtomatizzati kompiti ripetittivi. Jekk tridx tużah fil-Firefox jew Google Chrome, iMacros jappoġġja l-browsers kollha u jgħinek tinnaviga permezz ta 'numru kbir ta' paġni tal-web. Barra minn hekk, jgħin tikkonverti t-tabelli u l-listi tal-web f'informazzjoni użabbli.

9. Google Web Scraper

Dan huwa programm ta 'estrazzjoni tad-dejta bbażat fuq il-browser li jaħdem bħal Outwit and Import. io. Google web scraper hija mfassla biex tiġbed data minn kemm test u fajls PDF. Int għandek tenfasizza d-data li għandek bżonn, u din l-għodda tagħtik kopji mixtieqa f'siegħa. Tista 'ssalva d-data tiegħek lil Google Drive.

10. Estratt

Extracty huwa programm ta 'brix li huwa relattivament ġdid għadu aqwa li huwa mħaddem bit-teknoloġija tat-tagħlim bil-magna. Tista 'toħloq APIs ma' dan il-programm u ttraċċa websajt sħiħa f'sekondi.

December 22, 2017