Estrazione, geolocalizzazione e rappresentazione di dati spaziali 2017-11-06T11:40:16+00:00

Project Description

L’idea è quella di effettuare scraping sul sito www.immobiliare.it scaricando informazioni relative alle case in vendita nella provincia di Milano, procedere quindi con la geolocalizzazione degli indirizzi indicati negli annunci (ottenimento quindi di latitudine e logitudine) e infine rappresentazione di tali dati. Di seguito una descrizione maggiormente esaustiva sui vari passaggi di questo progetto, con un focus particolare sugli strumenti utilizzati e le finalità delle varie fasi.
Fase preliminare: Il primo passo è stato quello di scegliere il portale di vendite case da cui fosse possibile ottenere quante più informazioni possibili senza blocchi, minimizzando i valori mancanti, ridondanti o errati effettuando test di importazione.
Scraping: una volta deciso il portale ho proceduto con lo scraping delle informazioni necessarie tramite import.io, nella prima fase sono state estratti tutti i link dei singoli annunci presenti nelle varie pagine mentre nella seconda fase partendo dai link ai singoli annunci sono state estratti tutti i dati di nostro interesse di ogni annuncio.
Geolocalizzazione: partendo dagli indirizzi relativi ai singoli annunci è stata effettuata una prima fase di pulizia, e quindi tramite R, e in particolare le API di Google Maps, e quindi sono stati geolocalizzati ottenendo così i dati sulla longitudine e latitudine
Rappresentazione dati: partendo da un subset dei dati geolocalizzati ho proceduto tramite diversi pacchetti di R con il costruire una rappresentazione spaziale di tali dati, mettendo in mostra in particolare come rendere effettivamente tali dati “spaziali”, come definire delle proiezioni spaziali e infine il plotting finale su mappa.

Project Details

Skills Needed:

Categories: