I Big Data, che non sono altro che un grande volume di dati, strutturati e non strutturati, inondano le aziende giorno dopo giorno. Questi, se ben sfruttati offrono alle aziende molteplici opportunità, tra cui previsioni più accurate sull’attività del mercato di riferimento e una maggiore efficienza complessiva
Dove trovare i Big Data? Sono importanti perché oltree alle persone, anche le aziende generano sempre più dati ogni anno. Secondo un report dell’International Data Corporation, solo nel 2010 nel mondo sono stati creati 1,2 zettabyte (1,2 trilioni di gigabyte) di nuovi dati. Ed entro il 2025, potrebbero aumentare a 175 zettabyte (175 trilioni di gigabyte). Di conseguenza anche il mercato dei Big Data è destinato ad aumentare, raddoppiando da un valore di partenza di 169 miliardi di dollari relativo al 2018, a 274 miliardi di dollari nel 2027.
Che cosa sono i Big Data?
Con il termine Big Data si fa riferimento sia ad un ampio e complesso set di dati, sia a metodi utilizzati per elaborarli. In particolare, i Big Data hanno quattro caratteristiche principali, spesso note come “le quattro V”:
- Volume: in quanto i Big Data, da come si intuisce dal nome, si distinguono per i volumi molto elevati.
- Varietà: perché un set di Big Data contiene, come anticipato, dati strutturati, semi-strutturati e non strutturati.
- Velocità: per il fatto di essere generati rapidamente e elaborati in tempo reale.
- Veridicità: relativa all’accuratezza dei Big Data che è estremamente importante.
Dove trovare i Big Data?
I Big Data per contare veramente qualcosa devono essere sottoposti ad un’accurata analisi. Solo in questo modo è possibile ricavare da essi utili informazioni di valore in grado di portare a decisioni aziendali migliori e a mosse strategiche di business. In molti, però, non sanno da dove iniziare. Così, i set di dati pubblici rappresentano il punto di partenza perfetto. Ecco dove trovarli per poter iniziare ad analizzarli gratuitamente.
Big data su Dataset Search
Dataset Search è un motore di ricerca che permette di cercare e ottenere set di dati da milioni di database indicizzati da Google, utili ad essere integrati nei Big Data. In particolare, è possibile trovare online dataset relativi a geografia e geoscienza, biologia e agricoltura. In più, sono disponibili anche dati governativi e delle comunità scientifiche come quelle universitarie.
Google Trends
Google Trends gestito da Google è uno dei più interessanti e ampi dataset pubblici da analizzare. In pratica Google monitora i dati sui termini cercati per mostrare ciò che gli utenti maggiormente ricercano con estrema facilità. Infatti, basta inserire uno o più termini e fare clic sull’apposito pulsante che permette di analizzare i dati all’esterno di Google Trends. In più, il sito web mette a disposizione altre funzionalità, come i filtri per restringere la ricerca dei trend in base alla posizione, intervalli temporali e specifici tipi di ricerca. Inoltre, nella homepage di Trends è possibile vedere quali sono gli argomenti più cercati al momento e quelli attualmente più di tendenza.
Data Science Central e i Big Data
Data Science Central a cura di Vincent Granville funge da hub di risorse online per quasi tutto ciò che riguarda la data science e i Big Data.
insideBIGDATA
InsideBIGDATA a cura di Rich Brueckner si concentra sugli aspetti della data science che riguardano l’apprendimento automatico. Infatti, tratta in particolare i Big Data in campo informatico e aziendale, l’apprendimento automatico, il deep learning e l’intelligenza artificiale.
Dataconomy
Dataconomy di Dataconomy Media è un’importante risorsa messa a disposizione dei futuri data scientist. Infatti, oltre a presentare le notizie sui Big Data, le tendenze in campo tecnologico e editoriali curati da esperti del settore offre risorse per intraprendere una brillante carriera nella data science. In particolare, il sito contiene una raccolta gratuita di ricerche in campo informatico e delle guide per chi è agli inizi.
Kaggle e i Big Data
Kaggle è il sito di riferimento per i data scientists di tutto il mondo. Questo contiene un insieme diversificato di interessanti dataset forniti in modo indipendente per l’apprendimento automatico. Questo è utile specie se si è alla ricerca di set di dati di nicchia. Infatti, prima della ricerca è possibile specificare le categorie più appropriate per essere cerchi che i set di dati siano quelli più adatti.
Facebook Graph
Nonostante la maggior parte delle informazioni sul profilo degli utenti Facebook sia privata, Facebook Graph è un open data relativo ai dati che gli utenti hanno piacere di condividere con tutto il mondo, o che non nascondono perché non conoscono come funzionano le impostazioni della privacy.
Big Data su Data.gov
Il governo degli Stati Uniti grazie a Data.gov ha reso disponibili on-line e in maniera completamente gratuita tutti i dati del governo, dal clima al crimine.
Unione Europea Open Data
Sulla falsariga di Data.gov, Unione Europea Open Data mette a disposizione un’infinità di informazioni relative alla vita dei cittadini dell’Unione Europea, dai dati geografici fino all’istruzione.
Earthdata
Earthdata fa parte del programma Earth Science Data Systems Program della NASA e dell’Earth Observing System Data and Information System (EOSDIS). Quest’ultimo ha la funzione di elaborare e distribuire i dati scientifici della Terra provenienti da satelliti di osservazione terrestre, aeromobili e misurazioni sul campo. Pertanto, grazie a Earthdata, gli utenti possono accedere non solo ai dati relativi a:
- atmosfera terrestre,
- radiazioni solari,
- criosfera (zone artiche e ghiacciate),
- oceani,
- superficie terrestre (gravità, geomagnetismo, tettonica),
- ambienti antropici,
ma anche a notizie e alle informazioni sugli eventi della NASA.
Amazon Web Services Public Datasets
Amazon Web Services Public Datasets è un’enorme risorsa di dati pubblici. Comprende il Progetto Genoma 1000, che altro non è che un tentativo di ricostruire il database più completo sulle informazioni genetiche umane corredato dal database di immagini satellitari della Terra della NASA.
CIA World Factbook
Sul sito CIA World Factbook è possibile trovare informazioni sulla storia, sulla popolazione, sull’economia, sul governo, sulle infrastrutture e sulle potenze militari di 267 Paesi.
Altri dataset online
Ovviamente la lista non finisce qui. Online è possibile trovare un’infinità di siti che mettono a disposizione stati regionali, nazionali, internazionali e mondiali. Basti pensare all’archivio di Big Data dell’Istat che ha avuto un successo internazionale specie tra i Nerd, come PEW Research per quanto riguarda i dati relativi all’USA. E ancora:
- Intelligenza Artificiale Italia dove è possibile scaricare oltre 700 dataset con la loro descrizione
- Set di dati ML di Wikipedia: per l’apprendimento automatico, inclusi segnali, immagini, suoni e testo.
- Dati demografici e GDP, GINI index e fatti su: IndexMundi – Country Facts, Data | The World Bank, The World Factbook, Palgrave Connect.
- Open Data Institute – node Trento per tweet geo-referenziati raccolti nell’area di Milano, dati aggregati sul traffico telefonico, su precipitazioni e temperatura. E anche sulle utenze elettriche, News geo-referenziate e sulla qualità dell’aria.
- MovieLens per dataset che potrebbero servire a costruire sistemi di raccomandazione.
- Data @ Quora per dati di testo.
Infine, un ultimo tip. Per trovare dataset online è possibile usare anche l’explorer di Google chiamato Google Public Data Explorer.
Business Intelligence Group Srl, grazie alla propria infrastruttura High Performance Computing, risulta essere l’unica società Start Up Innovativa in Italia capace di realizzare Modelli Previsionali, Sistemi di Business Intelligence, Geomarketing e Ricerche di Mercato per far crescere qualsiasi tipo di impresa.
Contatta Business Intelligence Group per avere maggiori informazioni sui servizi professionali.