Nell’articolo “Software libero per data scientists” dello scorso aprile ho accennato all’abbondanza di software disponibile nel mondo del software libero per la moderna scienza dei dati, quella che ha a che fare con i così detti big data, ed ho allegato all’articolo stesso un manualetto che descrive la dotazione di strumenti di analisi che ci offre il mondo Python, dotazione che trova la sua completezza nella raccolta Anaconda.
Nel testo dell’articolo ho elencato alcuni software, tra cui quello chiamato KNIME, ma, preso dalla foga di Python, ingiustamente non ho detto null’altro di questo gioiello.
Oggi voglio rimediare a questa ingiustizia, quanto meno per richiamare la particolarità che lo caratterizza: si può utilizzare per fare tantissime cose senza scrivere una riga di codice.
Come tutte le cose che qualcun altro ha automatizzato per noi, fa tutte le cose che ha immaginato qualcun altro e non è detto che faccia quelle che vogliamo noi: ma ne fa veramente tante e vanta comunque la possibilità di essere esteso da R o da Python per darci modo di fare quelle poche e rare che non fa lui.
Rigidamente documentato in sola lingua inglese, fortunatamente, dallo scorso marzo, grazie all’editore Apogeo, ha una presentazione in italiano nel volumetto Andrea De Mauro – Big Data Analytics.
Senza permettermi di riscrivere quanto ha già scritto un professionista come De Mauro, ritengo utile proporre l’appunto che allego in formato PDF per una presentazione dell’argomento.
Come sempre il documento allegato è liberamente scaricabile, stampabile e distribuibile.