In questi ultimi anni abbiamo assistito a una crescita esplosiva in ambito data storage e power computing da parte delle aziende. Molte organizzazioni si trovano ora a gestire archivi enormi con una quantità impressionante di dati. Spesso il volume dei dati è persino troppo elevato perché una persona fisica possa effettuare delle analisi, ma fortunatamente vi sono molte applicazioni in grado di trasformare questa mole di informazioni in un vantaggio economico. In particolare, esistono applicazioni comuni che trasformano il dato in un asset in grado, ad esempio, di fornire una previsione sui prodotti che con ogni probabilità verranno venduti maggiormente, oppure di determinare e progettare i migliori prodotti sulla base dei riscontri dei clienti. La disciplina che regola queste applicazioni e teorie è denominata “data mining”. Le tecniche utilizzate nel data mining si basano su statistiche e sull’intelligenza artificiale.
Avanade, società di consulenza IT su scala globale, ha rilasciato un nuovo algoritmo di data mining come plug-in per SQL Server su Codeplex. Il plug-in ospita il noto algoritmo di data mining Support Vector Machine, un’efficace tecnica di data mining generica, in grado di risolvere diversi problemi e che può essere utilizzata in molteplici applicazioni. Questa tecnica è relativamente facile da implementare e, di norma, produce buoni risultati senza necessità di personalizzazione alcuna. Applicazioni comuni per Support Vector Machines sono, ad esempio, l’analisi di testo per il direct marketing, l’analisi di credit rating, le forme di classificazione quali categorizzazione dei testi, scrittura e riconoscimento visivo. Con il plug-in per SQL Server ciascuno è ora in grado di utilizzare Support Vector Machines con Microsoft Data Mining Framework. Il framework fornisce servizi che rendono possibili l’analisi diretta da Excel e automatizzano il processo di data mining.
Il plug-in reso disponibile da Avanade consiste nell’algoritmo di Support Vector Machine come plug-in di SQL Server con un visualizzatore per il data mining. Questo visualizzatore mostra i pattern rilevati dal plug-in in maniera grafica tramite l’utilizzo dell’ambiente Excel 2007. Il plug-in può essere installato su SQL Server 2005 e SQL Server 2008. Essendo il progetto basato su Codeplex, e quindi in modalità open source, ciò consente a ciascun utente di accedere al plug-in e modificare l’algoritmo in base alle proprie specifiche esigenze.
Discussione 0
Ancora nessun commento. Sii il primo a commentare!