MILANO – Cloudera, Inc., (NYSE: CLDR), the enterprise data cloud company, ha annunciato che Cloudera Data Platform (CDP) integrerà RAPIDS Accelerator per Apache Spark 3.0. Distribuito sulle piattaforme di elaborazione NVIDIA, il software consente alle imprese di accelerare le pipeline di dati e spingere i limiti delle prestazioni dei dati e dei flussi di lavoro di machine learning (ML) per favorire l’adozione dell’AI e fornire migliori risultati di business, senza modificare alcun codice. Con il rilascio di Applied ML Prototypes (AMPs) in CDP e la potenza dell’elaborazione NVIDIA, clienti come l’Internal Revenue Service (l’agenzia governativa deputata alla riscossione dei tributi degli Stati Uniti) e l’Office for National Statistics UK possono non solo avviare out of the box casi d’uso di ML, ma accelerare l’elaborazione dei dati e la creazione dei modelli a un costo inferiore su qualsiasi implementazione on-premise, cloud pubblico o ibrido.
I data engineer aziendali utilizzano set di dati su grandezza e scala mai viste prima, come la trasformazione dei modelli di supply chain, la risposta adeguata alla crescita delle frodi o lo sviluppo di nuove linee di prodotti. Per i data scientist, i colli di bottiglia creati dalle enormi quantità di dati hanno un impatto diretto sul costo e sulla velocità con cui le aziende possono far operare i modelli in tutta l’organizzazione. L’integrazione tra Cloudera e NVIDIA darà alle aziende la capacità di rispondere rapidamente alle sfide di business emergenti fornendo analisi approfondite.
“Dobbiamo essere in grado di prendere decisioni accurate in tempi rapidi sfruttando grandi quantità di dati. Si tratta di una sfida continua, poiché i volumi e le velocità dei dati continuano ad aumentare”, ha dichiarato Joe Ansaldi, IRS/Research Applied Analytics & Statistics Division (RAAS)/Technical Branch Chief. “L’integrazione tra Cloudera e NVIDIA ci consentirà di utilizzare informazioni approfondite e data-driven per alimentare casi d’uso mission-critical quali il rilevamento delle frodi. In fase di implementazione di questa integrazione, stiamo già riscontrando miglioramenti della velocità di oltre tre volte per i nostri workflow di data engineering e data science”.
Per ogni azienda che si trova alle prese con enormi set di dati, una pipeline di data science accelerata da GPU open-source fa la differenza tra essere in grado di formare i modelli o non essere in grado di farlo del tutto. Una pipeline di questo tipo può potenziare direttamente la capacità di trasformazione di un’organizzazione usando l’intelligenza artificiale. Apache Spark 3 accelerato da GPU viene eseguito senza problemi su CDP, consentendo alle organizzazioni di supportare le esigenze di HPC, AI e scienza dei dati – dalla ricerca alla produzione – con una piattaforma sicura, scalabile e aperta per il machine learning.
“In un momento in cui la velocità è tutto, le aziende si affidano alla potenza dei dati più che mai. La nostra collaborazione con NVIDIA darà ai clienti la spinta di cui hanno bisogno per comprendere meglio i loro dati e realizzare il vero potenziale di trasformazione dell’AI”, ha dichiarato Arun Murthy, Chief Product Officer di Cloudera. “Le esperienze analitiche di CDP sono costruite appositamente per consentire agli specialisti dei dati di gestire con fiducia la crescita esponenziale dei dati e l’analisi dei dati in silo, operando su più cloud pubblici e privati. Approfondire la nostra attuale integrazione con NVIDIA è un passo naturale per noi. I nostri clienti saranno in grado di mantenere il vantaggio competitivo che già possiedono utilizzando i nostri servizi enterprise data cloud”.
“Apache Spark è una pietra miliare delle pipeline di machine learning e data analytics su cui le imprese fanno affidamento per rimanere competitive”, ha dichiarato Scott McClellan, Senior Director, Data Science Product Group di NVIDIA. “La potenza di elaborazione del calcolo accelerato di NVIDIA e l’analisi di Spark in esecuzione su Cloudera Data Platform offrono la flessibilità necessaria per rispettare le scadenze quando il tempo è essenziale e risparmiare sui costi quando la bottom line è importante.”