Sitio dedicado a las Relaciones Comerciales
Sitio dedicado a las Relaciones Comerciales

NVIDIA acelera Apache Spark, la plataforma líder de Datos

NVIDIA anunció que está colaborando con los líderes de la comunidad de código abierto para incorporar la aceleración por GPU integral a Apache Spark 3.0.

Otro aspecto revolucionario es que la capacitación del modelo de IA podrá procesarse en el mismo clúster de Spark, en lugar de ejecutar las cargas de trabajo.

“El análisis de datos es el mayor desafío informático de alto rendimiento que enfrentan las empresas e investigadores actuales”, dijo Manuvir Das, jefe de Informática Empresarial de NVIDIA.

“La aceleración del GPU nativa para toda la línea de Spark 3.0, desde ETL hasta capacitación e inferencia, ofrece el rendimiento y la escalabilidad necesarios para finalmente conectar el potencial de big data con el poder de la IA”.

Aprovechando su sociedad en IA con NVIDIA, Adobe es una de las primeras compañías  que trabaja con una versión preliminar de Spark 3.0 que se ejecuta en Databricks.

Adobe logró siete veces la mejora del rendimiento y un ahorro de costos del 90% en una prueba inicial, utilizando análisis de datos acelerados por GPU para el desarrollo de productos en Adobe Experience Cloud y recursos de soporte que impulsan los negocios digitales.

El avance en el rendimiento en Spark 3.0 mejora la precisión del modelo ya que permite a los científicos entrenar modelos con conjuntos de datos más grandes y repetir los entrenamientos con mayor frecuencia. Esto proporciona nuevas y poderosas capacidades para aquellos que necesitan procesar terabytes de datos nuevos todos los días, como los científicos de datos que respaldan los sistemas recomendados en línea o analizan nuevos datos de investigación.

Además, un procesamiento más rápido significa que se necesitan menos recursos de hardware para entregar resultados, lo que proporciona un ahorro de costos significativo.

“Hemos notado un rendimiento mucho más rápido con Spark 3.0 acelerado por NVIDIA, en comparación con la ejecución de Spark en CPU”, dijo William Yan, Director Senior de Machine Learning de Adobe.

Databricks y NVIDIA aportan más velocidad a Spark.

Apache Spark es una creación de los fundadores de Databricks, cuya plataforma de análisis de datos unificada y basada en la nube, se ejecuta en más de un millón de máquinas virtuales cada día. 

Transferencias de datos y ETL más rápidos en Spark con las GPUs de NVIDIA.

Dejar un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.


Notice: Undefined index: total_count_position in /home/k0mpf7f5n5g3/lrcmagazine.com.mx/wp-content/plugins/social-pug/inc/functions-frontend.php on line 46
shares