There is growing interest in running Spark natively on Kubernetes (see https://github.com/apache-spark-on-k8s/spark). Spark applications often access data in HDFS, and Spark supports HDFS locality by scheduling tasks on nodes that have the task input data on their local disks. When running Spark on Kubernetes, if the HDFS daemons run outside Kubernetes, applications will slow down while accessing the data remotely. In this webinar, we will demonstrate how to run HDFS inside Kubernetes to speed up Spark. In particular, we will show: - Spark scheduler can still provide HDFS data locality on Kubernetes by discovering the mapping of Kubernetes containers to physical nodes to HDFS datanode daemons.

Hora

20:00 - 21:00 hs GMT+1

Organizador

Pepperdata
Compartir
Enviar a un amigo
Mi email *
Email destinatario *
Comentario *
Repite estos números *
Control de seguridad
Abril / 2026 222 webinars
Lunes
Martes
Miércoles
Jueves
Viernes
Sábado
Domingo
Lun 30 de Abril de 2026
Mar 31 de Abril de 2026
Mié 01 de Abril de 2026
Jue 02 de Abril de 2026
Vie 03 de Abril de 2026
Sáb 04 de Abril de 2026
Dom 05 de Abril de 2026
Lun 06 de Abril de 2026
Mar 07 de Abril de 2026
Mié 08 de Abril de 2026
Jue 09 de Abril de 2026
Vie 10 de Abril de 2026
Sáb 11 de Abril de 2026
Dom 12 de Abril de 2026
Lun 13 de Abril de 2026
Mar 14 de Abril de 2026
Mié 15 de Abril de 2026
Jue 16 de Abril de 2026
Vie 17 de Abril de 2026
Sáb 18 de Abril de 2026
Dom 19 de Abril de 2026
Lun 20 de Abril de 2026
Mar 21 de Abril de 2026
Mié 22 de Abril de 2026
Jue 23 de Abril de 2026
Vie 24 de Abril de 2026
Sáb 25 de Abril de 2026
Dom 26 de Abril de 2026
Lun 27 de Abril de 2026
Mar 28 de Abril de 2026
Mié 29 de Abril de 2026
Jue 30 de Abril de 2026
Vie 01 de Abril de 2026
Sáb 02 de Abril de 2026
Dom 03 de Abril de 2026

Publicidad

Lo más leído »

Publicidad

Más Secciones »

Hola Invitado