This session will cover a series of use cases where you can store your data cheaply in files and analyze the data with Apache Spark, as well as use cases where you want to store your data into a different data source to access with Spark DataFrames. Here’s an example outline of some of the topics that will be covered in the talk: Use cases to store in file systems to use with Apache Spark: 1. Analyzing a large set of data files. 2. Doing ETL of a large amount of data. 3. Applying Machine Learning & Data Science to a large dataset. 4. Connecting BI/Visualization tools to Apache Spark to analyze large datasets internally. Use cases to store your data into databases for use with Apache Spark: 1. Random access, frequent inserts, and updates of rows of SQL tables. Databases have better performance for these use cases. 2. Supporting Incremental updates of Databases into Spark. It’s not performant to update your Spark SQL tables backed by files. Instead, you can use message queues and Spark Streaming or doing an incremental select to make sure your Spark SQL tables stay up to date with your production databases. 3. External Reporting with many concurrent requests. While Spark’s ability to cache your file data in memory will allow you to get back to fast interactive querying, that may not optimal for supporting many concurrent requests. It’s better to use Spark to ETL your data to summary tables or some other format into a traditional database to serve your reports if you have many concurrent users to support. 4. Searching content. A Spark job can certainly be written to filter or search for any content in files that you’d like. ElasticSearch is a specialized engine designed to return search results quicker.

Hora

19:00 - 20:00 hs GMT+1

Organizador

Databricks
Compartir
Enviar a un amigo
Mi email *
Email destinatario *
Comentario *
Repite estos números *
Control de seguridad
Diciembre / 2025 263 webinars
Lunes
Martes
Miércoles
Jueves
Viernes
Sábado
Domingo
Lun 01 de Diciembre de 2025
Mar 02 de Diciembre de 2025
Mié 03 de Diciembre de 2025
Jue 04 de Diciembre de 2025
Vie 05 de Diciembre de 2025
Sáb 06 de Diciembre de 2025
Dom 07 de Diciembre de 2025
Lun 08 de Diciembre de 2025
Mar 09 de Diciembre de 2025
Mié 10 de Diciembre de 2025
Jue 11 de Diciembre de 2025
Vie 12 de Diciembre de 2025
Sáb 13 de Diciembre de 2025
Dom 14 de Diciembre de 2025
Lun 15 de Diciembre de 2025
Mar 16 de Diciembre de 2025
Mié 17 de Diciembre de 2025
Jue 18 de Diciembre de 2025
Vie 19 de Diciembre de 2025
Sáb 20 de Diciembre de 2025
Dom 21 de Diciembre de 2025
Lun 22 de Diciembre de 2025
Mar 23 de Diciembre de 2025
Mié 24 de Diciembre de 2025
Jue 25 de Diciembre de 2025
Vie 26 de Diciembre de 2025
Sáb 27 de Diciembre de 2025
Dom 28 de Diciembre de 2025
Lun 29 de Diciembre de 2025
Mar 30 de Diciembre de 2025
Mié 31 de Diciembre de 2025
Jue 01 de Diciembre de 2025
Vie 02 de Diciembre de 2025
Sáb 03 de Diciembre de 2025
Dom 04 de Diciembre de 2025

Publicidad

Lo más leído »

Publicidad

Más Secciones »

Hola Invitado