A text-mining system must go way beyond indexing and search to appear truly intelligent. First, it should understand language beyond keyword matching. (e.g. distinguishing between “Jane has the flu,” “Jane may have the flu,” “Jane is concerned about the flu," “Jane’s sister has the flu, but she doesn’t,” or “Jane had the flu when she was 9” is of critical importance.) This is a natural language processing problem. Second, it should “read between the lines” and make likely inferences even if they’re not explicitly written. (e.g. if Jane has had a fever, a headache, fatigue, and a runny nose for three days, not as part of an ongoing condition, then she likely has the flu.) This is a semisupervised ML problem. Third, it should automatically learn the right contextual inferences to make. (e.g. learning on its own that fatigue is sometimes a flu symptom—only because it appears in many diagnosed patients—without a human ever explicitly stating that rule.) This is an association-mining problem, which can be tackled via deep learning or via more guided ML techniques. David Talby leads a live demo of an end-to-end system that makes nontrivial clinical inferences from free-text patient records and provides real-time inferencing at scale. The architecture is built out of open source big data components: Kafka and Spark Streaming for real-time data ingestion and processing, Spark for modeling, and Elasticsearch for enabling low-latency access to results. The data science components include spaCy, a pipeline with custom annotators, machine-learning models for implicit inferences, and dynamic ontologies for representing and learning new relationships between concepts. David Talby is Atigeo’s CTO, working to evolve its big data analytics platform to solve real-world problems in healthcare, energy, and cybersecurity. David has extensive experience in building & operating web-scale data science and business platforms, as well as building world-class, Agile, distributed teams.

Hora

19:00 - 20:00 hs GMT+1

Organizador

Big Data Analytics
Compartir
Enviar a un amigo
Mi email *
Email destinatario *
Comentario *
Repite estos números *
Control de seguridad
Octubre / 2025 370 webinars
Lunes
Martes
Miércoles
Jueves
Viernes
Sábado
Domingo
Lun 29 de Octubre de 2025
Mar 30 de Octubre de 2025
Mié 01 de Octubre de 2025
Jue 02 de Octubre de 2025
Vie 03 de Octubre de 2025
Sáb 04 de Octubre de 2025
Dom 05 de Octubre de 2025
Lun 06 de Octubre de 2025
Mar 07 de Octubre de 2025
Mié 08 de Octubre de 2025
Jue 09 de Octubre de 2025
Vie 10 de Octubre de 2025
Sáb 11 de Octubre de 2025
Dom 12 de Octubre de 2025
Lun 13 de Octubre de 2025
Mar 14 de Octubre de 2025
Mié 15 de Octubre de 2025
Jue 16 de Octubre de 2025
Vie 17 de Octubre de 2025
Sáb 18 de Octubre de 2025
Dom 19 de Octubre de 2025
Lun 20 de Octubre de 2025
Mar 21 de Octubre de 2025
Mié 22 de Octubre de 2025
Jue 23 de Octubre de 2025
Vie 24 de Octubre de 2025
Sáb 25 de Octubre de 2025
Dom 26 de Octubre de 2025
Lun 27 de Octubre de 2025
Mar 28 de Octubre de 2025
Mié 29 de Octubre de 2025
Jue 30 de Octubre de 2025
Vie 31 de Octubre de 2025
Sáb 01 de Octubre de 2025
Dom 02 de Octubre de 2025

Publicidad

Lo más leído »

Publicidad

Más Secciones »

Hola Invitado