Introducción a las menciones

Módulo Computación Científica

Prof. Cristian Barrera Hinojosa

cristian.barrera@uv.cl

Módulo Computación Científica

Contenido: un resumen breve de los temas que pueden aprender en la mención.

Evaluación: una prueba de selección múltiple sobre conceptos y cálculos cortos.

Fecha de Prueba: 17 de julio

La licenciatura y las menciones

La malla de la mención

La malla de la mención

Unix, Redes y Programación

Unix, Redes y Programación

Unix, Redes y Programación

Lenguaje: Bash

Lenguaje: C

La malla de la mención

Métodos numéricos

Métodos numéricos

Lenguaje: C

La malla de la mención

Bases de datos y visualización

Bases de datos y visualización

Lenguaje: Python

La malla de la mención

Programación paralela

Programación paralela

Lenguaje: C

Inteligencia artificial (machine learning)

Inteligencia artificial (machine learning)

Lenguaje: Python

La malla de la mención

Programación GPU

Programación GPU

Lenguaje: C/CUDA

¿Por qué estudiar la mención en computación científica?

Ciencia y computación

La imagen clásica de un astrónomo

Ciencia y computación

La realidad moderna

Ciencia y computación

A veces los meteorólogos trabajan así...

Ciencia y computación

Es mucho más común que trabajen así

Ciencia y computación

Aunque los físicos siguen usando el pizarrón...

Ciencia y computación

...hoy en día usan los computadores para los cálculos más complejos

Ciencia y computación

La ciencia, hoy en día, es computacional

La computación fuera del mundo científico

El mundo digital

Internet, redes sociales, smartphones, tablets, "internet of things"

La economía digital

En 2018, las empresas más grandes del mundo (en capitalización bursátil) eran:

  • 1) Apple
  • 2) Alphabet (dueño de Google)
  • 3) Microsoft
  • 4) Amazon
  • ...
  • 8) Facebook

3 de estas empresas no existían antes del Internet, y ninguna existió antes de los computadores modernos!

Datos masivos (Big Data)

Datos, datos y más datos

Datos masivos en la ciencia

Los experimentos científicos también están generando muchos datos hoy en día

  • LHC: 25 GB/segundo
  • Vera Rubin: 15 TB/noche
  • E-ELT: 8 TB "cubo de datos" (una imagen) del instrumento MICADO (IFU)

El procesamiento de tantos datos (limpiar, analizar, etc.) es imposible en la manera "tradicional" (manual)...

Machine Learning:

Algoritmos que "aprenden" por si mismo. (Aprendizaje de máquina)

Son parte del campo de Inteligencia Artificial (IA)

Son algoritmos (programas) que resuelven problemas que, tradicionalmente, eran más fáciles para los humanos.

Ejemplo: internet

Instagram, Facebook, Netflix, YouTube...

Todos utilizan algoritmos de machine learning que filtran lo que ves en tu feed o las recomendaciones que recibes.

El problema es que los algoritmos eligen contenido que aumenta el tiempo de uso del sitio...

Ejemplo: vehículos autónomos

Ejemplo: reconocimiento facial

Ejemplo: reconocimiento de emociones

Ejemplo: trading algorítmico

Ejemplo: diagnosticos medicos

Generación de contenido por IA

  • Música
  • Arte
  • Videos (deepfakes)
  • Texto
  • ...

Acceso a los datos...

El análisis de datos es sólo una parte. También necesitamos bases de datos eficientes para guardar y acceder los datos en una manera útil (es decir, rápidamente).

No queremos que sea necesario buscar cuidadosamente en todos los datos para encontrar lo que necesitamos.

Ciencia de datos

Necesitamos bases de datos que sean eficientes, y métodos de análisis de datos masivos que son precisos y rápidos $\Rightarrow$ ciencia de datos.

Una rama de la ciencia que es muy nueva, y muy interdisciplinaria.

El trabajo de los científicos hoy en día

¿Qué necesita saber un científico hoy en día? Necesita saber...

  • ...sobre la ciencia de datos.
  • ...como organizar los datos, y como analizarlos.
  • ...los algoritmos que se puede aplicar para obtener resultados útiles, especialmente en el caso de tener datos que no caben en un computador (i.e. trabajar en remoto, y en paralelo).
  • ...cual algoritmo es el más apto para la tarea.
  • ...la mejor manera de presentar los datos y los resultados (i.e. la visualización de los datos).

Generando datos en simulaciones computacionales

Una gran parte de la computación científica es la generación de datos con simulaciones computacionales.

Cosmología

Meteorología

Física fundamental

La utilidad de las simulaciones

Podemos aprovechar los recursos computacionales que tenemos hoy en día para crear simulaciones de (por ejemplo):

Sistemas físicos

Sistemas biológicos

Sistemas neurológicos

Las simulaciones son muy útiles cuando es imposible hacer experimentos con estos sistemas en el laboratorio. Es como hacer un experimento en el computador.

Las simulaciones: el Cuarto pilar de la ciencia

Simulaciones en la física

Aerodinámica e ingeniería

Simulaciones en la física

Climatología

Simulaciones en la física

Agujeros negros

Simulaciones en la física

LHC - Física de altas energías

Simulaciones en la física

LHC - Física de altas energías

¿Que aprenderás en la mención?

  • Programación en varios lenguajes.
  • Técnicas para trabajar con datos masivos.
  • Uso de herramientas de machine learning y inteligencia artificial en las ciencias físicas.
  • Métodos numéricos para implementar algoritmos de machine learning y para crear simulaciones en la física, ingeniería, etc.
  • Como programar en paralela, para trabajar con supercomputadores y GPUs.
  • Como crear visualizaciones profesionales de datos de simulaciones, observaciones, experimentos, etc.

Resumen

  • La ciencia, hoy en día, es computacional.
  • Entonces, "computación científica" realmente significa ser un científico moderno!
  • En esta mención aprenderás las capacidades requeridas para acceder, procesar, analizar, visualizar y generar datos computacionalmente.
  • Estas capacidades son cruciales para trabajar en la astronomía, física, meteorología, e incluso para trabajo fuera de la academia.

Resumen

Por lo tanto, esta mención es muy flexible, y ofrece la gama más amplia de opciones para el trabajo después de graduarse: se puede trabajar en ciencia, o se puede trabajar fuera de la academia (en la industria), programando, analizando datos, ...