Varios investigadores de la universidad de Rutgers crearon una nueva manera en el refuerzo del aprendizaje (una subarea del aprendizaje de las máquinas) usando procesos de decisión de Markov orientados a objetos (pdf en inglés:
paul.rutgers.edu/~cdiuk/papers/OORL.pdf), que es descrito como una representación que mira a un nivel más alto de lo normal y considera los objetos y las interacciones. Si suena complicado el video lo simplifica. Se muestra como la máquina aprendió a jugar a Pitfall en una Atari 2600.