martes, junio 14, 2011

El don de la sistematicidad (Entrevista a Steven Phillips)

La Teoría de las Categorías es una teoría matemática de gran abstracción en la que se analizan estructuras matemáticas y aquellas relaciones entre las mismas que tienen la propiedad de conservar sus respectivas estructuras internas.Pero en esta teoría puede estar la esencia misma de lo que hace nuestra intuición cuando aplica el conocimiento de un campo a otro distinto que parece semejante. Es por ello que esta teoría puede utilizarse para encontrar analogías entre las cosas que intuitivamente nos resultan similares y extraer las relaciones entre ellas que se nos presenten intuitivamente interesantes, en lugar de considerar cualquier relación o conjunto de relaciones espurias. Con estos filtros de relaciones y esquemas para la inferencia y generalización que aúnan el rigor matemático y la sintonía con la intuición podría haberse encontrado la piedra filosofal necesaria para avanzar en el conocimiento de la organización de la mente y, de paso, lo que es muy importante, de su evolución. Además, en la vertiente práctica, su aplicación permitiría grandes progresos en los campos enlazados de la robótica y la inteligencia artificial. 

Un concepto esencial en esta teoría es el de sistematicidad, que no es otra cosa que la  maravillosamente económica capacidad de la mente para generalizar lo aprendido. La  correcta explicación y el correcto entendimiento de este concepto son claves para entender la cognición humana. La teoría de las categorías parece ser el punto de partida perfecto para ello. Al menos esa es la idea del Doctor Steven Phillips, de la Mathematical Neuroinformatics Group, en el Human Technology Research Institute del National Institute of Advanced Industrial Science and Technology (AIST) en Tsukuba, Japón. Conjuntamente con William H. Wilson de  la School of Computer Science and Engineering de la University of New South Wales en Sydney ha publicado lo que consideramos un extraordinario artículo "A Category Theory explanation for the Systematicity of Human Cognition". Y por eso hemos querido entrevistar al Doctor Phillips, que ha tenido la inmensa amabilidad de responder nuestras preguntas.

En inglés:

Dear Professor Phillips,

We are very impressed by your paper "A Category Theory explanation for the Systematicity of Human Condition" .Although we do not understand fully the mathematics implied in the paper, it seems that there are equivalences between mathematical structures or cognitively speaking "Domains of knowledge" and this correspondence between similar structures or domains can be expressed mathematically as well, So instead to focus the knowledge in terms of concrete objects and relationships, from which there is no way to easily generalize knowledge but itself, it is better to go one higher level, to abstract relationships, broadly speaking.

1.-Let me give an example from my understanding of the problem ( I´m sure I´m wrong,  but this is just for you to build on it):  the action of  "killing" is an abstract relationship because it can apply from the domain of men  to the set of cows  and also to the domain of viruses to the set of men. There is a category of knowledge that includes "to kill" in the abstract sense, that contain its properties: non reflexive, non symmetrical etc, whose knowledge can be aplied to whatever two sets that meet the category requisites. Is this pictureaccurate?

That is part of the picture, and one way to realise systematicity. To put it in simple terms: if you have a process for representing things (A) that can act as killers and a process for representing things that can be killed (B), and you have a process for putting those representations together for a representation of an instance of “A killed B”, then you have a way to doing so for other instance of “A killed B” because all such instances involve one and the same cognitive process.

The other part is to explain why systematicity necessarily follows from the proposed theory of cognitive architecture, which was the original problem that Fodor, Pylyshyn, and McLaughlin raised against the connectionist (neural network) approach: although one can construct a connectionist cognitive architecture that has the systematicity property, one can also construct a connectionist architecture that does not have systematicity. People are generally systematic in their cognitive abilities. So, if your theory permits architectures that have the systematicity property, but also permits architectures that do not have systematicity, then you need a further explanation as to why only the systematic architectures are ever realised. That is, you need an explanation beyond just assuming the systematic ones.

Ken Aizawa wrote an excellent review of the systematicity debate. He discussed in great detail this problem of making the (so called ad hoc) assumption that only the systematic architectures are realised. He also pointed out that classical approaches, too, suffer from the same sort of problem. That is, although one can devise symbol systems with systematicity, one can also devise symbol systems without this property. Hence, neither classical nor connectionist theories fully explain systematicity, even though they both demonstrate systematicity in particular cases.

2.-Stop interpreting you and speak for yourself: Could you explain with a little example of the systematicity of the human mind for "aficionados" ?

A simple example is writing out multi-digit numbers. Once you have the ability to write down the digits zero to nine, and the ability to string them together for some instances of larger numbers, then you can do so for any multi-digit number. That is, you don’t find people who write down the number 123, but not 321.

3.-The relatively new development of  "category theory" in mathematics is revolutionizing many fields in recent times. In computer science there are languages such is Haskell that are almost completely dominated by mathematical structures derived from category theory. What makes category theory so powerful, in explanatory terms, and so useful?

I think the power of category theory stems from a combination of abstraction and precision. By focussing on the relationships between objects (the so-called arrows, or morphisms that constitute a category), the category theory approach can abstract away from superficial problem details. So, category theory is potentially applicable to a wider range of problems.

Of course, psychologists have long recognized the importance of the relationships between entities that make up the structure of a task. But, taking a relational perspective in itself is not enough, since there are generally many more potential relationships between entities than there are entities, which would seem to make the problem even harder. In category theory, the composition of morphisms is also important. How the relationships combine into new relationships conveys important information about the domain of interest. To be a category, morphisms must compose, and their composition must be associative. So not just any collection of relationships makes up a category theory construction. Categories, functors and other constructions are precisely defined (albeit abstractly). If a problem can be recast in category theory terms, then you have access to many of the results already provided by category theorists, which may be useful for addressing the problem at hand.

4.-Besides the practical applications, we are interested in the structure of the human mind. Rather than a practical solution for Artificial Intelligence problems,  do you think that the human mind work that way? The human language reflects somehow  this mathematical underpinning?

Mathematical structures, and in particular, category-theoretic ones can provide very good descriptions of cognition in terms of generality and precision, though they may not be the easiest to understand. However, that is not to say that people go around thinking about pullbacks and pushouts. The underlying mechanisms that these category-theoretic structures describe may be computational, and computational category theory is a field that applies category theory ideas to computation. So, yes, if you regard human cognition as a computational system, then the category theory approach is still within the general spirit of a computational theory of mind.

5.-If this is so, have you any idea about how such sistematicity and abstraction has evolved?. How much must be innate and how much can be acquired with the implicit architecture proposed?. These categories can  be build out of sequentially discovered simple facts?

The relationship between abstraction (and, in particular, adjunctions--which we used to explain systematicity) and development/learning is something I want to pursue. Though it is difficult to say how much is innate, the category theory approach points to multiple levels of representation that are tightly coupled. In the context of learning, it suggests that representations at multiple levels are learned simultaneously. This perspective differs from the connectionist approach whereby more abstract representations are supposed to emerge from a single level of learning driven by adjusting connection weights. In my view, this form of connectionism has had difficulty providing a plausible account for the development of higher cognition. The problem is not with emergence as such, rather it is that whatever does emerge (e.g., regions in activation space that one can identify as corresponding to some more abstract concept) is never directly used by the learning system. So, these sorts of systems require extensive retraining to modify their use of such (abstract) concepts, in ways that humans do not. So I do not expect, for example, adjunctions to be built out of simple facts alone. Rather, the capacity for constructing adjunctions would be part of the basic architecture, and particular adjunctions would require learning/development through interaction with the external world.

6.-What are the practical perspectives of this approach and what are your next steps there at Tsukuba?

One potentially practical application of the category theory approach is in the field of (cognitive) robotics. There are parallels in the ways cognitive science and robotics have progressed over the last few decades, having been influenced by connectionist and behaviourist approaches, respectively. And although both fields have made significant progress in certain areas, researchers are increasingly aware of the limits of these approaches. A next step is to incorporate category theory into the development and implementation of cognitive architecture.

7.-What are you now working on? What is the mystery you would dream to uncover?

Now I am working on extending our category theory explanation to “quasi-systematic” properties, such as you get in language, where some but not all of the possible combinations of constituents are systematically related. An example of quasi-systematicity is subject-verb agreement in English. For instance, we say “dogs chase cats”, “cats chase dogs”, and “dogs chase cat”, but not “dog chase cats”, nor “dog chase cat”. This work is intended as a more general explanation of systematicity, which includes our previous explanation as a special case. We hope to have a new paper available detailing this explanation, in the near future.

For me, one of the grandest mysteries is why mind exists at all: how does our mental life arise from the physical world? I suppose the question about the origins of mind is to the cognitive scientist as the question about the origins of life is to the biologist. Naturally, the mind arises from dynamical or computational properties of the brain and its interaction with the body and the world. But, what properties specifically distinguish the brain as the basis for mentation from those (embodied/embedded) dynamical or computational systems that are in no real sense thought of as thinking?



En castellano:

Estimado Profesor Phillips, Estamos muy impresionados por su Paper "A Category Theory explanation for the Systematicity of Human Cognition". Aunque no entiendo completamente las matematicas utilizadas en el Paper, parece que hay equivalencias entre estructuras matemáticas o (cognitivamente hablando) dominios de conocimiento y esta correspondencia entre estructuras o dominios pueden ser expresadas matemáticamente a su vez. Luego en lugar de enfocar el conocimiento en términos de objetos y relaciones concretas, desde los que hay manera fácil de generalizar ese conocimiento, es mejor ir un nivel mas arriba y abstraer relaciones, hablando de una manera simple.

1 - Déjeme que dé un ejemplo desde mi entendimiento del problema (Estoy seguro de que es erróneo, pero es solo para que usted construya una respuesta a partir de ello): La acción de "matar" es una relación abstracta porque puede aplicarse desde el dominio de los hombres al conjunto de las vacas y también desde el dominio de los virus al conjunto de los hombres. Hay una categoría de conocimiento que incluye "matar" en el sentido abstracto que contiene sus propiedades: no reflexiva, no simétrica etc, cuyo conocimiento puede ser aplicado a cualquier par de conjuntos que cumplen los requisitos de dicha categoría. ¿Es correcta esta descripción?

Esta es parte de la descripción, y una manera de comprender la sistematicidad. Dicho en términos simples: si tienes un proceso para representar cosas (A) que actúan como matadores, y un proceso para representar cosas que pueden ser matadas (B), y tienes un proceso para poner esas representaciones juntas para hacer una representación de una instanciación de "A mató B" entonces tienes una forma de hacer eso para (cualquiera) otra instancia de "A mató B"  porque todas esas instancias son esencialmente el mismo proceso cognitivo.

La otra parte consiste en explicar por qué la sistematicidad necesariamente se sigue de la teoría propuesta para una arquitectura cognitiva particular, que fue el problema que originalmente suscitaron Fodor, Pylyshyn, y McLaughlin contra las arquitecturas conexionistas (redes neuronales): Aunque uno puede construir una arquitectura que tenga dicha propiedad (sistematicidad), uno también puede construir una que no la tenga. La gente es generalmente sistemática en sus habilidades cognitivas. Luego si tu teoría permite arquitecturas que tienen sistematicidad, pero permite asimismo arquitecturas que no la tengan, entonces necesitas una explicación adicional de por qué la sistematicidad siempre acaece. Es decir necesitas una explicación más allá de simplemente asumir que es posible.

Ken Aizawa escribió una excelente revisión del debate sobre la sistematicidad. Discutió con gran detalle este problema consistente en hacer la asunción ad hoc de que sólo las opciones sistemáticas suceden.  También apuntó al hecho de que las aproximaciones clásicas sufren igualmente el mismo tipo de problemas. Es decir, aunque uno pueda idear sistemas de símbolos con sistematicidad, puede también idearlos sin esta propiedad. Por lo tanto ni el modelo clásico ni el conexionista explican totalmente la sistematicidad, aunque ambos la muestren en casos particulares.

2 Dejemos a un lado nuestras interpretaciones y hable usted mismo. ¿Puede explicarnos con un pequeño ejemplo para aficionados la sistematicidad de la mente humana?

Un ejemplo simple puede consistir en escribir números con varios dígitos. Una vez que tienes la habilidad de escribir los dígitos del cero hasta el nueve, y la habilidad de juntarlos para formar algunos ejemplos de números mas grandes, entonces puedes hacerlo para cualquier numero de varios dígitos. Eso es todo. No encontrarás gente que pueda escribir el numero 123 pero no el 321.

3- el relativamente nuevo desarrollo de la Teoría de las Categorias en Matemáticas está revolucionando muchos campos en nuestro tiempo. En ciencias de la computación hay lenguajes como Haskell que están casi completamente dominadas por estructuras matemáticas que derivan de la Teoría de las Categorías. ¿Que hace a la TC tan potente en términos explicativos y tan útil?

Pienso que el poder de la TC viene de la combinación de abstracción y precisión. Enfocada en las relaciones entre objetos (las llamadas flechas o morfismos que constituyen una categoría), la TC puede abstraer de los detalles superficiales de los problemas, luego es potencialmente aplicable a un campo mas amplio de problemas.

Por supuesto los psicólogos han reconocido la importancia de las relaciones entre las entidades que forman parte de la estructura de una tarea. Pero tomar una perspectiva relacional  no es suficiente en sí mismo, ya que hay generalmente muchas mas relaciones potenciales entre entidades que entidades propiamente dichas, lo cual `puede volver el problema mas complicado. En la TC la composición de los morfismos (relaciones) es importante. Cómo se combinen las relaciones en nuevas relaciones da una importante información acerca del dominio que se estudie. Para ser una categoría, los morfismos (relaciones) deben componerse, y su composición debe ser asociativa. Luego no cualquier conjunto de relaciones construye una categoría. Las categorías, los  functores y demás construcciones de la TC están definidas con precisión (aunque de forma abstracta). Si puedes re-expresar un problema en términos de TC, entonces te es posible también acceder a muchos de los resultados ya dados por los teóricos de la TC, lo que puede ser de utilidad para resolver el problema que se tenga entre manos.

4.- Además de en las aplicaciones prácticas, aquí estamos interesados en la estructura de la mente humana. Más allá de una solución práctica para los problemas de Inteligencia Artificial: ¿Piensa usted que la mente humana opera de esta manera?. El lenguaje humano ¿Refleja de alguna manera ese modelo matemático?

Las estructuras matemáticas y en particular las de TC dan una buena descripción de la cognición en términos de generalidad y precisión, aunque puede que no sean las más fáciles de entender. SIn embargo, esto no quiere decir que la gente vaya por ahí pensando en objetos matemáticos de TC. El mecanismo que esas estructuras matemáticas describen puede ser computacional, y la Teoría de Categorías Computacional es un campo que aplica la teoría de categorías a la computación. Así que, si miras la cognición humana como un sistema computacional, entonces la aproximación de la TC está dentro del espíritu general de una teoría computacional de la mente.

5- Si esto es así, ¿tiene usted alguna idea acerca de como llegaron a evolucionar esa sistematicidad y abstracción?. ¿Cuánto podría ser innato y cuánto adquirido de acuerdo con la arquitectura propuesta?. Esas categorías ¿podrían construirse a base de simple hechos descubiertos secuencialmente?

La relación entre la abstracción (y en particular las adjunciones, el sistema formal de relaciones  entre dominios de conocimieto definido por la CT que uso para explicar la sistematicidad) y el desarrollo/aprendizaje es algo que quiero estudiar. Aunque es difícil decir cuánto de ello es innato, la TC apunta a múltiples niveles de representación que están estrechamente acoplados. En el contexto del aprendizaje, esto sugiere que las representaciones a múltiples niveles se aprenden simultáneamente. Esta perspectiva difiere del punto de vista del conexionismo, donde cada representación más abstracta se supone que emerge de un único nivel de aprendizaje movido por el ajuste de los pesos de las conexiones. Desde mi punto de vista, esta forma de conexionismo ha tenido dificultades para proveer de una idea plausible para el desarrollo de una cognición de mas alto nivel. El problema no es con la idea de "emergencia" como tal, sino que cualquier cosa que emerja (por ejemplo, regiones en el espacio de activación que uno puede identificar como correspondientes a un concepto abstracto) no es nunca utilizada por el sistema de aprendizaje. Luego ese tipo de sistemas requiere un re-entrenamiento extensivo para modificar su uso de esos conceptos abstractos (que ha descubierto), cosa que los humanos no necesitan. Por eso yo no espero, por ejemplo, que las adjunciones puedan ser construidas a partir de hechos simples solamente. En vez de eso, la capacidad para construir adjunciones debe ser parte de la arquitectura básica, y las adjunciones particulares requerirán aprendizaje a través de la interacción con el mundo exterior.

6- cuales son las perspectivas prácticas de esta alternativa y cuales van a ser sus próximos pasos ahí en Tsukuba?

Una aplicación práctica de la TC esta en el campo de la robótica (cognitiva). Hay paralelos en la manera en que la ciencia cognitiva y la robótica han progresado en las últimas décadas, habiendo sido influenciadas por teorías conexionistas y conductistas, respectivamente. Y aunque ambos campos han hecho progresos significativos en ciertas áreas, los investigadores son cada vez más consciente  de los límites que tienen esas aproximaciones al problema. Un paso adelante sería  el de incorporar la TC en el desarrollo e implementacion de las arquitecturas cognitivas.

7- ¿En que trabaja ahora? ¿Cual es el misterio que desearía desvelar?

Ahora estoy trabajando en extender la TC a las propiedades cuasi-sistemáticas, como las que se encuentran en el lenguaje, donde algunas pero no todas las posibles combinaciones de sus constituyentes están relacionadas sistemáticamente. Un ejemplo de cuasi-sistematicidad es la concordancia sujeto-verbo en Inglés. Por ejemplo, decimos “dogs chase cats”, “cats chase dogs”, y “dogs chase cat”, pero no “dog chase cats”, ni “dog chase cat”. Esto pretendemos  abordarlo mediante una explicación de la sistematicidad mas general, que incluya los ejemplos previos como un caso especial. Espero tener pronto disponible un nuevo artículo detallando esta explicación.

Para mi, uno de los misterios más grandes es por qué la mente existe. ¿Cómo nuestra vida mental aparece a partir del mundo físico? Supongo que esa cuestión acerca del origen de la mente es para el científico cognitivo lo que la cuestión acerca del origen de la vida es para el biólogo.

Naturalmente la mente aparece a partir de propiedades dinámicas o computacionales del cerebro y su interacción con el cuerpo y el mundo. Pero ¿que propiedades específicamente distinguen al cerebro como la base de la mente de esos otros sistemas computacionales o dinámicos también incorporados que se suponen no son parte del pensamiento?