SHARE

Nuevamente la interesante técnica conocida como ‘Algoritmos’ (Que son un conjunto de instrucciones o reglas bien definidas, ordenadas y finitas, que permiten realizar una actividad mediante pasos sucesivos que no generen dudas a quien deba realizar dicha actividad. Donde se da un estado inicial y una entrada, para así seguir pasos sucesivos con la intención de llegar a un estado final y obtener una solución. Los algoritmos son el objeto de estudio de la algoritmia, ver Figura 1) está siendo utilizada para que las máquinas aprendan a reconocer objetos y así poder ampliar y entender mejor el sistema cognitivo humano.

Figura 1. Los diagramas de flujo sirven para representar algoritmos de manera gráfica.

El famoso Instituto Tecnológico de Massachussets reveló recientemente, a través de un documento, el resultado de una nueva investigación en el campo de la Inteligencia Artificial . Según informaron, los avances en el llamado ‘Sistemas de reconocimiento de objetos’ están empezando a mostrar que son bastante positivos, especialmente en el uso más complejo y completo de los algoritmos, dentro el campo del reconocimiento facial y que exitosamente están siendo utilizados por la compañía Facebook.

Debemos de entender que este nuevo modelo no tiene el mismo diseño sobre como realmente reconocen los seres humanos. El nuevo sistema usa patrones de similitud de entre millones de fotos, para luego compararlos con la foto ‘original’. Indudablemente así no trabaja la memoria humana. Un ser humano solo necesita ver dos o tres fotos de un objeto para poder identificar los detalles de la misma y con bastante precisión.

Este programa tiene pocos años en proceso de investigación, en donde el grupo de investigadores, guiados por Tomaso Poggio, del Instituto para la investigación del Cerebro del MIT, inicializó las investigaciones de este nuevo modelo computacional sobre la representación visual, así como la intención de reflejar como el cerebro en realidad lo procesa. Estos avances, se informó, serán explicados con más precisión en el próximo número de la revista ‘Ciencia Computacional Teorética’. Los investigadores demuestran que un sistema de aprendizaje automático, basado en ese modelo, podría hacer discriminaciones o dicernimientos de los objetos, con solo algunos ejemplos, logrando así resultados más fiables.

Esta investigación, conjuntamente con otra similar, aparecieron en la revista ‘PLOS Biología Computacional’, que de igual manera demuestran que varios aspectos de su modelo están en concordancia enpírica de como en realidad funciona el cerebro.

Según djo el profesor Poggio, ‘”Si se le presentan la imagen de una cara a una cierta distancia y luego cuando la observa nuevamente pero desde una distancia diferente entonces la imagen es muy diferente, así, simplemente no funciona”. El profesor Eugene McDermott del ‘Departamento de Ciencias del Cerebro y Ciencias Cognitivas’ del MIT dijo: “Para resolver este problema, ya sea que se necesite una gran cantidad de ejemplos, se necesita ver la cara, no solo en la misma posición, sino en todas las posiciones posibles, o saber también que és una representación invariante del objeto.”

Una representación invariante de un objeto es una que es inmune o no afectada a las diferencias, como el tamaño, la ubicación y la rotación en linea. Investigadores de la computación en el campo de la visión han propuesto varias técnicas para la representación de objetos invariantes, pero el grupo de Poggio tiene un mayor desafío, que es el encontrar una representación invariante que sea coherente con lo que sabemos sobre la increible maquinaria del cerebro humano.

Desde un punto de vista neuronal, entendamos, que las células nerviosas (neuronas) son bastante delgadas y largas, con un potencial increible de ramificaciones (dendritas). En la corteza cerebral, donde ocurre el ‘procesamiento’ visual, cada neurona tiene apróximadamente 10,000 ramificaciones en cada uno de sus extremos (axones).

Por lo tanto, dos neuronas corticales (corteza cerebral) se comunican entre sí a través de las 10,000 distintas uniones químicas, conocidas como ‘sinapsis’. Cada sinapsis tiene su propio ‘peso’, un factor por el cual la fuerza de una señal entrante se multiplica, las señales que cruzan todas las 10,000 sinapsis, a continuación se añaden en su totalidad al cuerpo de la neurona (soma). Entonces los patrones de estimulación y actividad eléctrica cambian, modificandose a medida que pasa el tiempo, así como los pesos de las sinapsis, que es el mecanismo por el cual los hábitos y recuerdos se tornan arraigados o fijados.

Matemáticamente hablando una operación importante en la rama matemática, conocida como algebra lineal, es el punto clave en este proceso, esta operación tiene dos secuencias de números – o vectores – que multiplican sus elementos, juntos, de una manera ordenada, y que luego sumando todos los resultados otorgan un solo número. En la corteza cerebral, la salida de un solo circuito neural podría ser considerado como el producto escalar de dos vectores de 10,000 variables. Esto es una gran calculación que cada neurona, en el cerebro, puede hacerla de un solo ‘golpe’.

El grupo de Poggio desarrolló una representación invariante de objetos que se basa en los llamados productos-escalares – el producto escalar, también conocido como producto interno o producto-punto, es una aplicación amplificada de la geometría Euclidiana -. Supongamos que usted haga una película digital de un objeto que gira 360 grados en un plano – digamos en 24 cuadros, cada uno de los cuadros representa el objeto girando un poco más adelantado que el anterior objeto. Por lo tanto, se puede almacenar la película como una secuencia de 24 imágenes fijas.

Supongamos que a continuación le presentan una imagen digital de un objeto
desconocido. Debido a que la imagen se puede interpretar como una cadena de números que describen los valores de color de ‘píxeles’ (que es la unidad menor homogenea en color que forma parte de una imagen digital) – usted puede calcular su ‘producto-escalar’ con cada uno de los fotogramas de la película y almacenar esa secuencia de 24 números.

Ahora, si nos presentan una imagen del mismo objeto pero que haya girado, por ejemplo 90 grados, y se calcula su ‘producto-escalar’ con su secuencia de imágenes fijas, entonces se obtendrá los mismos 24 números. No estarán, por supuesto, en el mismo orden: Por lo tanto el ‘producto-escalar’, en relación con el primero, aún ahora será el ‘producto-escalar’ en relación con el sexto objeto. Pero van a tener los mismos números.

Esa lista de números, entonces, es una representación del nuevo objeto, que es invariante en su rotación. Secuencias similares de fotogramas, que representan un objeto de diferentes tamaños, o en diversos lugares en relación al marco de referencia, producirán secuencias de ‘productos-escalares’, que serán invariantes en cuanto a su tamaño y su ubicación.

En un nuevo documento, Poggio y sus colegas: – el primero, el autor Fabio Anselmi, postulante a un post-doctorado en el grupo de Poggio; Joel Leibo, de una filial de investigación en el Instituto McGovern y científico investigador en Google DeepMind; Lorenzo Rosasco, profesor visitante en el Departamento de Cerebro y Ciencias Cognitivas; y Jim Mutch y Andrea Tacchetti, estudiantes de posgrado en el grupo de Poggio – demuestran que si el objetivo es producir una representación del objeto invariante a la rotación, tamaño y ubicación, entonces lo ideal a seguir sería el uso de una plantilla con un conjunto de imágenes conocidas como filtros de Gabor. Estos filtros Gabor, resultan que son conocidos por ofrecer una buena descripción de las operaciones de procesamiento de imágenes realizadas por las llamadas “células simples” que están ubicadas en la corteza visual.

Ahora hablando del fenómeno tri-dimensional, aunque esta técnica funciona bastante bien para las transformaciones visuales dentro de un plano, sin embargo, no funciona tan bien para la rotación en tres dimensiones.El producto-escalar entre una nueva imagen y la de, por ejemplo, un coche visto de frente, sería muy diferente del producto-escalar de la misma imagen y la de un coche visto desde el lado.

Pero el grupo de Poggio ha demostrado que si la plantilla de imágenes fijas representan un objeto del mismo tipo, como el nuevo objeto del producto-escalar, todavía darán descripciones adecuadamente invariantes. Y esta observación concuerda con la reciente investigación de Nancy Kanwisher del MIT y de otros, lo que indica que la corteza visual tiene regiones especializadas para el reconocimiento de clases particulares de objetos, tales como caras o cuerpos.

En el trabajo descrito en PLOS Biología Computacional, Poggio y sus colegas – Leibo, Anselmi y Qianli Liao, un estudiante graduado en ingeniería eléctrica y ciencias de la computación – construyeron un sistema informático que reunió un conjunto de imágenes fijas y utilizando el algoritmo del producto-escalar, aprendieron a clasificar los miles de objetos al azar.

Por cada una de las clases de objetos, que el sistema aprendió, se produjeron un conjunto de plantillas que predijeron el tamaño y la varianza en las regiones de la corteza visual humana, que son dedicadas y corresponden a estos casos observados. Eso sugiere, argumentan los investigadores, que el cerebro y este sistema pueden estar haciendo algo similar.

La hipótesis de invariancia de los investigadores es “un enfoque poderoso para cerrar la gran brecha entre el aprendizaje contemporaneo de la máquina, con su énfasis en millones de ejemplos etiquetados, y el sistema visual de los primates que en muchos casos pueden aprender con un solo ejemplo”, dice Christof Koch, un profesor de biología e ingeniería en Caltech y director científico del Instituto Allen para la Ciencia del Cerebro. “Esta sería una especie de marco matemático elegante, muy necesario si queremos comprender los existentes sistemas naturales inteligentes, en el camino hacia la construcción de potentes sistemas artificiales.”

El trabajo de los investigadores fué patrocinado, en parte, por el Centro del MIT sobre los estudios del Cerebro, las Mentes y las Máquinas, que es financiado por la Fundación Nacional para la Ciencia, que es dirigido por Poggio.

Fuente:
Larry Hardesty | MIT (Instituto Tecnológico de Massachussets – Oficina de Noticias)


SU APORTACION ES MUY APRECIADA! DEJA TU COMENTARIO ABAJO.

35 COMMENTS

  1. Great blog site. Could someone with little experience do it, and also include updates without messing it up? Great information on below, really useful.

  2. Hey tһere, Уoս hɑѵe done an incredible job.
    Ι wil ɗefinitely digg іt and personally suggest to mу friends.
    I’m confixent theү ᴡill Ьe benefited from this website.

  3. Pretty impressive article. I just stumbled upon your site and wanted to say that I have really enjoyed reading your opinions. Any way I’ll be coming back and I hope you post again soon.

  4. A motivating discussion is definitely worth comment.
    I believe that you ought to publish more about this issue,
    it may not be a taboo matter but usually people don’t talk about these topics.
    To the next! Best wishes!!

  5. I don’t know if it’s just me or if everybody else experiencing issues with your site. It appears as though some of the written text on your content are running off the screen. Can someone else please provide feedback and let me know if this is happening to them as well? This could be a problem with my web browser because I’ve had this happen before. Appreciate it

LEAVE A REPLY