REDES NEURAIS: é lícito chamá-las "neurais"?

Henrique Schützer Del Nero

I. Introdução:

Percorrer o sugerido no título acima significa percorrer alguns dos problemas mais severos do pensamento e da ciência. Tarefa inglória mormente quando se têm, como pano de fundo, a "CiEAˆncia Cognitiva", mega-projeto interdiciplinar que, tentando abarcar as ciências da cognição, coloca em um só barco as Neurociêncais,a Psicologia, a Liguística, a Filosofia, a Antropologia e a Matemática, através da Inteligência Artificial. Projeto insólito ou desvairado, síntese vácua que se perde na incomunicabilidade dos agentes, ou simplesmente má escolha de modelos?

O trajeto seguido nas próximas linhas procurá, de maneira breve e resumida, aclarar algumas das tensões conceituais envolvidas em tal projeto e finalmente adotar as "redes neurais" como paradigma modelar para o Sistema Nervoso Central.

II. Cérebro ou mente?

A primeira grande decisão que se deve tomar ao deparar-se com a Ciência Cognitiva é a de assumir qual objeto se pretende estudar, se a mente humana ou o cérebro humano.

Numa célebre divisão das operações mentais, Ryle [1] propõe a seguinte divisão para o obejto mente: pensamento, sensações e vontade, ou modo cognitivo, emocional e conativo, respectivamente.

Ciência Cognitiva nessa acepção seria apenas a terça parte do obejeto mente, i.é aquela parte que responde pelo modo cognitivo ou o pensamento simplesmente.

Gardner [2] num livro introdutório e simples propõe ainda que se devem descontextualizar e desafetizar os pensamentos, ou operações cognitivas, para que num primeiro momento não padeá a nova disciplina de excessiva abrangência.

Nesse sentido teria a mente dividida à terca parte que sofre ainda uma "descontextualização" para que pudesse ser objeto de modelagem científica.

O cérebro como agente ou embasante da operação cognitiva deve ser entendido através de dois enfoques rivais: ou como instrumento da "função mental", ou como idêntico à ela. No primeiro caso têm-se a vertente "funcionalista" da relação entre o cérebro e a mente e na segunda a vertente "reducionista" dessa relação.

Bem certo, é preciso compreender num primeiro momento que os termos acima nem sempre delimitam classes total e completamente separáveis. Explico: por vezes um autor propõe explicação sobre o cérebro que o supõe como órgão complexo. Dada a complexidade os fenômenos de interação não obedecem a regras de composição simples e portanto "emrgem" da relação entre as partes. Nesse sentido a noção de compoprtamento cerebral complexo tem relações "funcionais-emergentes"com o agregado de neurônios que o compõe. Num outro texto, o autor toma a mente como dotada de uma certa classe de primitivos, de um alfabeto primordial, de uma classe de categorias básicas e as identifica com certas operações. Nesse caso pode-se estar identificando uma determinada operação com a seqüência de relações entidades mentais que a compõe. É reducionista nesse sentido.

Portanto, a dicotomia mente-função-cérebro e cérebro-redução-neurônios vale apenas para a uma introdução ao assunto. Feita a observação de cautela quanto às generalizações, quase sempre difíceis no terreno conceitual, podemos prosseguir.

II.1. Reação ao Behaviorismo

A Psicologia voltou a aludir a fenômenos internos, mentais, quando o Behaviorismo começou a falhar em seu projeto de eliminação das intermediações não-observáveis. Quer o cérebro, quer a mente, foram tratados por essa grande e poderosa corrente científica deste século - o Behavirismo -, como dados desnecessários que só faziam por eclipsar à busca de invariâncias comportamentais, endosso para a formulação de genuínas leis psicológicas. Embora tenha havido avanço significativo, o tratamento da mente como caixa-preta - ou do cérebro, ou das variáveis intermediáris entre o estímulo e a resposta -, mostrou-se incapaz de resolver alguns dos ímpasses mais importantes do comportamento. As razões que levaram ao abandono do paradigma da "caixa-preta" voltando-se a falar em mente, cognição, etc, são inúmeros. Cabe salientar três que, na minha opinião, podem invalidar as tentativas comportamentalistas mais ousadas: o problema quântico, o problema das não-linearidades e o problema semântico.

a) O problema quântico

Como a Mecânica Quântica pode ter influenciado na falência do Behaviorismo? Responder essa pergunta requer todo um ensaio sobre problema de níveis de descrição e sua mútua relação. Se considerarmos que nos níveis mais elementares de constituição do mundo físico, no nível dos quanta, o determinismo se esvai dada a impossibilidade de precisar a descrição completa do sistema, entende-se que qualquer projeto de cunho determinista pode, doravante, se ver prejudicado. Nesse caso, embora a objeção sejá válida para todos os ramos da ciência, há que notar-se seu efeito nas grandes tentativas generalizadoras, dentre as quais o Behaviorismo se inclui.

Essa primeira objeção talvez conste neste trabalho apenas à guiza de advertência. A partir do momento que a estrutura mais íntima e elementar do mundo se torna não totalmente descritível - porque se meço com precisão a velocidade de uma partícula perco precisão na medida de sua posição e vice versa, sendo a relação entre ambas regida por uma constante, a de Planck, i.é. além da qual qualquer ideal de precisão jamais pode ir -, qualquer ideal determinista de relação estrita entre elementos deve ser revisto. O determinismo, tão perseguido depois do sucesso da Física Clássica, permite que se tivermos uma descrição precisa do estado de um sistema num instante quanlquer, saibamos definir-lhe o estado no instante seguinte. Como veremos mais adiante, nem mesmo um sistema descrito através de grandezas "clássicas" obedece a essa delimitação, caso das não-linearidades, e nem mesmo a noção nem a Mecânica Quântica derroga totalmente o determinismo, sendo num certo sentido também determinista.[3]

O determinismo pode então ser visto sob duas grandes óticas: a da estrita descrição do estado do sistema e da predição de estados subseqüentes. Na Física Quântica não consigo descrever totalmente, devido à impossibilidade "essencial" da relação entre a velocidade e a posição ir além de um ponto dado pela constante de Planck, o que torna em princípio derroga o determinismo, porém se tivesse precisão de medida teria previsão. Na Física Clássica posso ter precisão de medida porém diante de certos sistemas que insiram relações não-lineares sensíveis às condições iniciais, como acontece diante da atração de três corpos pela força gravitacional, porém perco a predição de estado futuro, pelo menos para certos valores de parâmetros do sistema.

No Behaviorismo, procurando fixar relações invariantes entre entrada, saída e reforços, esqueço de indagar se o determinismo, seja em qual estágio, quântico ou clássico, está preservado, i.é. se pode haver descrição completa e/ou predição para o sistema em questão.

b) o problema da nE3ao-linearidade

Este tópico também deve suscintamente transmitir uma das razões que pode subjazer à falência de uma pretensão de explicação do comportamento através de variáveis de estado observáveis, desprezando-se os entremeios processantes, sejam cerebrais, sejam mentais.

Um sistema dinâmico se caracteriza pela variação temporal de seus estados em função dos parâmetros que são substituidos em suas variáveis. Podemos definir uma função f (x) e sua variação temporal como dx/dt = f (x) . De maneira simplificada a última equação expressa a taxa de variação de x ao longo do tempo. Esses valores são representados como estados que o sistema assume ao longo do tempo. Esses valores são apresentados no chamado espaço de estados ou plano de fase. Portanto podemos estudar a variação temporal das grandezas de de um sistema, através do estudo de seu comportamento no espaço de estados, i.é. atrvés do estudo da equação diferencial que descreve o sistema.

No plano de fase podemos encontrar sistemas que adotam trajetórias ( conjuntos de estados no plano de fase) de equilíbrio ou não. As trajetórias no plano de fase podem ser estáveis, assintoticamente estáveis, i.é. convergindo sempre para um ponto de equilibrio e instáveis.

Pense num pêndulo simples. Se tenho uma equação diferencial que me descreve a trajetória do pêndulo, i.é. o conjunto de estados do pêndulo posso ter três situações diferentes:

- em um pêndulo sem atrito tenho no plano de fase um trajetória circular (tipo centro) que me conta que o sistema visita periodicamente dois de seus pontos extremos. Essa soluções chamadas periódicas, oscilações auto-sustentadas, ciclos-limite, trajetórias tipo centro são bastante importantes porque caracterizam sistemas que têm um comportamento rítmico e regular.

- em um pêndulo com atrito "de desaceleração" terei no plano de fase uma trajetória que começa em um ponto e converge para um ponto de equilíbrio estável, nesse caso assintoticamente estável. Isto é, se soltar o siatema em qualquer instante, com a evolução do tempo o atrito tenderá a anular a oscilação, levando o pêndulo ao repouso. Essa noção é importante porque os estados convergem para o ponto de equilíbrio. Em termos do estudo da robustez e confiabilidade de um sistema é interessante encontrar comportamentos desse tipo pois há uma convergência de estados para o um equilíbrio bastante estável, daí o termo assintoticamente estável.

- em um pêndulo com atrito de "aceleração", o que fica difícil de pensar no caso físico em questão dada a existência do fio, o sistema tenderá a ir para o infinito. No plano de fase a trajetória tende a ir para o infinito.

Entendidos esses três casos podemos dizer que do ponto de vista da estabilidade local, ou de Liapunov, o sistema pode apresentar estabilidade assintoticamente estável (atrito "desacelerante"), estabilidade por oscilação auto-sustentada (ausência de atrito) e instabilidade (atrito "acelerante").

Podemos no entanto definir uma outra entidade que descreva um sistema: a estabilidade do ponto de vista estrutural. Essa ao contrário da anterior não é válida para um só sistema mas para todos aqueles que se assemelham do ponto de vista topológico, ou que apresentam homeomorfismo. Embora tenham aparência diferente, esses sistemas apresentam comportamentos qualitativos semelhantes.

Imagine uma montanha-russa com uma grande rampa. Vários modelos de montanha russa podem ter apensa uma rampa. Seja rampa grande, pequena, grande, suave ou em declive brusco, do ponto de vista topológico terei como unificá-las topologicamente, considerando-as homeormórficas, ao contrário de uma montanha-russa que tenha uma grande subida e de outra que seja somente plana (se é possível chamar a isso de montanha-russa!).

Do ponto de vista estrutural, posso estabelecer classes de trajetórias que descrevem diferentes sistemas. Essas classes podem ser estáveis ou não. Quando não estáveis representam bifurações.

Entendamos a noçào de bifurcação.

Temos variados sistemas que descrevem água sendo aquecida. Tenho determinadas grandezas variando no tempo pelo aporte de uma quantidade de energia que imponho ao sistema. Todas as trajetórias para água a 50oC ou a 70oC são homeomorficas. Para valores de temperatura perto dos 100oC posso ter mudança abrupta de comportamento do sistema (a chamada transição de fase ou vaporização). A noção de que perto de certos valores de parâmetros, no caso temperatura, podem levar a aaterações na topologia do sistema constitui o que chamamos de "valores de bifurcação de parâmetros" ao contrário daqueles parâmetros que mantinham os sitemas homeomorficos topologicamente "valores ordinários de parâmetros".

O exemplo foi propositalmente com apêlo físico e não puramente matemático para que se note a relação entre a Teoria de Sistemas Dinâmicos e alguns ramos da Física, particularmente a Termodinâmica de processos dissipativos (i.é. daqueles que não mantëm energia contante ou que variam entropia) e a Mecânica Estatística.

Do ponto de vista estrutural portanto, posso dizer um sistema é estável se ele, e seus circunvizinhos ( não cabe entrar em detalhes de como defino a noção de "vizinho") se comportam igualmente do ponto de vista qualitativo. Nessas regiões em que um sistema é estruturalmente estável, defino seus parâmteros como sendo valores ordoináriios de parâmetros, no caso da água, temperaturas que não fazem o sistema variar qualitativamente. Nas fronteiras de uma mudança qualitativa, posso ter um sistema se comportando como água-líquida enquanto outro já se comporta como água-vapor. Essa mínimas variações no valor de parâmetros, no caso temperatura, e alteração qualitativa se chama de bifurcação, isto é vario muito pouco o parametro e os dois sistemas tão vizinhos quanto ao parâmetreos, ficam tão distantes quanto ao comportamento. Esse valores de parâtros se chamam de valores de bifurcação.

Posso então dizer que um sistema apresenta estabilidade estrutural ou não e devo diferenciá-la da estabilidade local.

Imagine um pêndulo. Perto do ponto máximo em que a trajetória do peso preso ao fio vai mudar, posso ter estabilidade local porque o sistema tem trajetória no plano de fase oscilatória, porém do ponto de vista estrutural, conjunto de estado até perto do ponto limite apontava numa direção e alí perto muda bruscamente de direção. Portanto aqui do ponto de vista estrutural há mudança qualitatica e valor de bifurcação. Nesse caso tenho estabilidade local e instabilidade estrutural para aquele valor de parâmetro, aquele da tensão máxima do fio.

Posso ter ainda estabilidade estrutural sem estabilidade local. Imagine uma comparção entre varias montanhas-russas que só tenham picos. Do ponto de vista da estabilidade local todas apresentam ausência de equilíbrio porque à mínima perturbação o carrinho cai do cume da montanha ( exemplo básico de equilíbrio instável) orém do ponto de vista estrutural todos os sistemas homeomorficos apresentam o mesmo comportamento portanto são estruturalmente estáveis.

O caso da montanha russa reta é interessante porque expõe o conceito de maneira desconcertante: do ponto de vista local todas tem estabilidade local e estruturalemnte idem. Porém, do ponto de vista estrutural o homeomorfismo não se coloca porque na verdade são a mesma instância qualitativa, todas são retas. Salvo parta para caracterizações do "ser reto"acrescidas de outras qualidade que as diferenciem como tipo de materila e fabricante, aqui não caberá falar em estabilidade estrutural porque são isomorficas e não homeomorficas. Nos sistemas isomorficos não tenho equivalencia estrutural tenho identidade estrutural o que me parce ser diferente e subtrair a riqueza da noção de homeomorfismo que pretende apenas igualar aquoilo que aparente e fortemente parece diferente.

Posso ainda imaginar sistemas que tenha instabilidade local e estrutural. Água perto da temperatura de evaporação apresenta instabilidade local e estrutural. Porém vale salientar que o conceito de estabilidade local vale para um sistema enquanto que o de estabilidade estrutural vale apenas como relação entre um sistema e seus vizinhos muito próximos. Isso dá o tom do conceito de sensibilidade. Enquanto alguns valores são "robustos", não alterando a estabilidade, quer local, quer estrutural, outros podem alterar a estabilidade estrutural, forjando as chamadas bifurcações. Nesses valores temos sensibilidade do sistema à variação mínima de parâmetro com respeito àquele intervalo.

Lembre-se de que um sistema pode ter regiões de estabilidade local e regiões de instabilidade local e também regiões de estabilidade estrutural e de instabilidade estrutural. A água é um bom exemplo que demostra o acima mencionado.

Os sistemas que tem comportamento uniforme para todas as suas regiões quantitativas são lineares. Aqueles que podem ter regiões de estabilidade diversa do ponto de vista local sào não-lineares. É preciso estudá-los localmente para saber se estamos em regiões localmente estáveis ou não.

Daí surge a noção de não-linearidade definível como violando o princípio de superposição.

Para sitemas lineraes vale o princípio da superposição: tenho um estado de água a 50oC e outro estado de água a 20oC, posso dizer que conheço o estado de água a 70oC quer pelo exame de água a 70oC quer pela soma de água a 50oC e água a 20oC.

Formalmente: f (a) + f (b) = f ( a + b) princípio da superposição

Sistemas que obedecem o acima descrito são chamados de sistemas lineares.

Os sistemas não-lineraes ao contrário não obedecem ao princípio da superposição. Ou como gostam alguns, "a soma das partes não me garante o conhecimento do todo".

Podem portanto apresentar "regiões" de estabilidade local (seja assintótica, seja oscilação auto-sutentada) e regiões de instabilidade local. Cumpre examinar então suas regiões. Na prática, a maioria dos sistemas interessantes e ricos são não-lineares. Se me interessa impedir que saia do controle, que simule a robustez e universalidade dos lineares, posso "linearizá-los" e criar artifícios que o impeçam de adotar regiões de instabilidade ( por exemplo o método de Niquist estipula alguns artifícios para fugir da intabilidade local nos sistemas não-lineares).

A existência no entanto de instabilidades locais não é apenas o único traço desse sistemas. Muitos deles, e também alguns lineares, podem apresentar do ponto de vista estrutural instabilidade ou bifurcação. Essas bifurcações associadas à sensibilidade às condições iniciais podem me sucsitar para valores de bifurcação uma duplicação tão exagerada do periodo das oscilações, isto é a bifurcação pode adotar dois, quatro, oito, etc estados, levando o sistema ao que se chama de "caos"ou uma multidão de estados.

Importante notar que:

- estabilidade local não é igual a estabilidade estrutural

- os não-lineares apresentam regiões de estabilidade e de instabilidade local

- os lineares são uniformaes em todas as regiões

- a estabilidade estrutural e as bifurcações podem ocorrer nos lineares e nos não-lineraes

- a bifurcação não é sinônimo de caos

- a não-linearidade não é sinônimo de caos

- dada uma certa peculiaridade chamada "sensibilidade às condições iniciais" um sistema pode apresentar para certos valores de bifurcação duplicações suscessivas de seu período chegando a fazer uma "nuvem de estados" que se chama atualemnte de caos ou aleatoriedade.

- caos pode ocorrer em sitemas de tempo contínuo (equaçoes diferencias) e de tempo discreto (equações de diferenças).

- do ponto de vista estrutural é um exemplo máximo de instabilidade porém não é sinônimo de instabilidae estrutural

- não necessariamente implica em instabilidade local

- do ponto de vista prático há metodos para evitar instabilidade local em sistemas não-lineraes. Isso não é o mesmo que evitar "caos"porque o sistema não preceis a ser não-linear e nemprecisa estar em ponto de instabilidade local, apenas em ponto de bifurcação (do ponto de vista estrutural).

- porém o simples fato de bifurcar não redunda em caos, debvendo acrescer-se a isso a nebulosa caravterização de "ssitema com sensibilidade às condições iniciais".