Universais linguísticos: genética ou protolíngua?

Uma das questões mais prementes da pesquisa linguística são os chamados universais da linguagem, elementos ou características presentes em todas as línguas naturais, mesmo naquelas que jamais tiveram contato entre si nem têm ascendência comum. Uma das bases da ciência é justamente a possibilidade de encontrar leis gerais que governam todos os objetos particulares de um determinado domínio. Que toda a matéria é feita de átomos é um princípio fundamental da física; que todos os seres vivos se reproduzem é um universal da biologia, e assim por diante. Na linguagem, são universais fatos como: todas as línguas possuem gramática; todas são compostas de palavras e frases; todo signo linguístico tem significante e significado.

Mas há fatos ainda mais gerais, como a constatação de que a própria linguagem verbal é universal: não há nenhum povo que se comunique preferencialmente por outro código que não as palavras (como assovios, gestos, toques). Ou seja, a própria prevalência da linguagem verbal é um traço universal e definidor da espécie humana. Até aí, não há dúvida de que se trata de um mecanismo com raízes biológicas: em algum momento da evolução da espécie, a linguagem verbal articulada emergiu como função biológica vantajosa à sobrevivência, que passou desde então a ser transmitida geneticamente. Isso significa que a aptidão linguística está de alguma forma inscrita em nossos genes – o que não quer dizer, evidentemente, que as línguas que falamos são herdadas por via genética: obviamente, trata-se de um aprendizado.

Mas as características estruturais mais básicas das línguas, somadas ao aparato cognitivo subjacente a elas em nível mais profundo, fazem crer que toda língua se desenvolve e evolui segundo um padrão que não é cultural, mas neurológico. É como dizer que cada língua é um software diferente, mas todos rodam a partir do mesmo sistema operacional e dentro do mesmo hardware. Essa tese, chamada de inatismo linguístico, foi defendida sobretudo por Noam Chomsky e os gerativistas e ganha cada vez mais força com os atuais estudos da neurociência e ciências cognitivas.

Mas há um problema de difícil solução com respeito aos universais linguísticos: o vocabulário. Sabe-se há muito tempo que certas palavras do léxico mais primitivo das línguas, como os termos para “pai” e “mãe”, se parecem espantosamente, mesmo em línguas distantes no tempo e no espaço, línguas que jamais tiveram contato entre si nem demonstram qualquer traço de parentesco. A presença de um elemento fonético [p] ou [t] (e suas variantes [f], [b] e [d]) nos correspondentes a “pai” e [m] ou [n] nos correspondentes a “mãe” (veja quadro abaixo) sugere que esses termos provieram da própria comunicação infantil pré-linguística (bebês em fase pré-linguística balbuciam coisas como , , , mamá diante dos pais ou pedindo para mamar) e, portanto, seriam fruto de programação genética.

Mas a reconstrução de línguas mortas não documentadas por comparação entre línguas documentadas levou o linguista norte-americano Merrit Ruhlen à hipótese de que teria existido uma protolíngua, ou mãe de todas as línguas, que ele chamou de proto-sapiens (uma das palavras reconstruídas nesse idioma seria *tik, “dedo”). Ou seja, segundo a teoria que ficou conhecida, de modo algo depreciativo, como “torre de Babel” (pois, segundo o mito bíblico, antes de Babel todos falavam uma só língua), todas as línguas naturais existentes hoje em dia descenderiam remotamente de uma língua primeira, falada na África à época do surgimento da própria espécie humana atual, o Homo sapiens (cerca de 200 mil anos atrás). Embora muito controversa, essa teoria tem muitos adeptos e não pode ser de todo rechaçada.

Coloca-se então a questão: as palavras para “pai” e “mãe” se parecem na maioria das línguas conhecidas porque estão em nosso código genético ou porque têm ancestrais comuns na protolíngua? Trata-se de herança biológica ou cultural? Em que casos houve transmissão por empréstimo e, portanto, contato linguístico e em que casos não? A linguística atual não tem respostas seguras para essas perguntas, mas está trabalhando intensamente para chegarmos, dentro dos próximos anos, a alguma conclusão. E, dada a velocidade com que tem ocorrido a extinção em massa de línguas no último século, trata-se de uma corrida contra o tempo.

“PAI/MÃE” EM DIVERSAS LÍNGUAS DO MUNDO

albanês: babai/nëna
árabe: ab/am
azeri: ata/ana
basco: aita/amak
birmanês: hpahkain/mihkain
cazaque: äke/ana
cebuano: amahan/inahan
coreano: abeolji/eomeoni
estoniano: isa/ema
galês: tad/mam
georgiano: mama/deda
hebraico: abh/em
hmong: txiv/niam
húngaro: apa/anya
inglês: father/mother
ioruba: baba/iya
laosiano: pho/aem
latim: pater/mater
malaiala: pitāv/am’ma
malaio: bapa/ibu
mandarim: fùqin/mŭqin
maori: papa/whaea
nepalês: bubā/āmā
sesotho: ntati/’mè
suahili: baba/mama
tailandês: phx/
turco: baba/anne
usbeque: ota/ona
vietnamita: cha/me
zulu: ubaba/umama

Existem línguas feias e línguas bonitas?

A resposta à pergunta do título é evidentemente subjetiva, na medida em que beleza é, em grande parte, questão de opinião. Mas, assim como existe um padrão de beleza para pessoas – ditado, em certa medida, pela moda e pela publicidade, mas que a ciência revela ter uma base biológica –, é perfeitamente possível falar na beleza ou feiura das línguas.

Segundo a sociolinguista Dr.ª Vineeta Chand, da Universidade de Essex, Reino Unido, “não houve nenhuma pesquisa que tenha explorado diretamente a atratividade de uma língua e eventualmente relacionado isso à avaliação social da comunidade falante”.

No entanto, é comum ouvirmos comentários de que o italiano é romântico, o francês é a língua mais linda do mundo, o alemão é áspero, de que os falantes de certas línguas parecem ter uma batata quente dentro da boca, e assim por diante. Por mais que essas impressões possam estar contaminadas pela própria simpatia ou antipatia que sentimos pelos povos que falam tais línguas, não deixa de ser curioso que haja uma certa convergência de opiniões em torno de certos idiomas.

Em primeiro lugar, a maioria das avaliações estéticas diz respeito apenas à sonoridade da língua, sem considerar outros aspectos, como vocabulário, gramática ou grafia. É evidente que a maior ou menor dificuldade em aprender um idioma estrangeiro também pode afetar nossa propensão a gostar ou não dele, o que permite ampliar os critérios de avaliação de uma língua para além do aspecto puramente fonético.

Nesse sentido, podemos arriscar alguns critérios de julgamento estético das línguas.

Foneticamente, línguas com predominância de vogais, inclusive nasais, e poucos encontros consonantais, como as românicas, seriam mais belas do que línguas predominantemente consonantais, como o alemão ou as línguas eslavas. Isso se deve ao próprio fenômeno acústico-articulatório de que vogais são sons harmônicos e consoantes são ruídos.

Além disso, a entonação e a velocidade da fala também influem: línguas tonais como o sueco e o mandarim costumam soar estranho a ouvidos não familiarizados; falantes com ritmo muito rápido, como os espanhóis e os japoneses, soam agressivos, ao passo que a fala lenta e compassada transmite calma, credibilidade e até mesmo sensualidade.

Gramaticalmente, um idioma será tão mais belo quanto mais simples, lógico e regular ele for. Portanto, línguas com muitas regras e um sem-número de exceções são “feias”.

Por fim, a ortografia de uma língua pode ser feia ou bonita (evidentemente, estou pensando em línguas que utilizam o alfabeto latino). Uma língua como o holandês, em que a maioria das palavras aparece com vogais dobradas (telefoon, telegraaf, instituut, etc.), deve parecer esquisita aos falantes das demais línguas europeias. Sistemas ortográficos com muitos caracteres especiais, sinais diacríticos, clusters consonantais, etc., como o islandês, o turco, o vietnamita, acabam tendo uma escrita “suja”, carregada, e deixam a leitura pesada, além do evidente transtorno que causam à digitação.

Segundo esses critérios, o italiano seria de fato uma língua bela, já que é extremamente vocálica, sua fala é pausada (e em algumas regiões ligeiramente cantada), sua gramática é das mais simples dentre as línguas neolatinas e sua grafia, além de fonética (escreve-se como se fala), é despojada, sem caracteres especiais e com uso mínimo de acentos.

Na outra ponta, o polonês seria uma língua feia, já que foneticamente é bem consonantal, gramaticalmente é supercomplexa e tem uma grafia “pesadona”, com muitos “y” no lugar de “i”, “w” no lugar de “v” (por exemplo, “universidade” é uniwersytet) e inúmeros clusters como szcz.

Mas, e o português, onde fica nessa classificação? Foneticamente, costuma ser considerado uma língua bonita (há quem diga que o português brasileiro é sexy), mas gramatical e ortograficamente seria, segundo os nossos critérios, uma língua feia, já que é complexa e pouco racional.

O caipirês de “Êta Mundo Bom”

Têm corrido as redes sociais alguns comentários criticando o sotaque caipira dos personagens da telenovela Êta Mundo Bom (Rede Globo, 18 horas). Segundo tais comentários, a pronúncia dos atores do núcleo interiorano do folhetim estaria exagerada, já que ninguém fala desse modo.

Em outra oportunidade, eu já havia discutido essa questão de como atores baseados no Rio de Janeiro ou em São Paulo imitam pronúncias regionais ou sotaques estrangeiros no artigo Sotaque de novela.

É evidente que o sotaque que ouvimos nessa novela é carregado e por vezes pouco verossímil, mas neste caso parece que a intenção é essa mesmo – afinal, trata-se de uma obra cômica, que busca o tom caricato. O público pode gostar ou não do gênero, mas não cabe dizer que a pronúncia está errada; fosse uma telenovela dramática, as críticas seriam pertinentes.

Além disso, quem conhece o interior sabe que em certas regiões, principalmente da zona rural, a pronúncia é de fato carregada, em especial entre os mais velhos e os menos escolarizados.

O que chama a atenção de um especialista em linguística não é, portanto, o sotaque, mas um erro comum quando um cidadão urbano, como são os atores, tenta imitar o “caipirês”: como se sabe, os habitantes da roça costumam trocar “l” final de sílaba por “r” (“animar”, “arma”, “artura” por “animal”, “alma”, “altura”). Só que, como na maior parte do Brasil o “l” e o “u” finais de sílaba soam igual, alguns atores acabam pronunciando “cér” e “armento” por “céu” e “aumento”.

No verdadeiro português caipira, só o “l” é trocado por “r”; o “u” permanece tal e qual se a sílaba é tônica (caso de “céu” e “capiau”) ou então o ditongo a que pertence se reduz a uma vogal “o” ou “u” se a sílaba é átona (“omento”, “Oropa”, “uvido” em lugar de “aumento”, “Europa”, “ouvido”).

É que o dialeto caipira (sim, o caipirês é um dialeto) descende diretamente do português falado pelos nossos primeiros colonizadores e, como se sabe, os portugueses fazem clara distinção entre “l” e “u” (“mal” e “mau” não têm a mesma pronúncia em Portugal, razão pela qual eles não têm a mesma dificuldade que nós em grafar essas palavras).

Seja como for, mesmo essa impropriedade fonética deve ser relevada como “licença poética”, pois se trata de uma comédia, em que todos os exageros são permitidos em nome do humor.