Um dos princípios da linguística histórica e da linguística comparada para a classificação filogenética de línguas é a busca por traços fonéticos, morfológicos, sintáticos e léxicos comuns entre idiomas distintos. A presença dessas semelhanças estruturais entre línguas costuma ser um bom indício de parentesco entre elas.
No entanto, muitas vezes os linguistas foram induzidos a erro por similaridades estruturais que não decorriam de verdadeiro parentesco – em alguns casos, havia no máximo um parentesco muito distante, que não justificava as coincidências – nem de convergência fortuita, em que processos evolucionários diferentes conduzem casualmente ao mesmo resultado.
Um terceiro fator leva às vezes a que línguas não aparentadas apresentem traços muito semelhantes, como o emprego dos mesmos sons fonéticos, modos semelhantes de formar palavras ou frases e vocabulário comum. Trata-se da interação que historicamente se deu entre elas pelo contato e/ou pelo bilinguismo. Em ambos os casos, a influência recíproca entre os idiomas decorre de sua proximidade geográfica.
Em 1904, o linguista polonês Jan Courtenay argumentou que era preciso distinguir entre semelhanças linguísticas decorrentes de uma relação genética (que ele chamou de rodstvo, “parentesco”) e aquelas decorrentes de convergência devida ao contato linguístico (srodstvo, “afinidade”). Outro linguista, o russo Nikolai Trubetzkoy, introduziu o termo языковой союз (yazykovoy soyuz; isto é, “união linguística”) para denotar essas similaridades não genéticas. Posteriormente, propôs um decalque alemão desse termo, Sprachbund, definindo-o como um grupo de línguas com semelhanças na estrutura morfológica, sintaxe, vocabulário de cultura e sistema fonológico, mas sem correspondências fonéticas sistemáticas nem morfologia básica ou vocabulário básico compartilhados.
O que normalmente ocorre é que populações de línguas diferentes que estão em contato numa fronteira linguística ou por habitarem uma mesma região acabam aprendendo em maior ou menor grau a língua uma do outra e se tornam bilíngues – às vezes, quando há mais de duas populações distintas em contato, trilíngues ou plurilíngues.
Quando isso acontece, surge um fenômeno chamado interferência linguística, em que o falante utiliza inconscientemente elementos de sua língua materna ao falar o idioma estrangeiro. Podem ser sons (o famoso sotaque), palavras (um exemplo típico são falantes do espanhol dizendo una em vez de uma ou usando o sufixo ‑ción no lugar de ‑ção ao falar português) ou mesmo construções sintáticas (novamente um hispanofalante dizendo “me gosta muito isso” em vez de “eu gosto muito disso”).
O resultado é que línguas em convívio acabam adquirindo traços umas das outras mesmo que não tenham relações filogenéticas entre si.
Um exemplo disso são as chamadas “vogais mestiças”, típicas do francês e das línguas germânicas. São vogais anteriores arredondadas, ou, trocando em miúdos, aquelas vogais que pronunciamos como “é”, “ê” ou “i”, mas fazendo “biquinho”. Tecnicamente, essas vogais são representadas no Alfabeto Fonético Internacional como [œ], [ø], [ʏ] e [y]. Essas vogais nasceram nas línguas germânicas quando um o ou u longos ou breves eram seguidos de sílaba contendo i vocálico ou semivocálico. Porém o francês, que é língua românica, mas sempre viveu cercada de dialetos germânicos, adotou essas vogais.
Em contrapartida, o r gutural francês (que aqui no Brasil chamamos de r carioca) surgiu por volta do século XVII como uma pronúncia vulgar da plebe parisiense e acabou, dois séculos depois, tornando-se a pronúncia padrão do r não apenas do francês, mas também do alemão, holandês, luxemburguês e dinamarquês (dialetalmente também do norueguês). E, pasmem, chegou até Lisboa, de onde veio para o nosso país com a Família Real em 1808 e tornou-se um século depois a pronúncia usual não só do Rio de Janeiro como de boa parte do Brasil.
Outro caso interessante de convergência areal (isto é, de área linguística) em línguas não relacionadas geneticamente são as línguas dos Bálcãs (albanês, búlgaro, macedônio, romeno, turco), todas tendo artigo definido posposto ao substantivo (algo como menino-o em vez de o menino), a presença da vogal [ɨ] (cujo som se assemelha ao que emitimos quando levamos um soco no estômago), todas evitando o infinitivo e formando o futuro da mesma forma.
Vale citar também o fato de muitas línguas do sudeste asiático e Extremo Oriente, de famílias tão díspares como o sino-tibetano, hmong-mien, tai-kadai, austronésio e mon-khmer, que se estendem da China à Tailândia, serem isolantes, formadas de palavras monossilábicas, e tonais, apresentando três tons diferentes que distinguem significado.
Temos também a presença do chamado “l escuro” (o l da pronúncia lusitana do português) opondo-se fonologicamente ao l palatalizado (parecido com nosso lh) em línguas eslavas e túrcicas da Ásia central, as consoantes retroflexas (pronunciadas com a ponta da língua no céu da boca) em vários idiomas não aparentados da Índia, os cliques (estalos da língua) tanto nas línguas khoisan quanto nas bantu da África, a ausência do u semivocálico (isto é, [w]) e sua substituição por v nas línguas do leste europeu, a ausência de p no árabe e em línguas do norte da África, e assim por diante.
Na Europa, podemos citar, além dos exemplos já mencionados, construções sintáticas absolutamente paralelas nas línguas românicas e nas germânicas, como os tempos cursivos formados com o verbo “ser/estar” + gerúndio (estou/estava/estarei estudando), presente em português, espanhol, italiano e inglês, os tempos perfectivos com “ter/haver” + particípio (tenho estudado, havia estudado) em todas as línguas de ambas as famílias, a voz passiva analítica com “ser” + particípio (a lição foi estudada) igualmente em todos esses idiomas, além, é claro, de muitas coincidências vocabulares decorrentes de empréstimos mútuos entre essas línguas, bem como importações do grego e do latim clássicos.