Gene Repórter: Como é que é? - Aparelhos de teste de voz pra detectar mentiras?

Não é de hoje que se recorrem aos tais aparelhos detectores de mentira. Pretensamente captam sinais emitidos pelo corpo humano que se associam a situações em que contamos inverdades.

O mais famoso e antigo é o polígrafo, criado em 1921, que mede sinais fisiológicos como pressão sanguínea e umidade da pele. A suposição é de que o indivíduo, ao contar uma mentira, fica nervoso - sua pressão sobe e aumenta a sudorese. Como há indivíduos que têm pressão mais alta ou que suam mais, é feita uma rodada de teste em que o indivíduo deve responder a algumas perguntas de modo verdadeiro e a outras de modo falso (claro que as perguntas se referem a elementos verificáveis como nome, número de identidade, endereço, profissão...): uma fase de calibragem do aparelho.

Uma geração mais nova usa software de análise de som. Sinais como timbre e intervalo entre as falas estariam correlacionados a enunciações inverídicas. Outros analisam o movimento dos olhos do indivíduo enquanto fala.

E há pesquisas para o desenvolvimento de imageamento funcional cerebral (fMRI).

Nos EUA tais dispositivos são usados corriqueiramente pela polícia na análise de depoimentos, pelo governo para o recrutamento de pessoal, sendo ocasionalmente aceito como provas em processos judiciais. Na TV é o astro de programas desde a década de 1950: seja em séries ficcionais, em entrevistas de celebridades, seja em games shows nos quais os candidatos a prêmio são eliminados se o aparelho disser que faltou com a verdade ao responder a perguntas cada vez mais íntimas e constrangedoras.

O Brasil importou esses formatos de programas televisivos. E agora está a ser utilizado como elemento de reportagens, analisando declarações públicas de personalidades.

Mas qual o grau de confiabilidade nesses resultados? Melhor do que bancar Harvey Dent jogando uma moeda para dizer se o indivíduo está mentindo ou dizendo a verdade, porém deixa muito a desejar. Essa é conclusão de um painel de especialistas do National Research Council dos EUA que revisou 57 estudos sobre a validade do polígrafo (National Research Council 2003).

Sobre os indícios de precisão dos polígrafos (National Research Council 2003):
"CONCLUSION: Notwithstanding the limitations of the quality of the empirical research and the limited ability to generalize to real world settings, we conclude that in populations of examinees such as those represented in the polygraph research literature, untrained in countermeasures, specific-incident polygraph tests can discriminate lying from truth telling at rates well above chance, though well below perfection. Because the studies of acceptable quality all focus on specific incidents, generalization from them to uses for screening is not justified. Because actual screening applications involve considerably more ambiguity for the examinee and in determining truth than arises in specific-incident studies, polygraph accuracy for screening purposes is almost certainly lower than what can be achieved by specific-incident polygraph tests in the field."
"CONCLUSION: Basic science and polygraph research give reason for concern that polygraph test accuracy may be degraded by countermeasures, particularly when used by major security threats who have a strong incentive and sufficient resources to use them effectively. If these measures are effective, they could seriously undermine any value of polygraph security screening."
["CONCLUSÃO: Apesar das limitações da qualidade da pesquisa empírica e da habilidade limitada para generalizar para as condições do mundo real, concluímos que nas populações dos examinados como as representadas na literatura de pesquisa sobre polígrafos, sem treinamento em contramedidas, testes de polígrafo específicos para o caso pode discriminar as falas mentirosas das verdadeiras a uma taxa bem acima do acaso, embora bem abaixo da perfeição. Como todos os estudos de qualidade aceitável focam-se em casos específicos, generalizar a partir disso para o uso em varredura/filtragem não é justificável. Como as aplicações reais de varredura/filtragem envolvem consideravelmente mais ambiguidade para os examinados e na determinação da verdade do que surge em estudos de casos específicos, a precisão do polígrafo para fins de varredura/filtragem quase certamente é mais baixa do que pode ser atingida em testes de campo de polígrafo em casos específicos."
"CONCLUSÃO: A ciência básica e a pesquisa de polígrafo dão razão para a preocupação de que a precisão do teste de polígrafo pode ser reduzida por contramedidas, particularmente quando usado pelas principais ameaças à segurança, que têm um forte incentivo e recursos suficientes para usá-las de modo efetivo. Se essas medidas são efetivas, elas podem minar seriamente qualquer valor do polígrafo em varredura/filtragem de segurança."]

O índice de precisão do polígrafo em laboratório foi em média de 86% e, em campo, de 89%, isto é, entre 14 e 11% dos diagnósticos eram errados (falsos positivos e falsos negativos) (National Research Council 2003). Em um estudo com 126 condenados por crimes sexuais, Grubin et al. (2006) obtiveram uma sensibilidade (taxa de detecção de positivos verdadeiros) de 83% e uma especificidade (taxa de detecção de negativos verdadeiros) de 70% - isto é, uma taxa de falsos negativos de 17% e de falsos positivos de 30%.

Para a fMRI a situação parece ser um pouco melhor, mas ainda assim problemática segundo análise de Simpson (2008):
"Thus far, under carefully controlled experimental conditions, an accuracy of 90 percent is the best that has been achieved. Improvements in the technology that would reduce the error rate from 10 percent to something comparable with the billions-to-one accuracy of DNA testing are difficult to conceive of, given the mechanics of the science involved.
Perhaps more important, the technique does not directly identify the neural signature of a lie. Functional MRI lie detection is based on the identification of patterns of cerebral blood flow that statistically correlate with the act of lying in a controlled experimental situation. The technique does not read minds and determine whether a person's memory in fact contains something other than what he or she says it does. The problem of false-positive identification of deception is unlikely to be overcome to a sufficient degree to allow the results of an fMRI lie detection test to defeat reasonable doubt."
["Até o momento, sob condições experimentais cuidadosamente controladas, uma precisão de 90 porcento é o melhor que foi atingindo. Melhorias na tecnologia que podem reduzir a taxa de erro de 10 porcento para algo comparável a um erro de um em bilhões do teste de ADN são difíceis de se conceber dado a mecânica da ciência envolvida.
Talvez mais importante, a técnica não identifica diretamente a assinatura neural da mentira. A detecção de mentira por fMRI é baseada na identificação dos padrões de fluxo sanguíneo cerebral que se correlaciona estatisticamente com o ato de mentir em situação experimental controlada. A técnica não lê mentes nem determina se a memória de uma pessoa de fato contém algo além do que ele ou ela diz que contém. O problema da identificação de mentira falsamente positiva é improvável de ser superado a um grau que permita aos resultados de um teste de detecção de mentira por fMRI eliminarem a dúvida razoável."]

A pior condição parece ser justamente o de análise de voz, a mais popular atualmente (ao menos no que se refere a uso de entretenimento e jornalístico), Harnsberger et al. (2009) em um estudo com 48 sujeitos experimentais conclui:
"The results showed that the 'true positive' (or hit) rates for all examiners averaged near chance (42–56%) for all conditions, types of materials (e.g., stress vs. unstressed, truth vs. deception), and examiners (scientists vs. manufacturers). Most importantly, the false positive rate was very high, ranging from 40% to 65%. Sensitivity statistics confirmed that the LVA system operated at about chance levels in the detection of truth, deception, and the presence of high and low vocal stress states."
["Os resultados mostraram que a taxa de 'positivo verdadeiro' (ou acerto) para todos os examinadores tiveram uma média próxima ao acaso (42-56%) para todas as condições, tipos de materiais (e.g. sob tensão vs. relaxado, verdade vs. mentira) "] e examinadores (cientistas vs. fabricantes). Mais importante, a taxa de falso positivo foi bastante alta, variando de 40% a 65%. Estatística de sensibilidade confirmou que o sistema LVA operou no nível do acaso na detecção da verdade, mentira e presença de estados de tensão vocal alta ou baixa."]

Em um teste de campo com 300 pessoas detidas, apenas 15% das mentiras sobre uso de droga foram detectadas pela análise de voz.

Gostaria de achar um estudo comparativo entre esses sistemas de detecção de mentira e o simples palpites de pessoas - especialistas e não-especialistas. Seria interessante verificar o quão bem (ou quão mal) se saem esses testes pretensamente objetivos frente a análises mais subjetivas.*

De todo modo, são métodos ainda bastante falhos para os fins a que se destinam; caso sejam os únicos elementos para a formação de convicção a respeito de declarações, grandes injustiças podem ocorrer com probabilidade da ordem de 10% ou, no pior dos casos, a uma razão indistinguível do acaso.

Referências
Grubin, D. 2006. Accuracy and utility of post-conviction polygraph testing of sex offenders The British Journal of Psychiatry, 188 (5), 479-483 DOI: 10.1192/bjp.bp.105.008953
Harnsberger, J., Hollien, H., Martin, C., & Hollien, K. 2009. Stress and Deception in Speech: Evaluating Layered Voice Analysis Journal of Forensic Sciences, 54 (3), 642-650 DOI: 10.1111/j.1556-4029.2009.01026.x
National Research Council 2003. The Polygraph and Lie Detection. Committee to Review the Scientific Evidence on the Polygraph. Division of Behavioral and Social Sciences and Education. Washington, DC: The National Academies Press.
Simpson JR 2008. Functional MRI lie detection: too good to be true? The journal of the American Academy of Psychiatry and the Law, 36 (4), 491-8 PMID: 19092066

*Upideite(01/jun/2012): Achei um artigo que se refere a resultados de outros estudos sobre o desempenho de humanos na detecção de mentira. São 9 estudos em que o acerto ao acaso era de 50%, as taxas de acerto por humanos variaram de 48 a 72%; em 1 estudo em que o acerto ao acaso era de 33,3%, os humanos acertaram 38% das vezes. Contra a chance de acerto ao acaso de 50%, a taxa média de acerto foi de 57,0±7,8%. Em outro artigo, revisando 206 estudos, a taxa de acerto média foi de 54% (47% de sensibilidade e 61% de especificidade). Em outra meta-análise, com 108 estudos, não houve diferença entre pessoas treinadas: policiais, juízes, investigadores, psicólogos e não treinadas: alunos e outras pessoas - 55,51% contra 54,22%.

Lives de Ciência

quarta-feira, 30 de maio de 2012

Como é que é? - Aparelhos de teste de voz pra detectar mentiras?

Nenhum comentário:

LinkWithin

Sobre

Parceria

Documento GR

Links

Cinto de utilidades

Siganme los buenos

Arquivo do blog

Copyleft