Os programas detectores de plágio e os dados numéricos

A partir de 1º de dezembro, dissertações, teses, TCCs e residências defendidos na Unicamp deverão passar pela análise de um software, como forma de revisão de textos e evitar plágios (segundo Instrução Normativa CCPG Nº 003/2021). Tem sido cada vez mais comum o uso desses programas e cada instituição opta por aquele que mais se adéqua ao seu cotidiano.

O periódico Economia e Sociedade (ISSN 1982-3533), vinculado ao Instituto de economia (IE) da Unicamp, por exemplo, tem parceria com o próprio Turntin (empresa norte-americana que administra a ferramenta de detecção de plágio). No mesmo IE, a revista Leituras de Economia Política – LEP (ISSN 1415-6245) usa o verificador de plágio Copyspider.

Cada revista tem suas especificidades; assim como cada software desses, mas basicamente seu funcionamento é o mesmo: procuram similaridades entre o texto em questão e outros disponíveis on-line. Aqui, as semelhanças devem ser evitadas.

Entretanto, quando o assunto são números, é mais complicado manipular – com boa ou má intenção. Chama atenção quando os dados estão muito organizados. Acompanho as colunas de Marcelo Viana, diretor-geral do Instituto de Matemática Pura e Aplicada (Impa), na Folha de S. Paulo; descobri através delas a lei de Benford (NEWCOMB, 1881; BENFORD, 1938).

Simon Newcomb (1835 – 1909) percebeu que os primeiros dígitos de dados astronômicos eram menos frequentes e usados quanto mais se aproximavam do 9 em suas tabelas de logaritmos (VIANA, 2021a).

Assim como o Turntin ou o Copyspider para textos, a lei de Benford é utilizada para se analisar dados numéricos, separando verdadeiros de falsos ou incorretos e fraudulentos (VIANA, 2021b).

Newcomb percebeu o padrão, mas foi Frank Benford (1883-1948) quem deu forma à lei que leva seu nome, verificando que essa frequência nos primeiros dígitos é percebida na maior parte dos dados numéricos naturais (VIANA, 2021b). Como aquela máxima de que toda e qualquer sequência numérica já existe dentro de pi (π): seu RG, CPF e até sua senha do banco; tudo isso contido na relação entre o perímetro de uma circunferência e seu diâmetro.

A propriedade da invariância da escala contida na lei de Benford é que a torna interessante (VIANA, 2021c). Podem-se fabricar, baseando-se nas frequências observadas, dados de exportação brasileira de soja em grão em preços FOB (US$), mas convertendo-os para Reais (R$), a frequência dos primeiros dígitos tem que também apresentar similaridades – é mais difícil para dados intencionalmente manipulados conterem a mesma invariância em diferentes escalas.

Viana (2021a), usando dados do site do IBGE, calculou a frequência do primeiro dígito das populações dos municípios brasileiros, como mostrado na Figura 2.

A observação empírica da lei fora observada também na sequência dos números de Fibonacci e em dados da Comissão de Valores Mobiliários (CVM), mas não na dos números primos (TEIXEIRA, 2016).

Cunha (2013) debate o uso da lei acerca da auditoria de obras públicas; Café (2015), um caso específico dessas obras, o Expresso Sul, no Distrito Federal; e Cella & Rech (2017) discutem a lei como maneira de detectar fraudes em relação à Petrobras e ressalvam, entretanto, que a interpretação dos resultados das frequências dos primeiros dígitos deve ser feita com cautela.

Baseando-se na lei de Benford, a busca por discrepâncias em dados numéricos funciona ao contrário dos softwares que analisam plágio textual. Nela, a similaridade na frequência dos primeiros dígitos dos dados é que deve ser preservada.

Crédito da foto da página inicial: Divulgação/Cemeai-USP

REFERÊNCIAS

Benford, F. (1938). The law of anomalous numbers. Proceedings of the American philosophical society, 551-572.

Café, R. M. O uso da Lei de Benford na auditoria de obras públicas: o caso do VLP. 2015. 54 f., il. Monografia (Bacharelado em Ciências Econômicas). Universidade de Brasília (UNB).

Cella, R. S. & Rech, I. J. (2017). Caso Petrobras: a lei de Benford poderia detectar a fraude? Revista de Gestão, Finanças e Contabilidade, 7(3), 86-104.

Cunha, F. C. R. (2013). Aplicações da lei Newcomb-Benford à auditoria de obras públicas. 486 f., il. Dissertação (Mestrado em Regulação e Gestão de Negócios). Universidade de Brasília (UNB).

Newcomb, S. (1881). Note on the frequency of use of the different digits in natural numbers. American Journal of mathematics, 4(1), 39-40.

Teixeira, A. C. (2016). Lei de Benford e aplicações. Instituto de Matemática e Estatística da USP.

Viana, M. (2021a). Quando a matemática parece magia. Folha de S. Paulo.

Viana, M. (2021b). A magia da lei de Benford. Folha de S. Paulo.

Viana, M. (2021c). Para que serve a lei de Benford. Folha de S. Paulo.


Publicado

em

,

por

Comentários

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.