Detecção de fraudes em amostras de leite através de espectroscopia elétrica de impedância
Autor: Victor Rodrigues Botelho
O Brasil é o terceiro maior produtor mundial de leite. A cadeia produtiva do setor lácteo brasileiro é uma das principais atividades econômicas do país, sendo muito importante na geração de emprego e renda e onde os conceitos da Agricultura 4.0 podem promover a melhoria do processo produtivo aumentando a ecoeficiência e melhorando o impacto socioeconômico. A qualidade dos alimentos é um atributo que requer sua manutenção dentro de normas estabelecidas pelas autoridades sanitárias. A fraude no leite constitui crime e sua prática pode promover diminuição do valor nutricional do produto em virtude da presença de substâncias que podem causar mal à saúde. A Química Analítica tem desenvolvido técnicas instrumentais que possibilitam ampliar as fronteiras de análise de analitos que se encontram em diferentes ambientes. Dentre estas técnicas, a Espectroscopia Elétrica de Impedância (EEI) se apresenta como uma técnica analítica promissora para o desenvolvimento de sensores, em uma ampla variedade de configurações, e possui potencial para aplicação não invasiva. Este trabalho teve como objetivo elaborar um procedimento computacional para detecção de fraudes em amostras de leite aplicando os conceitos da espectroscopia elétrica de impedância. Para isso, foi necessário obter e avaliar datasets quantitativos de propriedades elétricas do leite, utilizar estatística multivariada para analisar dados das variáveis das amostras do leite e verificar a existência de correlação entre as mesmas. Isso permitiu a interpretação da influência de cada uma das variáveis analisadas. A modelagem computacional empírica foi feita utilizando métodos de aprendizado não supervisionado, como K-means e supervisionado, como Random Forest, Support Vector Machine e K-Nearest Neighbor, sendo que 70% dos dados disponíveis nos conjuntos foram utilizados para elaboração dos modelos e os 30% restantes para validação dos modelos. A validação quantitativa foi expressa em percentuais de confiabilidade das predições, e a avaliação qualitativa foi através de matrizes de confusão e parâmetros como acurácia, precisão, revocação e medida-F. A validação permitiu verificar que o modelo K-Nearest Neighbor foi o melhor para identificar fraudes por água, água deionizada e formaldeído 37%, enquanto que outros modelos como K-Nearest Neighbor e K-means foram os melhores para verificar fraudes por gordura no leite.
Link para acesso: Texto completo