Departamento de Ciências de Computação

Gustavo Enrique de Almeida Prado Alves Batista

Gustavo Batista holds a Master's and Ph.D. degrees in Computer Science from the University of São Paulo in São Carlos. In 2007, he joined the Institute of Mathematical and Computer Sciences as an assistant professor and became an associate professor in 2016. From 2010 to 2011, he was a visiting researcher at the University of California, Riverside. Dr. Batista has more than 100 peer-reviewed papers in conferences and journals and more than 5000 citations. He served as a member of premier conference program committee, such as ACM-KDD, SIAM-SDM, IEEE-ICDM and IJCAI, and as a member of the editorial board of the Machine Learning Journal. His research has been funded by various agencies such as FAPESP, CNPq, USAID, and Google. He has been a CNPq Productivity Fellow since 2013. His research interests include machine learning, data mining, time series, and data stream processing with applications in music recovery, public health, agriculture, and the environment.

  • http://lattes.cnpq.br/3521622923263530 (27092020)
  • Rótulo/Grupo:
  • Bolsa CNPq:
  • Período de análise:
  • Endereço: Universidade de São Paulo. . Instituto de Ciências Matemáticas e de Computação. Av. Trabalhador São-carlense, 400 CEP 13560970 - São Carlos, SP - Brasil
  • Grande área: [sem-grandeArea]
  • Área: [sem-area]
  • Citações: Google Acadêmico

Produção bibliográfica

Produção técnica

Produção artística

Orientações em andamento

Supervisões e orientações concluídas

Projetos de pesquisa

Prêmios e títulos

Participação em eventos

Organização de eventos

Lista de colaborações


Produção bibliográfica

Produção técnica

Produção artística

Orientações em andamento

Supervisões e orientações concluídas

Projetos de pesquisa

  • Total de projetos de pesquisa (16)
    1. 2007-2007. Machine Learning with Imbalanced Data Sets
      Diversos fatores podem influenciar no desempenho de classificação de novos exemplos dos métodos de Aprendizado de Máquina - AM -, os quais são freqüentemente utilizados em Descoberta de Conhecimento em Bases de Dados - KDD. Entre eles está o problema de aprender na presença de classes desbalanceadas ou assimétricas. Esse problema ocorre quando algumas classes apresentam um número muito maior de exemplos do que outras. Pesquisadores têm reportado que classes desbalanceadas ocorrem com freqüência em bases de dados do mundo real originárias de diversos domínios de aplicação. Mesmo com toda pesquisa realizada sobre o assunto, não existe um consenso sobre quais abordagens são as mais indicadas para lidar com esse problema. Este projeto de pesquisa tem como principal objetivo realizar uma ampla pesquisa sobre o problema de classes desbalanceadas. Essa pesquisa irá investigar como o problema de classes desbalanceadas influencia o desempenho obtido por sistemas de AM. Como resultado final espera-se obter um conjunto de recomendações que possam auxiliar um pesquisador/usuário com um conjunto de dados com classes desbalanceadas a melhor tratar esse problema.
      Membro: Gustavo Enrique de Almeida Prado Alves Batista.
    2. -.

      Membro: Gustavo Enrique de Almeida Prado Alves Batista.
    3. 2007-2007. Computational Modelling of Complex Systems using Data, Image and Text Mining
      O objetivo geral deste projeto, o qual pode ser caracterizado como um projeto de pesquisa científica e tecnológica, é pesquisar, propor e desenvolver soluções para a representação, indexação, modelagem e análise de dados complexos para possibilitar que um analista do domínio possa compreender os inter-relacionamentos existentes nos dados, imagens e textos, de modo a auxiliá-lo a tomar decisões nos processos de recuperação de informação, descoberta de conhecimento e diagnóstico. O projeto visa o desenvolvimento de um ferramental teórico e prático que auxilie analistas na modelagem desse tipo de sistemas complexos, com foco nos temas de: indução de modelos simbólicos com aplicações em sériestemporais e dados sequenciais; anáise de bases de dados não-estruturados e semi-estruturados para mineração de textos; mineração de imagens em um sistema de arquivamento e recuperação de imagens médicas por conteúdo
      Membro: Gustavo Enrique de Almeida Prado Alves Batista.
    4. 2009-2009. Sequential and Temporal Data Mining

      Membro: Gustavo Enrique de Almeida Prado Alves Batista.
    5. 2010-2010. Time Series Classification Algorithms Applied to Embedded Systems
      Integrating sequential and temporal data into the Data Mining process is of one of the most important challenges in Machine Learning. In this project, we are mostly interested in developing time series classification algorithms. The k-nearest neighbor algorithm is a common approach to time series classification. This algorithm has been known to perform well, especially when allied to distance measures that can deal with time lags, such as the Dynamic Time Warping. However, the classical k-nearest neighbor algorithm is computationally intensive. One may solve this problem by using indexes to increase the efficiency of similarity queries. This project proposes to investigate indexing algorithms that have the properties of anyspace algorithms. Anyspace algorithms are able to deal with different amounts of memory, in such a way that the algorithm performance depends directly on the amount of available memory. Such algorithms allow specifying the amount of memory based on the performance required by an embedded application. This project also deals with classification methods based on induction of classification rules. An approach to induce rules from time series data is the identification of motifs. Motifs are frequently occurring subsequences that usually represent a phenomenon of interest. A convenient aspect of rules is the ease one finds in writing a procedural program which implements the rule's logic with little memory and processing resources. The algorithms developed in this post-doctoral stage will be applied in insect control and monitoring using devices developed by ISCA Technologies.
      Membro: Gustavo Enrique de Almeida Prado Alves Batista.
    6. 2006-2006. Institute Factory of Millennium
      Os objetivos gerais do Instituto Fábrica do Milênio (IFM) podem ser entendidos como a proposição, o desenvolvimento e a disseminação de mecanismos para o aumento da competitividade e do conhecimento científico e tecnológico das empresas instaladas no país, através da formação de um cluster de pesquisas integradas, abordando os os temas que determinam hoje a competitividade de empresas de manufatura. O conjunto de instituições e projetos envolvidos formam uma massa crítica que os capacitam a desenvolver um espectro de pesquisas (que abrangem desde o desenvolvimento de tecnologias industriais básicas até elementos de gestão) que podem, se organizadas de forma integrada, contribuir efetivamente para o desenvolvimento das indústrias brasileiras. Descrição completa desse projeto encontra-se em: http://www.ifm.org.br.
      Membro: Gustavo Enrique de Almeida Prado Alves Batista.
    7. 2012-2012. Complexity-invariance for Classification, Clustering and Motif Discovery in Time Series
      Recently, there is an increasing interest in time series processing due to the large number of application domains that generate data with such property. Such interest can be measured by the vast amount of methods recently proposed in literature to tasks such as classification, clustering, summarization, abnormality detection and motif discovery. Recent studies have shown for several problems that methods based on similarity present an efficacy that is hardly surpassed, even when compared to more sophisticated methods. This is mainly due to the fact that the community has studied and proposed several invariances to distance measures for time series. The invariances make the distance measures ignore certain undesired data properties. The most well-known example is the invariance to local differences in time scale, obtained with the warping technique. Other invariances include the invariance to differences in amplitude and offset, phase and occlusion. Recently, we demonstrated to the scientific community that time series similarity classification methods can be largely benefited by a new invariance: complexity invariance. The main objective of this research project is to investigate new complexity-invariant distance measures and assess how such measures can improve the efficacy especially of clustering and motif discovery algorithms.
      Membro: Gustavo Enrique de Almeida Prado Alves Batista.
    8. -.

      Membro: Gustavo Enrique de Almeida Prado Alves Batista.
    9. 2012-2012. Wireless Bug-Sensor: Wireless Sensors to Enable Precision Agriculture and Increase Food Yields in Developing Countries
      The project objective is the development of an important tool for farmers worldwide: tiny, inexpensive sensors that can automatically count and classify the insects in the field. This technology then translates the information and sends the farmer a once-a-day text message with instructions on the type of intervention necessary and a map of the isolated locations where action is needed. This method allows farmers a more targeted approach than mass intervention, reducing costs for labor and pesticides.
      Membro: Gustavo Enrique de Almeida Prado Alves Batista.
    10. 2010-2010. Counting and classifying insects with ultra-cheap sensors
      We propose to build ultra cheap (less than $5) sensors that can count and distinguish between various kinds of insects (including malaria vectors) from a large distance. Our work has the potential to revolutionize epidemiological modeling by proving accurate real-time counts of vectors down to the species/sex level, thus allowing for more effective vector control.
      Membro: Gustavo Enrique de Almeida Prado Alves Batista.
    11. 2013-2013. Research on Geo-spatial Marine Biology Data Mining Using Time Series, Text Mining and Visualization
      We propose a focused, interdisciplinary research project on data mining and data visualization with a specific focus on marine data. This data is particularly challenging for data mining as it presents only a very sparse set of data points with respect to the volume of the marine space that is being modelled and investigated. It also presents a set of challenges in visualization of data and of modelling results, as the data are inherently three-dimensional and from an unfamiliar context relative to data from on land. We will work in an interdisciplinary team with researchers in data mining, data visualization, and marine biology to develop visualization methods that will be appropriate for marine biology applications of data mining. The data may be derived from multiple disparate sources, including fisheries or scientific surveys, autonomous sensors, satellite data or field studies. For model outputs, we will particularly work on the visualization of results from a new generation of ecosystem model, analogous to the general circulation models used to predict global climate. This model includes all organism types on both land and sea. We face the challenge that it can produce gigabytes to terabytes of outputs, including tracking all organism interactions, individual states, and the spatial distribution of individuals. Thus we need to summarize, extract, and visualize outputs at multiple scales including that of individuals, ecological communities, and the globe. These data need to be visualized in a manner that will then be useful and interpretable for the international policy community.
      Membro: Gustavo Enrique de Almeida Prado Alves Batista.
    12. 2014-2014. Real-time Monitoring of Insect Pragues in Agriculture and the Environment
      Não há dúvidas de que insetos são muito importantes na agricultura e no meio ambiente. Embora os insetos que mais atraiam atenção sejam as pragas agrícolas, muitos insetos são benéficos para o meio ambiente e para os seres humanos. Por exemplo, insetos são responsáveis pela polinização de pelo menos dois terços de todos os alimentos consumidos no mundo. Devido à sua importância para os seres humanos, o recente declínio das populações de insetos polinizadores, especialmente as abelhas, é considerado um grave problema ambiental frequentemente associado à exposição a pesticidas. Acreditamos que pelo uso de tecnologia é possível reduzir a utilização de pesticidas. Para isso, propomos uma armadilha inteligente de baixo custo que captura seletivamente espécies de insetos nocivos, libertando todas as outras espécies. Tal armadilha terá um impacto mínimo sobre o meio ambiente. No cerne da armadilha inteligente encontra-se um novo sensor que estamos desenvolvendo. Este sensor faz uso de uma luz laser para capturar dados de insetos à distância e utiliza técnicas de Aprendizado de Máquina para identificar as espécies de insetos. Neste projeto propomos desenvolver o sensor e a armadilha inteligente e utilizá-los em uma importante aplicação agrícola, capturando o psilídeo dos citros. Esta praga afeta plantações de laranja e está presente no Brasil e nos Estados Unidos. Descrevemos os desafios científicos e tecnológicos para desenvolver tal armadilha inteligente. Discutimos o nosso plano para desenvolve-la em um prazo de quatro anos a partir do estado atual de desenvolvimento até a realização de experimentos em campo.
      Membro: Gustavo Enrique de Almeida Prado Alves Batista.
    13. 2014-2014. Projeto e desenvolvimento de uma armadilha inteligente para insetos com o objetivo demonstrar seu funcionamento para imprensa e público
      Não há dúvidas de que insetos são muito importantes na agricultura e no meio ambiente. Embora os insetos que mais atraiam atenção sejam as pragas agrícolas, muitos insetos são benéficos para o meio ambiente e para os seres humanos. Por exemplo, insetos são responsáveis pela polinização de pelo menos dois terços de todos os alimentos consumidos no mundo. Devido à sua importância para os seres humanos, o recente declínio das populações de insetos polinizadores, especialmente as abelhas, é considerado um grave problema ambiental frequentemente associado à exposição a pesticidas. Acreditamos que pelo uso de tecnologia é possível reduzir a utilização de pesticidas. Para isso, propomos uma armadilha inteligente de baixo custo que captura seletivamente espécies de insetos nocivos, libertando todas as outras espécies. Tal armadilha terá um impacto mínimo sobre o meio ambiente. No cerne da armadilha inteligente encontra-se um novo sensor que estamos desenvolvendo. Este sensor faz uso de uma luz laser para capturar dados de insetos à distância e utiliza técnicas de Aprendizado de Máquina para identificar as espécies de insetos. Neste projeto propomos desenvolver uma armadilha inteligente para fins de demonstração ao público em geral em feiras e para a imprensa. Essa armadilha consiste em três câmaras, a primeira com duas espécies de insetos misturadas, está conectada as outras duas por meio de um tubo. No tubo é instalado o sensor juntamente com uma porta abre-fecha. O sensor irá classificar os insetos em tempo real separando as espécies nas outras duas câmaras. A armadilha deve ser construída em acrílico ou outro material transparente com o objetivo de permitir a visualização de todo o processo de identificação e classificação dos insetos.
      Membro: Gustavo Enrique de Almeida Prado Alves Batista.
    14. 2016-2016. An Intelligent Trap and Mobile Application to Motivate Local Mosquito Control Activities
      In the last years we have witnessed a tremendous increase of dengue fever cases followed by the appearance of zika and chikungunya fevers. All these diseases have in common the Aedes aegypti mosquito as the main vector. The Aedes aegypti is highly adapted to urban conditions and its resilience to insecticides has made unilateral governmental mosquito control activities ineffective. The control of the mosquito is only possible with the joint effort of organizations, governments and the active participation of the population. In this project, we propose an innovative approach for community engagement and vector control. Our idea is to propose an inexpensive intelligent trap that will empower the population with the knowledge of Aedes aegypti densities. Such a trap will make use of mobile devices to educate the population about proper mosquito control activities as well as evaluate the effectives of these activities based on the number of captured mosquitoes.
      Membro: Gustavo Enrique de Almeida Prado Alves Batista.
    15. 2017-2017. Intelligent Traps and Sensors: an Innovative Approach to Control Insect Pests and Disease Vectors

      Membro: Gustavo Enrique de Almeida Prado Alves Batista.
    16. 2015-2015. Controlling Dengue Fever Mosquitoes using Intelligent Sensors and Traps
      In the last decades we have witnessed a tremendous increase of dengue fever cases. Four decades ago only 9 countries had reported severe dengue epidemics. Currently, dengue is endemic in more than 100 countries. In this project we discuss why we are losing the war against dengue and propose a completely different approach for vector control. We propose to further develop our recent research on intelligent sensors to field conditions. Our idea is to propose an inexpensive device that will empower the population with the knowledge of Aedes aegypti densities. This will motivate local mosquito control activities and put the population, governmental and aid organizations far ahead of disease outbreaks.
      Membro: Gustavo Enrique de Almeida Prado Alves Batista.

Prêmios e títulos

Participação em eventos

  • Total de participação em eventos (28)
    1. Uma Avaliação sobre a Identificação de Motifs em Séries Temporais. Congresso da Academia Trinacional de Ciências
    2. Classification Guided by Clustering on Nonstationary Environments and Extreme Verification Latency. SIAM International Conference on Data Mining (SDM)
    3. Sensors and Software to Allow Computational Entomology, an Emerging Application of Data Mining. ACM SIGKDD International Conference on Knowledge Discovery and Data Mining
    4. Distância invariante à complexidade baseada em dimensão fractal para classificação de séries temporais. Encontro Nacional de Inteligência Artificial
    5. Discovering Knowledge Rules with Multi-Objective Evolutionary Computing. International Conference on Machine Learning and Applications
    6. Influence of graph construction on semi-supervised learning. European Conference on Machine Learning
    7. Applying Machine Learning and Audio Analysis Techniques to Insect Recognition in Intelligent Traps. International Conference on Machine Learning and Applications
    8. Participante do XVII Congresso da Sociedade Brasileira de Computação. XVII Congresso da Sociedade Brasileira de Computação
    9. Revisor do XVII Brazilian Symposium on Artificial Intelligence.. XVII Brazilian Symposium on Artificial Intelligence
    10. . International Joint Conference: 7th Iberoamerican Conference on Artificial Intelligence and 15th Brazilian Conference on Artificial Intelligence
    11. DTW-D: Time Series Semi-Supervised Learning from a Single Example. 19th ACM SIGKDD Conference on Knowledge Discovery and Data Mining - KDD 2013
    12. An Experimental Design to Evaluate Class Imbalance Treatment Methods. 2012 Eleventh International Conference on Machine Learning and Applications (ICMLA)
    13. A Complexity-Invariant Distance Measure for Time Series. SIAM Conference on Data Mining
    14. Revisor do III Mexican International Conference on Artificial Intelligence.. III Mexican International Conference on Artificial Intelligence
    15. Revisor do III Congresso de Lógica Aplicada à Tecnologia. III Congresso de Lógica Aplicada à Tecnologia
    16. An Experimental Comparison of Missing Data Imputation Methods. IV Congresso da Academia Trinacional de Ciências
    17. Mineração de Séries Temporais por meio da Extração de Características e da Identificação de Motifs. XXIX Congresso da Sociedade Brasileira de Computação
    18. Participante do Second International Conference on Hybrid Intelligent Systems. Second International Conference on Hybrid Intelligent Systems
    19. Seminário Integrado de Software e Hardware. XXXIV Congresso da Sociedade Brasileira de Computação
    20. Classification of Data Streams Applied to Insect Recognition: Initial Results. Brazilian Conference on Intelligent Systems
    21. Revisor do IX Ibero-American Conference on Artificial Intelligence. IX Ibero-American Conference on Artificial Intelligence.
    22. . Congresso da Academia Trinacional de Ciências
    23. Revisor do Fourth Congress of Logic Applied to Technology. Congress of Logic Applied to Technology
    24. An Experimental Comparison of Missing Data Imputation Methods. IV Congresso da Academia Trinacional de Ciências
    25. . International Conference on Data Mining
    26. Time Series Classification Using Compression Distance of Recurrence Plots. IEEE International Conference on Data Mining
    27. Revisor do I Congresso de Lógica Aplicada a Engenharia. I Congresso de Lógica Aplicada a Engenharia
    28. Participante do Mexican International Conference on Artificial Intelligence. Mexican International Conference on Artificial Intelligence

Organização de eventos

  • Total de organização de eventos (7)
    1. . IV Workshop on MSc Dissertation and PhD Thesis in Artificial Intelligence (WTDIA 2008). Sociedade Brasileira de Computação. 2008. Organizacao
    2. . VI Best MSc Dissertation/PhD Thesis Contest (CTDIA 2008). Sociedade Brasileira de Computação. 2008. Organizacao
    3. . Second School on Machine Learning and Knowledge Discovery in Databases,. Instituto de Ciências Matemáticas e de Computação. 2013. Organizacao
    4. . Encontro Nacional de Inteligência Artificial e Computacional. Sociedade Brasileira de Computação. 2013. Organizacao
    5. . UCR Insect Classification Contest. University of California, Riverside. 2012. Organizacao
    6. . Third School on Machine Learning and Knowledge Discovery in Databases. Instituto de Ciências Matemáticas e de Computação. 2014. Organizacao
    7. . Program chair of the Brazilian Conference on Intelligent Systems (BRACIS). IEEE. 2017. Organizacao

Lista de colaborações



(*) Relatório criado com produções desde 1970 até 2023
Data de processamento: 10/05/2023 08:54:02