Departamento de Ciências de Computação

Diego Furtado Silva

Professor Doutor no Instituto de Ciências Matemáticas e de Computação da Universidade de São Paulo (ICMC-USP), possui graduação em Ciências de Computação e mestrado e doutorado em Ciências de Computação e Matemática Computacional, todos pelo ICMC-USP. Sua principal linha de atuação é a Mineração de Dados e suas aplicações, com maior foco em tarefas baseadas em grandes volumes de dados sequenciais contínuos (como séries temporais e sinais digitais). Além disso, possui experiência em pré-processamento de dados para Aprendizado de Máquina, tratamento de classes desbalanceadas e classificação em fluxo de dados.

  • http://lattes.cnpq.br/7662777934692986 (09032023)
  • Rótulo/Grupo:
  • Bolsa CNPq:
  • Período de análise:
  • Endereço: Universidade de São Paulo. Departamento de Ciências da Computação. Instituto de Ciências Matemáticas e de Computação. Avenida Trabalhador Sancarlense, 400 CEP 13566590 - São Carlos, SP - Brasil
  • Grande área: [sem-grandeArea]
  • Área: [sem-area]
  • Citações: Google Acadêmico

Produção bibliográfica

Produção técnica

Produção artística

Orientações em andamento

Supervisões e orientações concluídas

Projetos de pesquisa

Prêmios e títulos

Participação em eventos

Organização de eventos

Lista de colaborações


Produção bibliográfica

Produção técnica

Produção artística

Orientações em andamento

Supervisões e orientações concluídas

Projetos de pesquisa

  • Total de projetos de pesquisa (10)
    1. 2012-2012. Invariância à Complexidade em Classificação, Agrupamento e Descoberta de Motifs em Séries Temporais
      Há recentemente um crescente interesse no processamento de séries temporais devido a grande quantidade de domínios de aplicação que geram dados com essa característica. Esse interesse pode ser medido pela vasta quantidade de métodos recentemente propostos na literatura para tarefas como classificação, agrupamento, sumarização, detecção de anomalias e descoberta de motifs. Estudos recentes têm mostrado que para muitos problemas, os métodos baseados em similaridade apresentam uma eficácia difícil de ser superada, mesmo por métodos mais sofisticados. Isso se deve em grande parte pelo fato de que a comunidade tem estudado e proposto diversas invariâncias para medidas de distância entre séries temporais. As invariâncias fazem com que as medidas de distância ignorem determinadas características indesejadas dos dados. O exemplo mais conhecido é a invariância às diferenças locais na escala de tempo, obtida pela técnica de warping. Outras invariâncias incluem a invariância às diferenças de amplitude e offset, fase e oclusão. Recentemente foi demonstrado à comunidade científica que métodos de classificação de séries temporais por similaridade podem ser muito beneficiados por uma nova invariância: invariância à complexidade. O principal objetivo deste projeto de pesquisa é investigar novas medidas de distância invariantes à complexidade e avaliar o quanto essas medidas podem melhorar a eficácia, sobretudo de algoritmos de agrupamento e descoberta de motifs.
      Membro: Diego Furtado Silva.
      Há recentemente um crescente interesse no processamento de séries temporais devido a grande quantidade de domínios de aplicação que geram dados com essa característica. Esse interesse pode ser medido pela vasta quantidade de métodos recentemente propostos na literatura para tarefas como classificação, agrupamento, sumarização, detecção de anomalias e descoberta de motifs. Estudos recentes têm mostrado que para muitos problemas, os métodos baseados em similaridade apresentam uma eficácia difícil de ser superada, mesmo por métodos mais sofisticados. Isso se deve em grande parte pelo fato de que a comunidade tem estudado e proposto diversas invariâncias para medidas de distância entre séries temporais. As invariâncias fazem com que as medidas de distância ignorem determinadas características indesejadas dos dados. O exemplo mais conhecido é a invariância às diferenças locais na escala de tempo, obtida pela técnica de warping. Outras invariâncias incluem a invariância às diferenças de amplitude e offset, fase e oclusão. Recentemente foi demonstrado à comunidade científica que métodos de classificação de séries temporais por similaridade podem ser muito beneficiados por uma nova invariância: invariância à complexidade. O principal objetivo deste projeto de pesquisa é investigar novas medidas de distância invariantes à complexidade e avaliar o quanto essas medidas podem melhorar a eficácia, sobretudo de algoritmos de agrupamento e descoberta de motifs.
      Membro: Solange Oliveira Rezende.
    2. 2014-2014. Aprendizado de Máquina para WebSensors: Algoritmos e Aplicações
      A popularização de plataformas web para publicação de conteúdo textual tem motivado o desenvolvimento de métodos para extração automática de conhecimento implícito nos textos. Em particular, uma nova gama de estudos e aplicações tem sido proposta para explorar a web como um grande e poderoso "sensor social", permitindo identificar e monitorar vários tipos de eventos a partir de textos publicados em portais de notícias e redes sociais, como detecção de epidemias, análise de sentimentos, e a extração de indicadores políticos e econômicos. Atualmente, a construção de um sensor da web (websensor) é uma tarefa complexa, pois depende de especialistas de domínio para definição dos parâmetros do sensor, isto é, expressões para busca, filtros e monitoramentos de conteúdo textual da web. A necessidade de especialistas de domínio geralmente limita as aplicações envolvendo websensors, uma vez que em muitos problemas não há compreensão clara dos fenômenos que se deseja monitorar. Em vista disso, neste projeto de pesquisa são investigados métodos de aprendizado de máquina para apoiar a construção automática de websensors. A ideia básica é utilizar uma amostra de documentos textuais do domínio do problema e, em conjunto com algoritmos de aprendizado de máquina semi/não supervisionados, extrair padrões dos textos e assim apoiar a construção de websensors. Dessa forma, espera-se reduzir a dependência de um especialista para definição dos parâmetros dos sensores. Cada websensor aprendido a partir dos textos representa um determinado fenômeno relacionado ao domínio do problema que, então, pode ser monitorado ao longo do tempo e utilizado para apoiar processos de tomada de decisão.
      Membro: Diego Furtado Silva.
      A popularização de plataformas web para publicação de conteúdo textual tem motivado o desenvolvimento de métodos para extração automática de conhecimento implícito nos textos. Em particular, uma nova gama de estudos e aplicações tem sido proposta para explorar a web como um grande e poderoso "sensor social", permitindo identificar e monitorar vários tipos de eventos a partir de textos publicados em portais de notícias e redes sociais, como detecção de epidemias, análise de sentimentos, e a extração de indicadores políticos e econômicos. Atualmente, a construção de um sensor da web (websensor) é uma tarefa complexa, pois depende de especialistas de domínio para definição dos parâmetros do sensor, isto é, expressões para busca, filtros e monitoramentos de conteúdo textual da web. A necessidade de especialistas de domínio geralmente limita as aplicações envolvendo websensors, uma vez que em muitos problemas não há compreensão clara dos fenômenos que se deseja monitorar. Em vista disso, neste projeto de pesquisa são investigados métodos de aprendizado de máquina para apoiar a construção automática de websensors. A ideia básica é utilizar uma amostra de documentos textuais do domínio do problema e, em conjunto com algoritmos de aprendizado de máquina semi/não supervisionados, extrair padrões dos textos e assim apoiar a construção de websensors. Dessa forma, espera-se reduzir a dependência de um especialista para definição dos parâmetros dos sensores. Cada websensor aprendido a partir dos textos representa um determinado fenômeno relacionado ao domínio do problema que, então, pode ser monitorado ao longo do tempo e utilizado para apoiar processos de tomada de decisão.
      Membro: Solange Oliveira Rezende.
    3. 2017-2017. Armadilhas e Sensores Inteligentes: Uma Abordagem Inovadora para Controle de Insetos Peste e Vetores de Doenças
      Resumo em Português Indiscutivelmente, os insetos são importantes na agricultura, no meio ambiente e saúde pública. Muitas espécies são benéficas para o meio ambiente e para as pessoas. Por exemplo, insetos são responsáveis pela polinização de ao menos dois terços de todo o alimento consumido no mundo. Devido a esta importância para os seres humanos, o recente declínio nas populações de insetos polinizadores, principalmente as abelhas, é considerado um grave problema ambiental, frequentemente associado ao uso de pesticidas. Por outro lado, pragas agrícolas são responsáveis por destruir mais de 40 bilhões de dólares em alimentos por ano e determinadas espécies são vetores de doenças que matam mais de um milhão de pessoas anualmente, como a malária, dengue, febre chikungunya e zika vírus. Neste projeto de pesquisa, é proposta uma armadilha inteligente para a captura de espécies maléficas de insetos. A armadilha utiliza um sensor óptico que têm sido desenvolvido pela equipe deste projeto nos últimos anos, capaz de reconhecer automaticamente a espécie de insetos a partir de dados do batimento de asas dos insetos. O reconhecimento das espécies de insetos permitirá a criação de mapas de densidade em tempo real, que por sua vez podem ser utilizados para apoiar intervenções locais. Por exemplo, no caso de pragas agrícolas, estes mapas permitirão a aplicação inteligente e direcionada de inseticidas, reduzindo o impacto para o meio ambiente. No caso de insetos vetores de doenças, a armadilha poderá auxiliar na redução dos custos de intervenções sofisticadas e efetivas como a SIT (técnica do inseto estéril), mas que possuem um alto custo. Neste projeto, pretende-se expandir o estado-da-arte em Computação por meio desta aplicação real, especialmente nas áreas de Aprendizado de Máquina e Mineração de Fluxo de Dados. De modo a demonstrar os aspectos práticos desta proposta, as pesquisas serão concentradas na identificação de duas espécies: o psilídio asiático dos citros, vetor da doença de Greening, uma terrível doença que ataca árvores de citros e o Aedes aegypti, vetor da dengue, febre amarela e chikungya, e zika virus, recentemente associado a casos de microcefalia em recém-nascidos.
      Membro: Diego Furtado Silva.
    4. 2023-2023. Aprendizado de Máquina para Séries Temporais em Aplicações de mHealth

      Membro: Diego Furtado Silva.
    5. 2013-2013. Intelligent sensor for controlling agricultural pests and disease-vector insects
      Applications such as intelligent sensors should be able to collect environment information and to make decisions based on input data. An example is an under-development low-cost sensor to detect and classify insects in their species using laser light and machine learning techniques. This sensor is an important step towards the development of intelligent traps able to attract and selectively capture insect species of interest such as disease vectors or agricultural pests, without affecting the beneficial species. The data gathered by the sensor constitutes a data stream with non-stationary characteristics, since the insects metabolism is influenced by environmental conditions such as temperature, humidity and atmospheric pressure. This research grant proposal has two main objectives: the first one is to develop new algorithms to classify in real- time signals from the sensor obtained from the data stream; the second one is to technologically develop the sensor in order to allow the developed machine learning techniques to be embedded in the sensor.
      Membro: Diego Furtado Silva.
    6. 2018-2018. Mineração de dados para análise individual e de equipe em esportes coletivos
      Com o aprimoramento e a miniaturização de sensores capazes de obter e transmitir diversos tipos de dados, a Internet das Coisas vem ganhando cada vez mais espaço na pesquisa científica e no mercado. Dentre uma infinidade de aplicações de tal tecnologia está a análise esportiva. Especificamente, sensores têm auxiliado a análise estatística do desempenho de atletas. Dispositivos desse tipo já são capazes de transmitir dados como velocidade, batimento cardíaco e posicionamento de jogadores em tempo real. Esses dados são cada vez mais utilizados por equipes de elite em variados esportes, como futebol, basquete e rugby. Apesar do grande e valioso volume de informações obtido, as ferramentas de software atuais para exame de dados são desenvolvidas para análise visual e individualizada. Em outras palavras, os dados obtidos são somente apresentados por meio ferramentas de visualização para a equipe técnica. Para se realizar a análise coletiva dos atletas, os dados são exibidos individualmente por jogador ou exibidos em uma projeção do campo ou quadra, sem considerar qualquer tipo de relação entre os atletas. Na prática, as possibilidades de análise acabam se limitando à observação de fatores físicos, o que pode ajudar a evitar lesões e realizar treinamentos físicos personalizados para cada jogador. Por outro lado, o apoio a decisões táticas e de desempenho coletivo das equipes é praticamente nulo. O objetivo deste projeto é pesquisar e desenvolver ferramentas que auxiliam na melhor compreensão da atuação dos atletas, levando em conta o comportamento coletivo da equipe. Para isso, serão utilizadas técnicas de mineração de dados para encontrar padrões frequentes e atípicos nos dados obtidos por sensores utilizados pelos atletas de esportes coletivos, facilitando a análise do posicionamento e da interação de jogadores durante jogos e treinos. Ainda, será possível apontar quais os aspectos mais semelhantes ou distintos entre tais padrões para análise exploratória e extrair indicadores táticos coletivos a partir deles. Com isso, será possível auxiliar equipes técnicas a melhorar o desempenho individual e coletivo de suas equipes e tomar decisões relativas à adoção ou descarte de determinadas estratégias e treinamentos específicos.
      Membro: Diego Furtado Silva.
    7. 2020-2020. Dos dados ao conhecimento: extração e representação de informação no domínio do e-commerce

      Membro: Diego Furtado Silva.
    8. 2021-2021. Algoritmo DTW para correlação de feições geológicas

      Membro: Diego Furtado Silva.
    9. 2023-2023. Detecção de Novidade em Fluxos Contínuos de Dados Multirrótulo

      Membro: Diego Furtado Silva.
    10. 2019-2019. Investigação e desenvolvimento de módulos de AutoML na plataforma Marvin em consonância com requisitos de desempenho e alta disponibilidade

      Membro: Diego Furtado Silva.

Prêmios e títulos

  • Total de prêmios e títulos (1)
    1. Melhor Trabalho de Iniciação Científica - DC - UFSCar (como orientador do aluno João Augusto Leite). Departamento de Computação - UFSCar. 2020.
      Membro: Diego Furtado Silva.

Participação em eventos

  • Total de participação em eventos (18)
    1. . Brazilian Conference on Intelligent Systems
    2. Resultados Preliminares na Classificação de Insetos Utilizando Sensores Ópticos. XXXI Congresso da Sociedade Brasileira de Computação
    3. Applying Machine Learning and Audio Analysis Techniques to Insect Recognition in Intelligent Traps. In: 12th International Conference on Machine Learning and Applications. 2012 Eleventh International Conference on Machine Learning and Applications (ICMLA)
    4. A Video Compression-based Approach To Measure Music Structural Similarity. International Society for Music Information Retrieval Conference
    5. Time Series Classification Using Compression Distance of Recurrence Plots. 2013 IEEE International Conference on Data Mining (ICDM)
    6. SiMPle: Assessing Music Similarity Using Subsequences Joins. International Society for Music Information Retrieval Conference
    7. IEEE International Conference on Data Mining. IEEE International Conference on Data Mining
    8. Speeding Up All-Pairwise Dynamic Time Warping Matrix Calculation. SIAM International Conference on Data Mining (SDM)
    9. . ACM SIGKDD International Conference on Knowledge Discovery and Data Mining
    10. Summarizing and comparing music data and its application on cover song identification. 2018 International Society for Music Information Retrieval Conference (ISMIR)
    11. Elastic Time Series Motifs and Discords. 2018 17th IEEE International Conference on Machine Learning and Applications (ICMLA)
    12. Uma Comparação Experimental de Métodos de Imputação de Valores Desconhecidos. IV Congresso da Academia Trinacional de Ciências
    13. Music Shapelets for Fast Cover Song Recognition. International Society for Music Information Retrieval Conference
    14. Classification of Evolving Data Streams with Infinitely Delayed Labels. IEEE International Conference on Machine Learning and Applications
    15. Music Classification by Transductive Learning Using Bipartite Heterogeneous Networks. International Society for Music Information Retrieval Conference
    16. Spoken Digit Recognition in Portuguese Using Line Spectral Frequencies. The 13th Ibero-American Conference on Artificial Intelligence
    17. Financial Time Series Forecasting Enriched with Textual Information. 2021 IEEE International Conference on Machine Learning and Applications
    18. Named Entity Recognition for Brazilian Portuguese Product Titles. Brazilian Conference on Intelligent Systems

Organização de eventos

  • Total de organização de eventos (3)
    1. . X Symposium on Knowledge Discovery, Mining and Learning. . 2023. Organizacao
    2. . 15th International Conference on Computational Processing of Portuguese (PROPOR). . 2022. Organizacao
    3. . IX Symposium on Knowledge Discovery, Mining and Learning. . 2021. Organizacao

Lista de colaborações



(*) Relatório criado com produções desde 1970 até 2023
Data de processamento: 10/05/2023 08:54:02