Departamento de Ciências de Computação

Diego Raphael Amancio

Professor Associado RDIDP no Instituto de Ciências Matemáticas e de Computação, da Universidade de São Paulo (ICMC-USP), pelo Departamento de Ciências de Computação (SCC-ICMC-USP). Engenheiro da computação graduado pela Universidade de São Paulo (USP), é doutor em Física Aplicada Computacional pela USP (doutorado direto FAPESP). Possui dois pós-doutorados, ambos com auxílio FAPESP: um na Universidade de São Paulo (IFSC-USP) e outro na Indiana University (Estados Unidos, Bloomington-IN). Livre-docente pelo Departamento de Ciências da Computação (SCC-ICMC-USP). De acordo com um estudo cienciométrico publicado em 2020 na PLos Biology, foi considerado entre oa 2% pesquisadores mais influentes na área de Inteligência Artificial (dados baseados em citações). Neste mesmo estudo, foi considerado entre os 35 docentes mais influentes em pesquisa na Universidade de São Paulo, considerando todas as áreas e campi da USP. É editor academico de 5 períodicos internacionais: Expert Systems with Applications (Associate Editor), PLoS ONE, Complexity (Hindawi), PeerJ Computer Science e Frontiers in Physics (Associate Editor). Atua como revisor em periódicos internacionais de impacto, tendo completado revisões em mais de 70 periódicos internacionais de impacto nas áreas de Computação, Física Computacional e Interdisciplinares. Sua pesquisa realizada no doutorado rendeu o Prêmio Tese Destaque USP 2014, como melhor tese de doutorado defendida em todos os campi da USP entre 2012 e 2013 na área de Ciências Exatas. Orientou alunos de doutorado e mestrado, e recebeu em 2015-2016 umas das bolsas de pesquisa fornecida pelo Google (Google Research Awards in Latin America). É bolsista de produtividade em pesquisa pelo CNPq na área de Ciências da Computação. Sua pesquisa rendeu mais de 1300 citações no Web of Science (Clarivate Analytics). Nesta mesma base, apresenta um h-index = 28 (Web of Science, Clarivate Analytics, Ago/2021). Seu trabalho de pesquisa concentra-se no estudo de redes complexas aplicadas ao Processamento de Línguas Naturais e Cienciometria, além de Machine Learning.

  • http://lattes.cnpq.br/8763967270082717 (02032023)
  • Rótulo/Grupo:
  • Bolsa CNPq:
  • Período de análise:
  • Endereço: Universidade de São Paulo. . Instituto de Física de São Carlos. Av. Trabalhador São-carlense, 400 CEP 13560-970 - Sao Carlos, SP - Brasil
  • Grande área: [sem-grandeArea]
  • Área: [sem-area]
  • Citações: Google Acadêmico

Produção bibliográfica

Produção técnica

Produção artística

Orientações em andamento

Supervisões e orientações concluídas

Projetos de pesquisa

Prêmios e títulos

Participação em eventos

Organização de eventos

Lista de colaborações


Produção bibliográfica

Produção técnica

Produção artística

Orientações em andamento

Supervisões e orientações concluídas

Projetos de pesquisa

  • Total de projetos de pesquisa (8)
    1. 2007-2007. Uso de Redes Complexas na Avaliação de Traduções Automáticas
      Este projeto, inserido no contexto de avaliação de traduções automáticas, busca o desenvolvimento de novas técnicas de discrimanação de traduções com o uso de redes complexas aliada ao reconhecimento de padrões por algoritmos de Aprendizado de Máquina.
      Membro: Diego Raphael Amancio.
    2. 2009-2009. Classificação de textos com redes complexas
      A classificação automática de textos em categorias pré-estabelecidas tem despertado grande interesse nos últimos anos devido à necessidade de organização do número crescente de documentos. A abordagem dominante para classificação é baseada na análise de conteúdo dos textos. Nesta tese, investigamos a aplicabilidade de atributos de estilo em tarefas tradicionais de classificação, usando a modelagem de textos como redes complexas, em que os vértices representam palavras e arestas representam relações de adjacência. Estudamos como métricas topológicas podem ser úteis no processamento de línguas naturais, sendo a tarefa de classificação apoiada por métodos de aprendizado de máquina, supervisionado e não supervisionado. Um estudo detalhado das métricas topológicas revelou que várias delas são informativas, por permitirem distinguir textos escritos em língua natural de textos com palavras distribuídas aleatoriamente. Mostramos também que a maioria das medidas de rede depende de fatores sintáticos, enquanto medidas de intermitência são mais sensíveis à semântica. Com relação à aplicabilidade da modelagem de textos como redes complexas, mostramos que existe uma dependência significativa entre estilo de autores e topologia da rede. Para a tarefa de reconhecimento de autoria de 40 romances escritos por 8 autores, uma taxa de acerto de 65~\% foi obtida com métricas de rede e intermitência de palavras. Ainda na análise de estilo, descobrimos que livros pertencentes ao mesmo estilo literário tendem a possuir estruturas topológicas similares. A modelagem de textos como redes também foi útil para discriminar sentidos de palavras ambíguas, a partir apenas de informação topológica dos vértices, evidenciando uma relação não trivial entre sintaxe e semântica. Para algumas palavras, a discriminação com redes complexas foi ainda melhor que a estratégia baseada em padrões de recorrência contextual de palavras polissêmicas. Os estudos desenvolvidos nesta tese confirmam que aspectos de estilo e semânticos influenciam na organização estrutural de conceitos em textos modelados como rede. Assim, a modelagem de textos como redes de adjacência de palavras pode ser útil não apenas para entender mecanismos fundamentais da linguagem, mas também para aperfeiçoar aplicações reais quando combinada com métodos tradicionais de processamento de texto.
      Membro: Diego Raphael Amancio.
    3. 2013-2013. Modelagem do conhecimento e comportamento com redes complexas
      Neste projeto, pretende-se gerar um sistema genérico que represente e descreva vários aspectos do conhecimento e comportamento, incluindo o pensamento e a aquisição do conhecimento por meio da relação entre conceitos. A partir da modelagem do relacionamento entre conceitos por meio de redes semânticas, planeja-se criar um modelo de atividade na camada cognitiva baseado em caminhadas aleatórias que possa explicar a organização, geração e processamento das idéias. Com este modelo, pretendemos identificar configurações de organização e condições iniciais de pensamento capazes de otimizar o processo cognitivo. Através da análise de diálogos reais planejamos verificar parâmetros que favoreçam um consenso caracterizado por alto grau de similaridade entre conjuntos de conceitos ativos no consciente dos agentes emissor e receptor. O aprendizado também será analisado através da excitação do modelo com conceitos provenientes de leituras de livros. Assim, além de investigar propriedades do sistema dinâmico emergente acreditamos ser possível classificar textos de acordo com a quantidade de informação inovadora disponível a partir da análise dos padrões de ativação no processo de leitura. Por ser um modelo genérico, conjecturamos aplicá-lo para representar outros sistemas complexos, já que a ausência de conexões inibitórias o torna potencialmente útil para entender fenômenos de difusão em redes neuronais e propagação de doenças
      Membro: Diego Raphael Amancio.
    4. 2015-2015. Modelagem e Reconhecimento de Padrões em Textos com Redes Complexas
      Complex networks (CN) have been widely employed to model texts. Although some theoretical results have investigated the structural and functional properties of the language via the CN framework, the applicability of the topological analysis of CNs to solve linguistic problems have been restricted to a few studies. The proposed project aims at improving current CN-based models modeling traditional and novel applications. More specifically, we propose the combination of traditional and CN-based techniques based on time series analysis in order to improve the performance of natural language processing tasks, such as the authorship recognition and the disambiguation problems. Upon combining traditional and CN-based techniques in a hybrid way, we expect to generate competitive unsupervised and supervised classifiers. We also expect that the generated models will provide relevant insights into the language functional mechanisms
      Membro: Diego Raphael Amancio.
    5. 2017-2017. Using semantical information to classify texts modelled as complex networks
      Complex networks have been used to model many complex systems, owing to its versatility to represent systems as an association of nodes. Even though network science has already been used to analyze written texts in recent years, the majority of works exploring topological information of networks have emphasized only the stylistic/structural properties of documents. Here, we propose an extension of traditional models to grasp semantic aspects of texts. Examples of proposed enhancements include the representation of texts in a multi-scale fashion, where nodes may represent words, sentence, paragraphs, set of paragraphs, etc. We also intend to improve the semantical characterization of texts by including semantical links. To do so, we intend to implement recent advances in textual similarity research, which includes vectorial representations of words using word embeddings. In this context, we plan to tackle two tasks related to text classification, namely topic segmentation and multi-document extractive summarization. To address these natural language processing tasks, modifications in community detection methods and multi-layer models are proposed as the main tools designed to include semantical information in traditional representations. Owing to the generality of the proposed methods, we believe that the tools proposed here could be easily extended to analyze similar natural language processing tasks.
      Membro: Diego Raphael Amancio.
    6. 2020-2020. Combinando redes complexas e word embeddings em tarefas de classificação de textos
      A modelagem por redes complexas tem sido utilizada em uma miríade de sistemas complexos. Embora este modelo já tenha sido usado na classificação de textos, a maior parte dos estudos se baseou no modelo de co-ocorrência de palavras para estudar as propriedades estruturais e estilísticas de documentos. Nesse projeto, propomos estender a modelagem tradicional de redes representando textos usando informação de embeddings de palavras. A modelagem proposta consiste no enriquecimento de redes (grafos) por arestas virtuais provenientes de informação contextual das palavras. Espera-se com esta modelagem obter aperfeiçoamentos em alguns aspectos da classificação de textos, incluindo qualidade, robustez e adequação à classificação de textos pequenos. Devido à generalidade dos métodos e técnicas propostas, acreditamos que estas possam ser usadas para estudar também outros sistemas complexos com a generalização do conceito de embeddings de palavras para embeddings de vértices de redes complexas.
      Membro: Diego Raphael Amancio.
    7. 2006-2006. Uso de Redes Complexas na Avaliação de Traduções Automáticas
      Este projeto visa amenizar o trabalho envolvido na avaliação de traduções automáticas, um dos grandes desafios das pesquisas em PLN, atualmente. A partir da modelagem de textos fonte e alvo como redes complexas, é possível extrair alguns padrões provenientes das medidas das redes que podem fornecer informação quanto ao nível de qualidade de tradutores automáticos, especialmente considerando as medidas de grau de saída e grau de entrada do grafo proveniente deste modelo.
      Membro: Diego Raphael Amancio.
    8. 2017-2017. Modelling citation and information graphs: a complex network approach
      Citation and information networks have been extensively studied along the past years.While much insight has been obtained from particular topological attributes (e.g. degree distribution and cycles), no large scale study has been conducted on the effects of including additional metadata information to improve the characterization of such systems. In this context, this project aims at investigating how metadata information obtained from collaboration, geographical and information networks can be used to improve the characterization of citation networks. Upon intertwining text analysis and network theory, we also intend to provide an improved characterization of the interdisciplinarity of papers and concepts inside research subfields. In addition to providing a better understanding of the underlying processes driving the organization of citation networks, we expect to unravel novel features that are able to predict the future impact of papers, given their initial configuration in citation and information networks.
      Membro: Diego Raphael Amancio.

Prêmios e títulos

  • Total de prêmios e títulos (1)
    1. Melhor professor do segundo semestre de 2021 para a turma de Ciências de Computão - 2019. PET Computação do ICMC-USP. 2022.
      Membro: Diego Raphael Amancio.

Participação em eventos

  • Total de participação em eventos (2)
    1. Use of complex networks for natural language processing. Encontro Nacional de Física da Matéria Condensada - ENFMC
    2. Opinion Discrimination Using Complex Network Features. 2nd Workshop on Complex Networks

Organização de eventos

  • Total de organização de eventos (0)

    Lista de colaborações



    (*) Relatório criado com produções desde 1970 até 2023
    Data de processamento: 10/05/2023 08:54:02