Departamento de Ciências de Computação

Thiago Alexandre Salgueiro Pardo

Possui graduação em Bacharelado em Ciência da Computação pela Universidade Federal de São Carlos (1999), mestrado em Ciência da Computação pela Universidade Federal de São Carlos (2002) e doutorado em Ciências da Computação e Matemática Computacional pela Universidade de São Paulo (2005), onde também realizou estágio de pós-doutorado (2005). Atualmente é professor associado da Universidade de São Paulo. Tem experiência na área de Inteligência Artificial, atuando principalmente nos temas de processamento de linguagem natural, ou linguística computacional, mais especificamente nas áreas de análise de sentimentos e mineração de opiniões, de modelagem sintática, semântica e discursiva e de métodos de parsing.

  • http://lattes.cnpq.br/7078737101024368 (06022023)
  • Rótulo/Grupo:
  • Bolsa CNPq:
  • Período de análise:
  • Endereço: Universidade de São Paulo. Departamento de Ciências da Computação. Instituto de Ciências Matemáticas e de Computação. Av. Trabalhador São-carlense, 400 CEP 13560970 - São Carlos, SP - Brasil
  • Grande área: [sem-grandeArea]
  • Área: [sem-area]
  • Citações: Google Acadêmico

Produção bibliográfica

Produção técnica

Produção artística

Orientações em andamento

Supervisões e orientações concluídas

Projetos de pesquisa

Prêmios e títulos

Participação em eventos

Organização de eventos

Lista de colaborações


Produção bibliográfica

Produção técnica

Produção artística

Orientações em andamento

Supervisões e orientações concluídas

Projetos de pesquisa

  • Total de projetos de pesquisa (20)
    1. 2009-2009. Sumarização automática multidocumento com base no modelo Cross-document Structure Theory (CST)
      (FAPESP nro. 2009/05603-0) Com base na CST, investiga-se as várias tarefas relacionadas à sumarização multidocumento (ou seja, a produção de sumários/resumos a partir de um conjunto de textos), a saber: modelagem de conhecimento e análise textual, seleção de conteúdo textual para o sumário e pós-edição de sumários, dentre outras
      Membro: Thiago Alexandre Salgueiro Pardo.
    2. 2007-2007. PorSimples: Simplificação Textual do Português para Inclusão e Acessibilidade Digital
      (FAPESP/Microsoft Research nro. 2007/54565-8) Desenvolvimento de recursos e ferramentas para simplificação de textos em português, visando ao auxílio de usuários com dificuldades de leitura e sua posterior inclusão digital
      Membro: Thiago Alexandre Salgueiro Pardo.
      Propomos o desenvolvimento de uma tecnologia que foca uma área de pesquisa do processamento de língua natural, a simplificação textual, sendo disponibilizada em dois sistemas destinados a públicos alvos diferentes: (i) um sistema de autoria para ajudar autores a produzir textos simplificados que serão validados pelos próprios autores, e (ii) um sistema facilitador para ajudar a leitura de um dado conteúdo da Web. Este último inclui tarefas de sumarização textual, simplificação, e apresentação do texto salientando as relações entre as idéias do texto. Quanto aos cenários de uso, esta tecnologia se destina a facilitar o acesso à informação dos analfabetos funcionais, principalmente e, de pessoas com outras deficiências cognitivas como surdes congênita e portadores de afasia e dislexia, na leitura de textos eletrônicos em português produzidos pelo governo ou por jornais de grande circulação; as crianças em fase de aprendizado de leitura; ou ainda adultos em fase de alfabetização.
      Membro: Sandra Maria Aluísio.
      desenvolvimento de uma tecnologia que foca uma área de pesquisa do processamento de língua natural, a simplificação textual, sendo disponibilizada em dois sistemas destinados a públicos alvos diferentes: (i) um sistema de autoria para ajudar autores a produzir textos simplificados que serão validados pelos próprios autores, e (ii) um sistema facilitador para ajudar a leitura de um dado conteúdo da Web. Este último inclui tarefas de sumarização textual, simplificação, e apresentação do texto salientando as relações entre as idéias do texto. Quanto aos cenários de uso, esta tecnologia se destina a facilitar o acesso à informação dos analfabetos funcionais, principalmente e, de pessoas com outras deficiências cognitivas
      Membro: Renata Pontin de Mattos Fortes.
    3. 2006-2006. Projeto PLN-Br: Recursos e Ferramentas para a Recuperação de Informação em Bases Textuais em Português do Brasil
      CNPq (CTInfo) #550388/2005-2: Projeto PLN-Br: Recursos e Ferramentas para a Recuperação de Informação em Bases Textuais em Português do Brasil. Descrição: O objetivo geral deste projeto é a construção de um espaço interinstitucional de interação e intercâmbio de práticas de análise e investigação lingüístico-computacional acerca da representação e da recuperação de informação de natureza semântica e pragmático-discursiva veiculada por enunciados produzidos em português brasileiro. Este projeto conta com a participação de 7 grupos nacionais de PLN das seguintes instituições: USP/São Carlos (NILC), UFSCar, UNESP/Araraquara, PUC/RS, PUC/RJ, UNISINOS e Mackenzie/SP
      Membro: Thiago Alexandre Salgueiro Pardo.
    4. 2006-2006. FAROL - Fortalecimento e Integração das Competências do Processamento da Língua
      CAPES/PROCAD #0035050: FAROL - Fortalecimento e Integração das Competências do Processamento da Língua. Descrição: O projeto proporciona uma integração intra-regional (entre PUCRS e UNISINOS e entre UFSCar e USP de São Carlos) e uma integração inter-regional (entre as regiões Sul e Sudeste), e explora as vocações institucionais na área do processamento da língua. Participam do projeto FAROL quatro equipes, sendo duas da região Sul (especificamente, do Programa de Pós-Graduação em Ciência da Computação da PUCRS, mestrado e doutorado, nota 4, e do Programa de Pós-Graduação em Computação Aplicada da UNISINOS, mestrado, nota 3), e duas da região Sudeste (a saber, do Programa de Pós-Graduação em Ciências da Computação e Matemática Computacional da USP de São Carlos, mestrado e doutorado, nota 5, e do Programa de Pós-Graduação em Ciências da Computação da UFSCar, mestrado, nota 3). Nesse sentido, nosso objetivo geral será de propiciar aos grupos envolvidos um fluxo mais efetivo de competências, que fortaleça a área do processamento da língua nos programas nota 3, e consolide esta área no programa nota 4, com o apoio do programa com nota 5. Ao mesmo tempo, as competências específicas na área do processamento da língua, as quais não são coincidentes nos quatro grupos, poderão fluir de modo a tecer-se um quadro de ligações o qual promoverá o desenvolvimento dos quatro grupos, cada um em determinados focos de pesquisa dos quais se poderá beneficiar na integração
      Membro: Thiago Alexandre Salgueiro Pardo.
    5. 2005-2005. Léxico-PB: Léxico Computacional de Português Brasileiro para Processamento de Língua Natural
      CNPq (Fomento Tecnológico) #507004/2004-3: Léxico-PB: Léxico Computacional de Português Brasileiro para Processamento de Língua Natural. Descrição: O objetivo principal desse projeto é a construção de um léxico computacional de português brasileiro que maximize os seguintes critérios: (a) abrangência quanto ao número de entradas, cobrindo o português não-técnico, incluindo as variantes culta e vulgar; (b) cobertura quanto ao tipo dos atributos associados às entradas, sejam fonológicos, morfológicos, morfossintáticos e semânticos; (c) correção das informações nele contidas; (d) espectro de aplicação, ou seja, a utilidade que o léxico possa ter para aplicações diversas de PLN
      Membro: Thiago Alexandre Salgueiro Pardo.
    6. 2010-2010. CLARIN - Common Language Resources and Technology Infrastructure
      CLARIN is committed to establish an integrated and interoperable research infrastructure of language resources and its technology.
      Membro: Thiago Alexandre Salgueiro Pardo.
    7. 2009-2009. sucinto - summarization for clever information access
      The sucinto project aims at investigating and exploring generic and topic-focused multi-document summarization strategies for providing a more feasible and intelligent access to on-line information provided by news agencies. This commitment brings back old and well-known scientific challenges from the first studies in summarization in the 50s as well as introduces several new and exciting challenges, e.g., to deal with redundant, complementary and contradictory information, to normalize different writing styles and referring expression choices, to balance different perspectives and sides of the same events and facts, to properly deal with evolving events and their narration in different moments, and to arrange information pieces from different texts to produce coherent and cohesive summaries, among several others. An ultimate goal of this project is to pull the developed tools together as on-line applications for final users. This project takes into consideration not only classical approaches to single and multi-document summarization, but also new ones, following different paradigms and using knowledge of varied nature ranging from empirical and statistical data to semantic and discourse models. Research interests include (i) the modeling of the summarization process (content selection, planning, aggregation, generalization, substitution, information ordering, etc.) by means of Cross-document Structure Theory (CST), Rhetorical Structure Theory (RST), ontologies, and language and summarization statistical models, (ii) the investigation of related tasks as discourse parsing, topic detection, temporal annotation and resolution, coreference resolution, text-summary alignment, and multilingual processing, and (iii) the linguistic characterization of multi-document summaries and their manual production.
      Membro: Thiago Alexandre Salgueiro Pardo.
    8. 2012-2012. Informatividade e Topicalidade na Sumarização Multidocumento: Novos Desafios e Métodos
      Diante da grande e crescente quantidade de informação disponível, principalmente on-line, e da escassez de tempo e das dificuldades para se lidar com todo esse conteúdo, aplicações de processamento textual têm se tornado cada vez mais relevantes. De origem relativamente recente (meados da década de 90), a sumarização automática multidocumento é uma destas aplicações. Seu objetivo é produzir automaticamente um único sumário (ou resumo, como mais comumente chamado) a partir de um grupo de textos sobre um mesmo tópico. No Brasil e para a língua portuguesa, somente nos últimos anos é que pesquisas nessa área começaram. A partir da criação de recursos e ferramental inéditos e do desenvolvimento de métodos e sistemas simples e ingênuos a abordagens mais sofisticadas, produziram-se resultados do estado da arte e, em alguns casos, melhores do que os obtidos em pesquisas internacionais e para outras línguas. Nesta proposta de pesquisa, com base na pesquisa recente na área, objetiva-se dar um passo além e investigar 3 principais questões correlacionadas que podem avançar o estado da arte, a saber: (i) como tratar conjunta e adequadamente a topicalidade nos textos e a informatividade dos sumários, (ii) como modelar e qual o impacto da combinação de métodos superficiais/estatísticos e profundos/linguísticos para a produção de sumários mais informativos e representativos da distribuição topical nos textos, e (iii) quais são as características do processo humano de sumarização que podem ser sistematizadas e formalizadas para que subsidiem as questões anteriores. Enquanto as duas primeiras questões lidam com a produção de sumários melhores, a última pode subsidiar novos métodos e dar direcionamentos diferentes para abordagens atuais. Acredita-se que, além da formação de recursos humanos e da criação de uma massa crítica de pesquisadores na área, tão pequena no Brasil, esse projeto tem potencial de trazer contribuições significativas para a área.
      Membro: Thiago Alexandre Salgueiro Pardo.
    9. 2013-2013. Processamento Semântico de Textos em Português Brasileiro
      O objetivo geral do projeto de pesquisa, em parceria entre o ICMC-USP e a SAMSUNG, é avançar o estado da arte em processamento semântico de textos/documentos escritos em Português Brasileiro (PB), mais especificamente, permitir a anotação de papéis semânticos (SRL) e a desambiguação lexical de sentido (WSD) de verbos, e, com base nesses recursos e ferramentas, construir aplicações de mineração e sumarização de textos, com especial enfoque em opiniões sobre produtos encontradas na web. O projeto é coordenado pelos Profs. Thiago A. S. Pardo e Sandra M. Aluísio.
      Membro: Thiago Alexandre Salgueiro Pardo.
      O objetivo geral do projeto de pesquisa, em parceria entre o ICMC-USP e a SAMSUNG, é avançar o estado da arte em processamento semântico de textos/documentos escritos em Português Brasileiro (PB), mais especificamente, permitir a anotação de papéis semânticos (SRL) e a desambiguação lexical de sentido (WSD) de verbos, e, com base nesses recursos e ferramentas, construir aplicações de mineração e sumarização de textos, com especial enfoque em opiniões sobre produtos encontradas na web. O projeto é coordenado pelos Profs. Thiago A. S. Pardo e Sandra M. Aluísio.
      Membro: Sandra Maria Aluísio.
    10. 2015-2015. Sumarização Automática Multidocumento para o Português: Novas Fronteiras
      A Sumarização Automática Multidocumento (SAM) visa à criação de um único sumário (ou resumo, como mais comumente chamado) a partir de um conjunto de textos-fonte sobre um mesmo assunto. Com a enorme quantidade de informação disponível atualmente, principalmente on-line, a utilidade desse tipo de recurso é evidente. A SAM começou a ser investigada em meados dos anos 90 para a língua inglesa, e somente mais recentemente, a partir de meados da década passada, ela passou a ser alvo de investigações sistemáticas para a língua portuguesa. Com isso, atualmente há para o português corpora de referência para a SAM, ferramentas básicas de processamento e análise textual, e métodos de sumarização do estado da arte, que resultaram em recursos, ferramentas e aplicações amplamente disponíveis para a comunidade de pesquisa. Neste projeto, objetiva-se dar continuidade a essa linha de pesquisa. Por um lado, visa-se dar continuidade ao desenvolvimento e aprimoramento de recursos linguístico-computacionais e ferramentas de análise textual, que são essenciais para o avanço na área de SAM; por outro, visa-se investigar as novas fronteiras da sumarização, já investigadas para outras línguas e ainda inéditas para o português, em particular, a sumarização de atualização e de opiniões. Na sumarização de atualização, busca-se criar sumários que narrem somente as informações desconhecidas/novas para o leitor, levando-se em conta, portanto, o conhecimento prévio deste; na sumarização de opinião, busca-se sintetizar diversos textos opinativos sobre determinados objetos, como produtos eletrônicos, de forma a apoiar possíveis decisões e avaliações de usuários. Se, na primeira frente, a sumarização de atualização consiste em um desafio metodológico que dá continuidade ao que se tem feito na SAM para o português, na outra frente, tem-se em vista tanto a pesquisa como a aplicação para o usuário final. Acredita-se que, além da formação de recursos humanos e da criação de uma massa crítica de pesquisadores na área, tão pequena no Brasil, esse projeto tem potencial de trazer contribuições significativas para a área como um todo pela proposta de metodologias inovadoras.
      Membro: Thiago Alexandre Salgueiro Pardo.
    11. 2018-2018. OPINANDO - Opinion Mining for Portuguese: Concept-based Approaches and Beyond
      The OPINANDO project aimed at investigating issues of concept-level analysis for the Brazilian Portuguese language. We were particularly interested on three main research fronts, namely: (i) the identification of relevant texts to mine, which includes tackling text importance and filtering deceptive content; (ii) the analysis of the selected texts, performing the necessary semantic and discourse analysis and identifying subjective content and the corresponding aspects and polarities; and (iii) the synthesis of the relevant information, using text summarization and generation strategies and dealing with the related challenges in these tasks.
      Membro: Thiago Alexandre Salgueiro Pardo.
    12. 2020-2020. POrtuguese processing - Towards Syntactic Analysis and parsing (POeTiSA) in the Center for Artificial Intelligence (C4AI)
      POeTiSA is a long term project that aims at growing syntax-based resources and developing related tools and applications for Brazilian Portuguese language, looking to achieve world state-of-the-art results in this area. On the resource side, we focus on the production of a large and comprehensive multi-genre corpus of Universal Dependencies-based part of speech and syntactically annotated texts, including mainly news texts and user-generated content (tweets and online comments). Regarding the tools, we aim to investigate recent neural and distributional-based methods for training robust parsing models for Portuguese. The project also envisions the production of applications on opinion mining and sentiment analysis tasks that may benefit from syntactic knowledge, as opinion summarization, helpfulness prediction, aspect idetification, deception detection and emotion classification. This project is part of the Natural Language Processing initiative (NLP2) of the Center for Artificial Intelligence (C4AI) of the University of São Paulo, sponsored by IBM and FAPESP (grant #2019/07665-4). The center is part of the FAPESP Engineering Research Centers Program and is committed to state-of-the-art research in Artificial Intelligence, exploring both foundational issues and applied research.
      Membro: Thiago Alexandre Salgueiro Pardo.
      Descrição: O Center for Artificial Intelligence congrega cerca de 120 pesquisadores de várias instituições, com suporte da FAPESP e IBM. O Centro é sediado na USP, nas dependências do InovaUSP, e conduz pesquisas em temas básicos e aplicados da área de inteligência artificial, bem como se preocupa com transferência de tecnologia e difusão.. .
      Membro: Solange Oliveira Rezende.
    13. 2022-2022. Análise da linguagem em redes sociais para detecção precoce de transtornos de saúde mental
      O projeto objetiva a investigação de modelos computacionais para detecção de sinais precoces de transtornos de depressão e ansiedade a partir de publicações em redes sociais. A investigação contempla a construção de uma base textual de grandes proporções rotulada com informações relacionadas à saúde mental de usuários Twitter em português, e o uso de métodos de aprendizado supervisionado (como redes neurais artificiais profundas, transformadores etc.) para detectar usuários com maior probabilidade de vir a desenvolver futuros transtornos deste tipo com antecipação suficiente para sinalizar estas situações antes de seu possível agravamento. Questões de pesquisa a serem investigadas incluem a detecção de transtornos de saúde mental a partir de dados textuais e a partir de características estruturais e comportamentais da rede social, e a interpretação e explicação destes modelos.
      Membro: Thiago Alexandre Salgueiro Pardo.
    14. 2015-2015. TextLink - Structuring Discourse in Multilingual Europe
      Effective discourse in any language is characterized by clear relations between sentences and coherent structure. But languages vary in how relations and structure are signalled. While monolingual dictionaries and grammars can characterise the words and sentences of a language and bilingual dictionaries can do the same between languages, there is nothing similar for discourse. For discourse, however, discourse-annotated corpora are becoming available in individual languages. The TextLink Action will facilitate European multilingualism by (1) identifying and creating a portal into such resources within Europe ?including annotation tools, search tools, and discourse-annotated corpora; (2) delineating the dimensions and properties of discourse annotation across corpora; (3) organising these properties into a sharable taxonomy; (4) encouraging the use of this taxonomy in subsequent discourse annotation and in cross-lingual search and studies of devices that relate and structure discourse; and (5) promoting use of the portal, its resources and sharable taxonomy. With partners from across Europe, TextLink will unify numerous but scattered linguistic resources on discourse structure. With its resources searchable by form and/or meaning and a source of valuable correspondences, TextLink will enhance the experience and performance of human translators, lexicographers, language technology and language learners alike.
      Membro: Thiago Alexandre Salgueiro Pardo.
    15. 1997-1997. Investigação e Desenvolvimento de Técnicas de Sumarização Automática de Textos
      Investigação e desenvolvimento de técnicas de sumarização automática de textos para o português do Brasil, enfocando-se abordagens superficiais e profundas.
      Membro: Thiago Alexandre Salgueiro Pardo.
    16. 1997-1997. Estudo Comparativo dos Formalismos Gramaticais DCG, LFG e GPSG
      Estudo comparativo das formalismos gramaticais DCG, LFG e GPSP com vistas para a produção de um método automático de redução entre eles.
      Membro: Thiago Alexandre Salgueiro Pardo.
    17. 1999-1999. TraSem - Especificação dos Traços Semânticos dos Itens Lexicais
      Este projeto consistiu na investigação de possibilidade de especificação de conhecimento semântico no léxico do ReGra - REvisor GRAmatical - para melhorar seu desempenho.
      Membro: Thiago Alexandre Salgueiro Pardo.
    18. 2009-2009. TermiNet - Instantiation and Application of a Methodology for the Development of Terminological Wordnets in Brazilian Portuguese
      (FAPESP nro. 2009/06262-1; MCT/CNPq Universal nro. 471871/2009-5) Due to the increasing necessity of processing specialized texts, domain-specific (or terminological) lexical databases have been built in many languages, especially in wordnet format. Despite the existence of a reasonable number of terminological wordnets in many languages, there is no clear and generic methodology for building them. For Brazilian Portuguese (BP), by the way, there is no domain-specific lexical database in wordnet model. Consequently, we propose: (i) to instantiate a generic NLP methodology for developing terminological wordnets, and (ii) apply it to build a terminological wordnet in BP. Such methodology distinguishes itself by conciliating the linguistic and computational facets of the NLP researches. So, besides the benefits to NLP domain, terminological wordnets may also contribute to the development of terminological/ terminographic products since the organization of lexical-conceptual knowledge is an essential step in building such products.
      Membro: Thiago Alexandre Salgueiro Pardo.
    19. 2006-2006. ProCaCoSa: Processamento de Cadeias de Co-referência para a Sumarização Automática de Textos em Português
      Proc. Nro. 507030/2004-4
      Membro: Thiago Alexandre Salgueiro Pardo.
    20. 2009-2009. Sickle Cell Anemia Project
      Exploração de métodos de mineração de textos biomédicos sobre a doença anemia falciforme.
      Membro: Thiago Alexandre Salgueiro Pardo.

Prêmios e títulos

  • Total de prêmios e títulos (1)
    1. Professor homenageado pela turma de Engenharia de Computação de 2017. Universidade de São Paulo. 2022.
      Membro: Thiago Alexandre Salgueiro Pardo.

Participação em eventos

  • Total de participação em eventos (60)
    1. . 11th Brazilian Symposium in Information and Human Language Technology
    2. . 14o Encontro Nacional de Inteligência Artificial e Computacional
    3. . V Student Workshop on Information and Human Language Technology
    4. . 6th Brazilian Conference on Intelligent Systems
    5. . V Workshop on Portuguese Description
    6. . 4o Congresso de Graduação da USP
    7. . 5o Congresso de Graduação da USP
    8. Um Ambiente para Exploração de Regras de Associação Generalizadas. XXVII Congresso da Sociedade Brasileira de Computação
    9. VisualTCA: Uma Ferramenta Visual On-line para Alinhamento Sentencial de Textos Paralelos. 5th Workshop on Information and Human Language Technology
    10. Summarizing Scientific Texts: Experiments with Extractive Summarizers. Seventh International Conference on Intelligent Systems Design and Applications
    11. . XXX Congresso da Sociedade Brasileira de Computação
    12. . XXXI Congresso da Sociedade Brasileira de Computação
    13. . Workshop do Departamento de Ciências de Computação 2011
    14. . VII Workshop do Programa de Aperfeiçoamento de Ensino
    15. Research in NLP in Brazil: an overview. Workshop do projeto CLARIN - Common Language Resources Infrastructure
    16. . 10th International Conference on Computational Processing of Portuguese (PROPOR)
    17. . XXXII Congresso da Sociedade Brasileira de Computação - CSBC 2012
    18. . XI Encontro de Linguística de Corpus
    19. . 9th Brazilian Symposium in Information and Human Language Technologyogy
    20. . Brazilian Conference on Intelligent Systems / Encontro Nacional de Inteligência Artificial e Computacional
    21. . 10th Brazilian Symposium in Information and Human Language Technology
    22. . IV Jornada de Descrição do Português
    23. Applying Lexical-Conceptual Knowledge for Multilingual Multi-document Summarization. XII International Conference on the Computational Processing of Portuguese
    24. Rearrangement and Creation of New Corpora for Update and Compressive Summarization Tasks for Portuguese Language. XIV Encontro de Linguística de Corpus (ELC)
    25. . 13th International Conference on the Computational Processing of Portuguese (PROPOR)
    26. Córpus 4P: um córpus anotado de opiniões em português sobre produtos eletrônicos para fins de sumarização contrastiva de opinião. VI Workshop on Portuguese Description (JDP)
    27. Classificação de subjetividade para a língua portuguesa. VI Student Workshop on Information and Human Language Technology (TILic)
    28. . 8th Brazilian Conference on Intelligent Systems (BRACIS)
    29. . 12th Symposium in Information and Human Language Technology (STIL)
    30. . II Evaluation of Semantic Textual Similarity and Textual Inference in Portuguese (ASSIN 2)
    31. . 14th International Conference on the Computational Processing of Portuguese (PROPOR)
    32. Linguística Computacional e a Estruturação Textual. Semana Nacional de Ciência e Tecnologia do IFSP-Campos do Jordão
    33. . 9th Brazilian Conference on Intelligent Systems (BRACIS)
    34. . XIV Symposium in Information and Human Language (STIL)
    35. . 10th Brazilian Conference on Intelligent Systems (BRACIS)
    36. . 18th National Meeting on Artificial and Computational Intelligence
    37. . VII Workshop de Iniciação Científica em Tecnologia da Informação e da Linguagem Humana
    38. . VII Jornada de Descrição do Português (JDP)
    39. . Universal Dependencies Brazilian Festival (UDFest-BR)
    40. Using a Text Summarization System for Monolingual Question Answering. Cross Language Evaluation Forum 2006 Workshop
    41. Some issues on complex networks for author characterization. 4th Workshop on Information and Human Language Technology
    42. . Brazilian Symposium on Artificial Intelligence
    43. Review and Evaluation of DiZer - An Automatic Discourse Analyzer for Brazilian Portuguese. Workshop on Computational Processing of Written and Spoken Portuguese
    44. Unsupervised Learning of Verb Argument Structures. Seventh International Conference on Intelligent Text Processing and Computational Linguistics
    45. Análise retórica automática de textos em português. 16º Intercâmbio de Pesquisas em Lingüística Aplicada
    46. . 9th International Conference on Computational Processing of the Portuguese Language
    47. . 48th Annual Meeting of the Association for Computational Linguistics
    48. . 15th International Conference on the Computational Processing of Portuguese (PROPOR)
    49. Some issues on the normalization of a corpus of products reviews in Portuguese. 9th Web as Corpus Workshop
    50. . 14th Conference of the European Chapter of the Association for Computational Linguistics
    51. . XIV Simpósio Brasileiro de Sistemas Multimídia e Web
    52. . 8th International Conference on Intelligent Systems Design and Applications
    53. . VI Workshop em Tecnologia da Informação e da Linguagem Humana
    54. . 7o Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana
    55. Mapeamento de Dados Multi-dimensionais - Integrando Mineração e Visualização. XXIX Congresso da Sociedade Brasileira de Computação (CSBC)
    56. . III Workshop "A RST e os Estudos do Texto"
    57. . 8th Brazilian Symposium in Information and Human Language Technology
    58. Improving Content Selection for Update Summarization with Subtopic-Enriched Sentence Ranking Functions. 17th International Conference on Intelligent Text Processing and Computational Linguistics (CICLing)
    59. An Environment for Data Analysis in Biomedical Domain: Information Extraction for Decision Support Systems. 23th International Conference on Industrial, Engineering & Other Applications of Applied Intelligent Systems
    60. Learning Sentence Reduction Rules for Brazilian Portuguese. 7th International Workshop on Natural Language Processing and Cognitive Science

Organização de eventos

  • Total de organização de eventos (28)
    1. . V Encontro de Corpora. DL-UFSCar e ICMC-USP. 2005. Organizacao
    2. . V Workshop da Tecnologia da Informação e da Linguagem Humana. USP e PUC-Rio. 2007. Organizacao
    3. . XI Simpósio de Teses e Dissertações do Programa de Pós-Graduação em Ciências de Computação e Matemática Computacional. Universidade de São Paulo. 2008. Organizacao
    4. . IV Workshop on MSc Dissertation and PhD Thesis in Artificial Intelligence. Universidade de São Paulo. 2008. Organizacao
    5. . VI Best MSc Dissertation/PhD Thesis Contest. Universidade de São Paulo. 2008. Organizacao
    6. . I Workshop de Iniciação Científica e Tecnológica da Computação. Universidade de São Paulo. 2007. Organizacao
    7. . 8a Feira de Profissões da USP. Universidade de São Paulo. 2008. Organizacao
    8. . Exposição de Ciência e Tecnologia dos 75 Anos da USP. USP. 2009. Organizacao
    9. . II Workshop de Iniciação Científica e Tecnológica da Computação. ICMC=USP. 2008. Organizacao
    10. . I Workshop do NILC. ICMC-USP. 2009. Organizacao
    11. . III Workshop de Iniciação Científica e Tecnológica da Computação. ICMC-USP. 2009. Organizacao
    12. . 7o Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana. ICMC-USP. 2009. Organizacao
    13. . Encontro Brasileiro de RST. ICMC-USP. 2009. Organizacao
    14. . II Congresso do Departamento de Ciências de Computação do ICMC-USP. ICMC-USP. 2009. Organizacao
    15. . IV Workshop de Iniciação Científica e Tecnológica da Computação. Universidade de São Paulo. 2010. Organizacao
    16. . V Workshop de Iniciação Científica e Tecnológica da Computação. Instituto de Ciências Matemáticas e de Computação da Universidade de São Paulo. 2011. Organizacao
    17. . Comemoração dos 40 Anos do Instituto de Ciências Matemáticas e de Computação da Universidade de São Paulo. Universidade de São Paulo. 2011. Organizacao
    18. . 12a Feira de Profissões da USP - campi do Interior. Universidade de São Paulo. 2013. Organizacao
    19. . 7a Feira de Profissões da USP - Capital. Universidade de São Paulo. 2013. Organizacao
    20. . 11th International Conference on Computational Processing of Portuguese. Universidade de São Paulo. 2014. Organizacao
    21. . 9a Feira de Profissões da USP - Capital. Universidade de São Paulo. 2015. Nao_informado
    22. . IV Workshop de Iniciação Científica em Tecnologia da Informação e da Linguagem Humana. Sociedade Brasileira de Computação. 2015. Organizacao
    23. . Escola Avançada em Big Data Analysis. Universidade de São Paulo. 2017. Organizacao
    24. . XX Semana de Recepção aos Calouros do ICMC. Universidade de São Paulo. 2018. Organizacao
    25. . Workshop comemorativo de 25 anos do NILC. Universidade de São Paulo. 2018. Nao_informado
    26. . 13a Feira USP e as Profissões (FEPUSP) - capital. Universidade de São Paulo. 2019. Organizacao
    27. . Universal Dependencies Brazilian Festival (UDFest-BR). Sociedade Brasileira de Computação - Porto Alegre. 2022. Organizacao
    28. . VII Best MSc Dissertation/PhD Thesis Contest in Artificial Intelligence (CTDIA). Sociedade Brasileira de Computação / Centro Universitário FEI. 2010. Organizacao

Lista de colaborações

  • Colaborações endôgenas (5)
    • Thiago Alexandre Salgueiro Pardo ⇔ Sandra Maria Aluísio (17.0)
      1. Watanabe, W.M.; Candido Jr., A.; Amancio, M.A.; Oliveira, M.; PARDO, Thiago Alexandre Salgueiro; FORTES, R. P. M.; ALUÍSIO, Sandra Maria. Adapting Web content for low-literacy readers by using lexical elaboration and named entities labeling. New Review of Hypermedia and Multimedia. v. 16, p. 303-327, 2010.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
      2. NUNES, Maria das Graças Volpe; ALUÍSIO, Sandra Maria; PARDO, Thiago Alexandre Salgueiro. Um panorama do Núcleo Interinstitucional de Linguística Computacional às vésperas de sua maioridade. Linguamática (Braga). v. 2, p. 13-27, 2010.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
      3. ALUÍSIO, Sandra Maria; PARDO, T. A. S.; Duran, M. S.. New corpora for ?new? challenges in Portuguese processing. Em: Working with Portuguese Corpora. 1 ed. : Bloomsbury Academic. 2014.v. 1, p. 303-322.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
      4. PARDO, THIAGO A.S.; BAPTISTA, J.; DURAN, M.; NUNES, Maria das Graças Volpe; Nóbrega, F.A.A.; ALUISIO, S. M.; DI FELIPPO, Ariani; SENO, Eloize Rossi Marques; SILVA, R. R.; ANCHIETA, R. T.; BRUM, H. B.; DIAS, MÁRCIO DE SOUZA; MARTINS, R. S. O.; Maziero, E.G.; Souza, J.W.C.; VARGAS, F. A.. The Coreference Annotation of the CSTNews Corpus. Em: Second Workshop on Evaluation of Human Language Technologies for Iberian Languages (IberEval 2017) co-located with 33th Conference of the Spanish Society for Natural Language Processing (SEPLN) 2017, v. 1881, p. 102-112, 2017.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
      5. HARTMANN, N. S.; AVANCO, L. V.; Balage Filho, P.P; DURAN, M.; NUNES, Maria das Graças Volpe; PARDO, THIAGO A.S.; ALUÍSIO, Sandra Maria. A Large Corpus of Product Reviews in Portuguese - Tackling Out-Of-Vocabulary Words. Em: The 9th Language Resources and Evaluation Conference, v. 1, p. 3865-3871, 2014.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
      6. Duran, M. S.; AVANCO, L.; ALUÍSIO, Sandra Maria; PARDO, T. A. S.; NUNES, Maria das Gracas Volpe. Some issues on the normalization of a corpus of products reviews in Portuguese. Em: 9th Web as Corpus Workshop, ​EACL 2014, v. 1, p. 22-28, 2014.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
      7. Balage Filho, P.P; ALUÍSIO, Sandra Maria; PARDO, Thiago Alexandre Salgueiro. An Evaluation of the Brazilian Portuguese LIWC Dictionary for Sentiment Analysis. Em: 9th Brazilian Symposium in Information and Human Language Technology, v. 1, p. 215-219, 2013.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
      8. Watanabe, W.M.; Candido Jr., A.; Amancio, M.A.; Oliveira, M.; PARDO, Thiago Alexandre Salgueiro; FORTES, R. P. M.; ALUÍSIO, Sandra Maria. Adapting web content for low-literacy readers by using lexical elaboration and named entities labeling. Em: The 2010 International Cross Disciplinary Conference on Web Accessibility (W4A), v. 1, p. 1-9, 2010.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
      9. Watanabe, W.M.; Candido Jr., A.; Uzêda, V.R.; FORTES, R. P. M.; PARDO, Thiago Alexandre Salgueiro; ALUÍSIO, Sandra Maria. Facilita: reading assistance for low-literacy readers. Em: SIGDOC: ACM Special Interest Group for Design of Communications, v. 1, p. 29-36, 2009.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
      10. Candido Jr., A.; Maziero, E.G.; Gasperin, C.; PARDO, Thiago Alexandre Salgueiro; Specia, L.; ALUÍSIO, Sandra Maria. Supporting the Adaptation of Texts for Poor Literacy Readers: a Text Simplification Editor for Brazilian Portuguese. Em: 4th NAACL-HLT Workshop on Innovative Use of NLP for Building Educational Applications, v. 1, p. 34-42, 2009.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
      11. Gasperin, C.; Maziero, E.G.; Specia, L.; PARDO, Thiago Alexandre Salgueiro; ALUÍSIO, Sandra Maria. Natural language processing for social inclusion: a text simplification architecture for different literacy levels. Em: XXXVI Seminário Integrado de Software e Hardware, 2009, v. 1, p. 387-401, 2009.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
      12. Watanabe, W.M.; FORTES, R. P. M.; PARDO, Thiago Alexandre Salgueiro; ALUÍSIO, Sandra Maria. Facilita: auxílio à leitura de textos disponíveis na Web. Em: Brazilian Symposium on Multimedia and the Web, v. 2, p. 27-30, 2009.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
      13. CASELI, Helena Medeiros; Pereira, T.; Specia, L.; PARDO, Thiago Alexandre Salgueiro; Gasperin, C.; ALUÍSIO, Sandra Maria. Building a Brazilian Portuguese parallel corpus of original and simplified texts. Em: 10th Conference on Intelligent Text Processing and Computational Linguistics, v. 41, p. 59-70, 2009.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
      14. ALUÍSIO, Sandra Maria; Specia, L.; PARDO, Thiago Alexandre Salgueiro; Maziero, E.G.; FORTES, R. P. M.. Towards Brazilian Portuguese Automatic Text Simplification Systems.. Em: 8th ACM Symposium on Document Engineering, v. 1, p. 240-248, 2008.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
      15. ALUÍSIO, Sandra Maria; Specia, L.; PARDO, Thiago Alexandre Salgueiro; Maziero, E.G.; CASELI, Helena Medeiros; FORTES, R. P. M.. A Corpus Analysis of Simple Account Texts and the Proposal of Simplification Strategies: First Steps towards Text Simplification Systems.. Em: The 26th ACM International Conference on Design of Communication, v. 1, p. 15-22, 2008.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
      16. Maziero, E.G.; PARDO, Thiago Alexandre Salgueiro; ALUÍSIO, Sandra Maria. Ferramenta Automática de Simplificação Textual. Em: 17o Simpósio Internacional de Iniciação Científica da Universidade de São Paulo, v. 1, p. 1-1, 2009.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
      17. Uzêda, V.R.; PARDO, Thiago Alexandre Salgueiro; ALUÍSIO, Sandra Maria. Tratamento de Informações Redundantes e de Senso Comum. Em: 17o Simpósio Internacional de Iniciação Científica da Universidade de São Paulo, 2009, v. 1, p. 1-1, 2009.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]

    • Thiago Alexandre Salgueiro Pardo ⇔ Solange Oliveira Rezende (8.0)
      1. DA SILVA CONRADO, MERLEY; FELIPPO, ARIANI; SALGUEIRO PARDO, THIAGO; REZENDE, SOLANGE. A survey of automatic term extraction for Brazilian Portuguese. Journal of The Brazilian Computer Society (Online). v. 20, p. 12-40, 2014.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
      2. Koza, W.; Solana, Z.; Conrado, M.S.; Rezende, S.O.; PARDO, Thiago Alexandre Salgueiro; Díaz-Labrador, J.; Abaitua, J.. Extracción terminológica en el dominio médico a partir del reconocimiento de sintagmas nominales. Revista de Lingüística Informática,Modelización e Ingeniería Lingüística (Revista Infosur). v. 5, p. 27-40, 2011.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
      3. DA SILVA CONRADO, MERLEY; Rezende, S.O.; PARDO, THIAGO A.S.. The Main Challenge of Semi-Automatic Term Extraction Methods. Em: 11st International Workshop on Natural Language Processing and Cognitive Science, v. 1, p. 1-10, 2014.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
      4. Conrado, M.S.; PARDO, Thiago Alexandre Salgueiro; Rezende, S.O.. A Machine Learning Approach to Automatic Term Extraction using a Rich Feature Set. Em: Student Research Workshop of the Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, v. 1, p. 16-23, 2013.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
      5. Conrado, M.S.; PARDO, Thiago Alexandre Salgueiro; Rezende, S.O.. Exploration of a Rich Feature Set for Automatic Term Extraction. Em: 12th Mexican International Conference on Artificial Intelligence (MICAI), v. 8265, p. 342-354, 2013.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
      6. Conrado, M.S.; ROSSI, R.G.; PARDO, Thiago Alexandre Salgueiro; Rezende, S.O.. Applying Transductive Learning for Automatic Term Extraction: the Case of the Ecology Domain. Em: The Second International Conference on Informatics & Applications (ICIA2013), v. 1, p. 264-269, 2013.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
      7. Conrado, M.S.; Koza, W.; Díaz-Labrador, J.; Abaitua, J.; Rezende, S.O.; PARDO, Thiago Alexandre Salgueiro; Solana, Z.. Identificación de Términos a partir de Enumeraciones Sintagmáticas Nominales: Una Aplicación al Dominio Médico.. Em: Congreso Argentino de Informática y Salud, v. 1, p. 57-65, 2011.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
      8. Conrado, M.S.; Koza, W.; Díaz-Labrador, J.; Abaitua, J.; Rezende, S.O.; PARDO, Thiago Alexandre Salgueiro; Solana, Z.. Extracting Multiword Expressions using Enumerations of Noun Phrases in Specialized Domains: first experiences. Em: 15th Portuguese Conference on Artificial Intelligence - Text Mining and Applications, v. 1, p. 775-789, 2011.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]

    • Thiago Alexandre Salgueiro Pardo ⇔ Renata Pontin de Mattos Fortes (5.0)
      1. Watanabe, W.M.; Candido Jr., A.; Amancio, M.A.; Oliveira, M.; PARDO, Thiago Alexandre Salgueiro; FORTES, R. P. M.; ALUÍSIO, Sandra Maria. Adapting Web content for low-literacy readers by using lexical elaboration and named entities labeling. New Review of Hypermedia and Multimedia. v. 16, p. 303-327, 2010.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
      2. Watanabe, W.M.; Candido Jr., A.; Amancio, M.A.; Oliveira, M.; PARDO, Thiago Alexandre Salgueiro; FORTES, R. P. M.; ALUÍSIO, Sandra Maria. Adapting web content for low-literacy readers by using lexical elaboration and named entities labeling. Em: The 2010 International Cross Disciplinary Conference on Web Accessibility (W4A), v. 1, p. 1-9, 2010.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
      3. Watanabe, W.M.; Candido Jr., A.; Uzêda, V.R.; FORTES, R. P. M.; PARDO, Thiago Alexandre Salgueiro; ALUÍSIO, Sandra Maria. Facilita: reading assistance for low-literacy readers. Em: SIGDOC: ACM Special Interest Group for Design of Communications, v. 1, p. 29-36, 2009.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
      4. ALUÍSIO, Sandra Maria; Specia, L.; PARDO, Thiago Alexandre Salgueiro; Maziero, E.G.; FORTES, R. P. M.. Towards Brazilian Portuguese Automatic Text Simplification Systems.. Em: 8th ACM Symposium on Document Engineering, v. 1, p. 240-248, 2008.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
      5. ALUÍSIO, Sandra Maria; Specia, L.; PARDO, Thiago Alexandre Salgueiro; Maziero, E.G.; CASELI, Helena Medeiros; FORTES, R. P. M.. A Corpus Analysis of Simple Account Texts and the Proposal of Simplification Strategies: First Steps towards Text Simplification Systems.. Em: The 26th ACM International Conference on Design of Communication, v. 1, p. 15-22, 2008.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]

    • Thiago Alexandre Salgueiro Pardo ⇔ Diego Raphael Amancio (3.0)
      1. Amancio, D.; NUNES, Maria das Graças Volpe; OLIVEIRA JUNIOR, Osvado Novaes de; PARDO, Thiago Alexandre Salgueiro; ANTIQUEIRA, Lucas; COSTA, Luciano da Fontoura. Using metrics from complex networks to evaluate machine translation. Physica. A (Print). v. 390, p. 131-142, 2011.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
      2. Amancio, D.; ANTIQUEIRA, Lucas; PARDO, Thiago Alexandre Salgueiro; COSTA, Luciano da Fontoura; OLIVEIRA JUNIOR, Osvado Novaes de; NUNES, Maria das Graças Volpe. Complex networks analysis of manual and machine translations. International Journal of Modern Physics C. v. 19, p. 583-598, 2008.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
      3. Amancio, D.; NUNES, Maria das Graças Volpe; PARDO, Thiago Alexandre Salgueiro; OLIVEIRA JUNIOR, Osvado Novaes de. Avaliação de qualidade de traduções automáticas usando redes complexas. Em: I Workshop de Iniciação Científica em Tecnologia da Informação e da Linguagem Humana - STIL 2009, p. 1-4, 2009.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]

    • Thiago Alexandre Salgueiro Pardo ⇔ Cristina Dutra de Aguiar (2.0)
      1. Duque, J.L.; Matos, P.F.; Ciferri, C.D.A.; PARDO, Thiago Alexandre Salgueiro; Ciferri, R.R.. Um Processo Baseado em Parágrafos para a Extração de Tratamentos em Artigos Científicos do Domínio Biomédico. Em: 8th Brazilian Symposium in Information and Human Language Technology, v. 1, p. 124-133, 2011.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]
      2. Matos, P.F.; Lombardi, L.O.; PARDO, Thiago Alexandre Salgueiro; Ciferri, C.D.A.; VIEIRA, M. T. P.; Ciferri, R.R.. An Environment for Data Analysis in Biomedical Domain: Information Extraction for Decision Support Systems. Em: 23rd International Conference on Industrial, Engineering and Other Applications of Applied Intelligent Systems, v. 6096, p. 306-316, 2010.
        [ citações Google Scholar | citações Microsoft Acadêmico | busca Google ]




(*) Relatório criado com produções desde 1970 até 2023
Data de processamento: 10/05/2023 08:54:02