


default search action
16th STIL 2025: Fortaleza, CE, Brazil
- Proceedings of the 16th Brazilian Symposium in Information and Human Language Technology, STIL 2025, Fortaleza, CE, Brazil, September 29 - October 2, 2025. SBC 2025

Main Conference
- Vinícius A. Aguiar, Leonardo Afonso Amorim, Artur M. A. Novais, Gustavo L. B. Pereira, Tales de Oliveira, Carlos A. de Souza, Arlindo R. G. Filho, Anderson da Silva Soares, Sávio S. T. de Oliveira:

Evaluating Domain-Specialized LLMs in Multi-Agent RAG for Enterprise Retrieval. 1-12 - Leonel Figueiredo de Alencar:

Enhancing a Nheengatu Morphosyntactic Analyzer for Word Formation and Non-standard Language. 13-28 - Bryan K. S. Barbosa, Ariani Di Felippo:

NounBank.DS: a Lexical Repository of Nominal Frames from Stock Market Tweets in Brazilian Portuguese. 29-41 - Ricardo Rodrigues Barcelar, Leonardo Arruda Vilela Garcia, Alan Papafanurakis Heleno, Thiago Meirelles Ventura, Allan Gonçalves de Oliveira:

Knowledge Distillation in Compact Models: An Approach Applied to Text Processing for Public Security. 42-51 - Ana Begnini, Matheus Vicente, Leonardo Souza:

A Two-Stage Architecture for NDA Analysis: LLM-based Segmentation and Transformer-based Clause Classification. 52-65 - Gustavo Bonil, João Medrado Gondim, Viviane Bonadia dos Santos, Simone Tiemi Hashiguti, Helena Almeida Maia, Nádia Félix F. da Silva, Hélio Pedrini, Sandra Avila:

Clustering Discourses: Racial Biases in Short Stories about Women Generated by Large Language Models. 66-77 - Sara Câmara, Eduardo Luz, Valéria Carvalho, Ivan Reinaldo Meneghini, Gladston Moreira:

MOPrompt: Multi-objective Semantic Evolution for Prompt Optimization. 78-89 - Erica Carneiro, Alexander Feitosa, Gustavo Paiva Guedes:

When Annotators Disagree: A Controlled Evaluation of Gender Bias in Sentiment Analysis Using Synthetic Datasets. 90-100 - Luís Felippe C. de Carvalho, Paulo Sérgio dos Santos Júnior, Hilário Tomaz Alves de Oliveira:

Benchmarking Large Language Models for Text-to-SQL in Brazilian Portuguese and English. 101-112 - Giovana Meloni Craveiro, Caroline A. Alves, Flaviane Romani Fernandes Svartman, Sandra M. Aluísio:

Machine Learning Classifiers with Acoustic Features for Prosodic Segmentation in Brazilian Portuguese: A Comprehensive Evaluation. 113-124 - Lucas Darcio, Karina Soares Santos, Amanda Spellen, Esther Soares, Livy Real, Altigran Soares da Silva:

LattesRex: Building ChatBots for Semi-Structured Documents. 125-136 - Marcelo Mussi Delucis, Lucas Fraga

, Otávio Parraga, Christian Mattjie de Oliveira, Rafaela Cappelari Ravazio, Rodrigo C. Barros, Lucas S. Kupssinskü:
Automated Fact-Checking in Brazilian Portuguese: Resources and Baselines. 137-148 - Murilo Gazzola, Hugo Gobato Souto, Samuel Silva, Júlia Schubert Peixoto, Felipe Siqueira, André Luis Pedroso de Morais, Caio Gomes:

AI-PAVE-Br: Leveraging Large Language Models for Enhanced Product Attribute Value Extraction through a Golden Set Approach. 149-160 - Túlio Sousa de Gois, Raquel Meister Ko. Freitag:

Avaliação de eficiência na leitura: uma abordagem baseada em PLN. 161-169 - Fernando F. Granado, Roberto A. Lotufo, Jayr Pereira:

RAISE: Reasoning Agent for Interactive SQL Exploration. 170-181 - Bruno Vinicius Veronez de Jesus, Arnaldo Cândido Júnior:

Aprendizado Profundo para Detecção de Movimentos Retóricos. 182-191 - Rodrigo Cavalcanti, Gabriela Casini, Gabriel Assis, Livy Real, Daniela Vianna, Paulo Mann, Aline Paes:

Diplomatrix-BR: Um Corpus Paralelo de Redações de Autoria Humana e de LLMs no Concurso de Diplomacia Brasileira. 192-205 - Jhúlia de Souza Leal, Marcio Lima Inácio, Hugo Gonçalo Oliveira, Rafael Torres Anchiêta:

Improving Pun Detection with an Ensemble of Traditional Machine Learning Methods. 206-219 - Lucelene Lopes, Maria das Graças Volpe Nunes, Magali Sanches Duran, Thiago A. S. Pardo:

A sintaxe no tribunal: apresentando e explorando um corpus jurídico em português anotado sintaticamente segundo o modelo Universal Dependencies. 220-232 - Fabio Masaracchia Maia, Anna Helena Reali Costa:

Learning with Few: A Comparative Study of Multilingual Text Anomaly Detection. 233-246 - Renato Miyaji, Renato Moulin, Samuel Monção, Leonardo Machado:

Evaluating RAG-based QA Systems: A Comparative Analysis of LLM as a Judge, Traditional Metrics, and Human Alignment. 247-258 - Higor Moreira, Patricia Ferreira da Silva, Renata Vieira, Viviane P. Moreira:

PetroGeoNER: A Refined and Unified Dataset for NER in the Oil & Gas Domain. 259-271 - Aline Athaydes, Lucas B. Bulcão Mota, Fernando de Almeida Moraes, Samuel Rios da Silva, Babacar Mane, Daniela Barreiro Claro, Marlo Souza, Andressa Beatriz Cardoso Lisboa:

Towards a Corpus Methodology for LLMs in the Legal Domain. 272-282 - Ricardo Gomes de Oliveira, Laila Pereira Mota Santos, Lílian Teixeira de Sousa, Marcos Adriano Pereira dos Santos, Daniela Barreiro Claro, Rerisson Cavalcante de Araújo:

Fine-tuned model evaluation on Transformer Fragments for Identifying Idiomatic Expressions in Portuguese. 283-294 - Ricardo Gomes de Oliveira, Daniela Barreiro Claro, Rerisson Cavalcante de Araújo:

Syntactic Analysis in Transformers through Attention Heads. 295-306 - Felipe S. F. Paula, Matheus Westhelle, Maria Cecília M. Corrêa, Luciana Regina Bencke, Viviane P. Moreira:

How Faithful Are Your Summaries? A Study of NLI-Based Verification in Portuguese. 307-322 - Jorge N. S. Pavão, Kele T. Belloze, Gustavo Paiva Guedes:

Impacto do Idioma no Desempenho de Algoritmos de Classificação de Texto: Um Estudo entre Português e Inglês. 323-333 - David Eduardo Pereira, Daniela Thuaslar Simão, Cláudio E. C. Campelo:

DEBISS-Arg: An In Depth Data Annotation Protocol and Corpus for Argument Mining in Semi Structured Debates. 334-348 - Henry R. Piceni, Pedro V. Alexandre, Dennis Giovani Balreira:

A Música Brasileira na Ditadura Militar: uma análise de tópicos com BERTopic e GSDMM. 349-360 - Antônio dos Santos Ramos Neto, João Paulo Felix, Wylliams Santos, Byron Leite Dantas Bezerra, Cleyton Mário de Oliveira Rodrigues:

CROSSAGE: A cross-attentional graph and Transformer architecture for skill and knowledge recognition in job descriptions. 361-373 - Angel G. de S. Sales, Brenda C. D. Moura, José E. B. de S. Linhares, Fabiann Matthaus Dantas Barbosa:

Restauração de Pontuação em Textos Traduzidos no Idioma pt-BR a partir de Transcrição de Áudios. 374-384 - Daniel Ribeiro da Silva, Maria Eduarda Silva Borba, Gustavo dos Reis Oliveira, Pedro Reis Pimenta, Állan Christoffer Pereira Silva, Guilherme Correia Dutra, Sávio Salvarino Teles de Oliveira:

Adapting ASR Models to Technical Scenarios: A Case Study in the Brazilian Automotive Repair Domain. 385-396 - Anna Beatriz Silva, Cleyton Mário de Oliveira Rodrigues, Patricia Takako Endo:

Evaluation of an NLP-Based Chatbot for Informational Support in Bronchopulmonary Dysplasia (BPD) in neonates. 397-406 - Mariana O. Silva, Michele A. Brandão, Mirella M. Moro:

Gender Bias in Portuguese Literary Texts: A Masked Language Model Approach. 407-419 - Leandro O. da Silva, Daniela L. Freire

, Márcio P. Basgalupp, André C. P. L. F. de Carvalho:
Techniques for Dealing with Imbalanced Data: A Systematic Literature Review. 420-428 - Tamyres Vial de Souza, Jhonata Tirloni, Felipe Belo, Nelcileno Virgilio de Souza Araújo, Thiago M. Ventura, Allan Gonçalves de Oliveira:

GolpeBR: Construction and Validation of an Annotated Dataset on Banking Scams and Fraud. 429-440 - Luisa Stellet, Isabella Leite, Gabriel Assis, Aline Paes:

Meta4BR: Avaliando a Fidelidade Metafórica em Traduções de Metáforas para o Português por LLMs. 441-454 - Leonardo de Campos Taschetto, Renato Fileto:

Evaluating Large Language Models through Multidimensional Item Response Theory: A Comprehensive Case Study on ENEM. 455-466 - Matheus Yasuo Ribeiro Utino, Paulo Mann:

From Zero-shot to Self-generated References: Leveraging LLMs for Scoring ENEM Essays. 467-477 - Renata Vieira, Helena Freire Cameron, Fernanda Olival, Joaquim Santos:

Corpus Memórias Paroquiais: Avanços em Reconhecimento de Entidades. 478-489 - Manuela Guedes Wanderley, Lucca Baptista Silva Ferraz, Tiago Agostinho de Almeida, Renato Moraes Silva:

A Moving Target: Detecting Concept Drift in Brazilian Portuguese Fake News. 490-501 - Nathanael Motta, Ana Claudia Maria de Souza, Carlo Marcelo Revoredo da Silva, Cleyton Mário de Oliveira Rodrigues:

Empirical Evaluation of Preprocessing and Balancing Techniques Impact Across Algorithm-Vectorizer Combinations in Sentiment Classification. 502-511 - Caio Sacramento de Britto Almeida, Renata Vieira, Débora Abdalla Santos:

Análise de tópicos e sentimentos em cartas indígenas brasileiras. 512-518 - Cid Ivan C. Carvalho, Francisca Ticiany B. L. Oliveira, Vitória Maria A. Silva:

Modelo de Classificação Automática de Frases Faladas com Abordagem em Redes Neurais Convolucionais. 519-525 - Lucas Consolin Dezotti:

Estratégias de modelização de dicionários latim-português como Linked Open Data. 526-533 - Maucha Andrade Gamonal, Adriana S. Pagano, Tiago Timponi Torrent, Ely Edison Matos:

Frame-Based Semantic Representation and Similarity Analysis in Audio Description Scripts. 534-541 - José Fernando Rodrigues Ferreira Neto, Daniel M. Colares, Daniel Ribeiro, Yuri Nekan Soares Fontes, Vládia Pinheiro:

Use of Embodied Conversational Agents to Engage Visitors in Art Exhibits. 542-548 - Lucas G. Pellegrini, Fernanda M. C. Santos, Felipe H. S. Cantarino:

Classificação de Notícias Falsas na Língua Portuguesa Utilizando Modelos Baseados na Arquitetura Transformer. 549-556 - Adriana S. Pagano, Carlos A. S. Perini, Cláudia Benevenute, Cristiano Colombo:

Anotação de Narrativas Clínicas de acordo com as diretrizes das Dependências Universais. 557-563 - Andreis G. M. Purim, Karlis Kuskevics:

The Zé Lensky Dataset: A Brazilian Portuguese Twitter Corpus for Russo-Ukraine War Stance and Sentiment Analysis. 564-571 - Sávio Santos de Araújo

, Byron Leite Dantas Bezerra, Arthur Flor de Sousa Neto:
Towards Prompt Engineering and Large Language Models for Post-OCR correction in handwritten texts. 572-579 - Klaywert Danillo Ferreira de Souza, David Eduardo Pereira, Cláudio E. C. Campelo, Larissa Lucena Vasconcelos:

DEBISS: a Corpus of Individual, Semi-structured and Spoken Debates. 580-587
Portuguese Description Journey
- Dominick Maia Alexandre, Leonel Figueiredo de Alencar:

Universal Dependencies for 19th-Century Nheengatu from the Lower Amazon Region. 588-598 - Márcia Cançado:

VerboWeb 3.0: Decoding Verb Behavior in Brazilian Portuguese - From Lexical Semantics to Web-Verified Syntactic Patterns. 599-607 - Gabriel Ceregatto, Ariani Di Felippo:

DANTEStocks-AMR em Construção: Avanços e Desafios na Anotação Semântica de Tweets Financeiros. 608-617 - Izabel Nunes Dias, Thiago Blanch Pires:

Aspectos do desenvolvimento de um etiquetador morfossintático da língua Asuriní do Trocará. 618-626 - Isaac Souza de Miranda Jr., Oto Araújo Vale:

Análise da Anotação de Negação em Corpora sob as Diretrizes da Universal Dependencies. 627-634 - Ryan Saldanha Martinez, Jorge Baptista, Oto Araújo Vale:

Elevação de sujeito e objeto da completiva-sujeito de adjetivos em português do Brasil. 635-644 - João Pedro Gonçalves Munhoz, Oto Araújo Vale:

O Obstáculo das Ambiguidades Estruturais da Língua para Modelos de Linguagem Linguisticamente Motivados. 645-653 - Laís Piai, Ariani Di Felippo, Norton Trevisan Roman:

Named Entities in Stock Market Tweets: A Fine-Grained and Linguistically-Motivated Annotation. 654-663 - Marquize Silva dos Santos, Roana Rodrigues, Jackson Wilke da Cruz Souza:

A oposição nas relações de coerência Contrast e Concession. 664-672 - Elisa Marchioro Stumpf, Juliana Schoffen, Luiza Sarmento Divino, Isadora Dahmer Hanauer, Amanda Raupp, Brenda Xavier:

Corpus-driven lexical analyses of CorCel: a comparative analysis of preliminary findings of written proficiency in Portuguese as an additional language. 673-681
Undergraduate Research Workshop on Information Technology and Human Language
- João Augusto F. Balducci, Saullo H. G. Oliveira:

Extração de Eventos em Notas Clínicas. 682-687 - Erick de Brito, Matheus Teotonio, Roberto A. Lotufo, Jayr Pereira:

Avaliando Ferramentas de IA Generativa no Conjunto de Perguntas e Respostas da Receita Federal. 688-692 - Yuri Hughes, Marlo Souza:

Analisando o Fine-Tuning para Transferência de Conhecimento entre Línguas: um estudo para a Língua Portuguesa. 693-697 - Gustavo Sampaio Lima, Davi Fagundes Ferreira da Silva, Thiago Alexandre Salgueiro Pardo:

Sumarização de opinião multidocumento para o português: comparando um método baseado em grafo com um LLM. 698-702 - Lucas B. Bulcão Mota, Aline Athaydes, Babacar Mane, Daniela Barreiro Claro, Marlo Souza, Fernando Humberto:

Da criação de um Corpus ao treinamento de um grande modelo de linguagem: O que pode dar errado em uma IC? 703-707 - Antônio Levy Melo Nogueira, Letícia Farias Nunes, Dominick Maia Alexandre, Leonel Figueiredo de Alencar:

Compilação, modernização e anotação morfossintática de um corpus histórico do nheengatu segundo o modelo das Dependências Universais. 708-712 - Mateus Araújo Pereira, Jackson Wilke da Cruz Souza:

Anotação Enhanced Rhetorical Structure Theory em textos de User-Generated Content. 713-717 - Samuel Rios da Silva, Aline Athaydes, Babacar Mane, Daniela Barreiro Claro, Marlo Souza, Fernando de Almeida Moraes, Larrissa Dantas, Rerisson Cavalcante de Araújo:

Desafios dos Grafos de Conhecimento: uma proposta de avaliação de sistemas OpenIE. 718-722 - Pedro T. Schettini, Guilherme Possari, Bruno S. Faiçal, Rodolfo M. Barros:

LLMs no Combate à Desinformação: A Influência do Tamanho do Modelo na Detecção de Fake News no Brasil. 723-727 - Carlos Vitor Cardoso da Silva, Jackson Wilke da Cruz Souza, Paula Christina Figueira Cardoso:

RST Visualizer: Uma ferramenta para a análise comparativa de anotações da Teoria da Estrutura Retórica. 728-732 - Avelar Rodrigues de Sousa

, Rafael Torres Anchiêta:
SisTIRA: Plataforma Web de Tutoria Inteligente para Avaliação Automática de Respostas Discursivas. 733-737

manage site settings
To protect your privacy, all features that rely on external API calls from your browser are turned off by default. You need to opt-in for them to become active. All settings here will be stored as cookies with your web browser. For more information see our F.A.Q.


Google
Google Scholar
Semantic Scholar
Internet Archive Scholar
CiteSeerX
ORCID














