


default search action
15th STIL 2024: Belém, PA, Brazil
- Proceedings of the 15th Brazilian Symposium in Information and Human Language Technology, STIL 2024, Belém, PA, Brazil, November 17-21, 2024. SBC 2024

Main Conference
- Caio Siqueira

, Orlando Fonseca Guilarte
, Giuliano Ferreira
, Omar Leiva:
Leveraging Structured Data Input for Effective Chatbot Integration in Enterprises. 1-5 - Giovana Y. Nakashima, Higor D. C. Santos, Jone W. M. Soares, Mário Uliani Neto, Fernando O. Runstein, Ricardo P. V. Violato, Marcus Lima:

Avaliação de modelos para detecção de ataques de replay usando diferentes bases de dados. 6-11 - Bruno C. dos S. Ribeiro, Gustavo H. dos S. Figueiredo, Leonardo H. da S. Correia, Mário Uliani Neto, Fernando O. Runstein, Ricardo P. V. Violato, Marcus Lima:

Avaliação de arquiteturas de síntese de fala generativa com abordagens de espectrograma e fim-a-fim em cenários low-resource para clonagem de voz. 12-16 - Diego Dimer Rodrigues

, Mariana Recamonde Mendoza
, Viviane P. Moreira
:
Beyond Single Models: Leveraging LLM Ensembles for Human Value Detection in Text. 17-22 - Arthur Buzelin

, Yan Aquino
, Pedro Bento, Samira Malaquias
, Wagner Meira Jr.
, Gisele L. Pappa
:
A Change in Perspective: The Trade-Off Between Perspective API and Custom Models in Classifying Hate Speech in Portuguese. 23-31 - Luciano A. C. da Silva, Maiara S. F. Rodrigues, Adriana P. Archanjo, Luis Pessoa

, Miguel L. Silva, Thiago F. de Almeida, Leonardo Silveira
:
Segmentação Textual Baseada em Tópicos em Português Utilizando BERTimbau. 32-36 - Anderson Luiz Karl

, Guilherme Sales Fernandes, Leonardo Augusto Pires, Yvens R. Serpa
, Carlos Caminha
:
Synthetic AI Data Pipeline for Domain-Specific Speech-to-Text Solutions. 37-47 - Marcos F. Pontes, Rodrigo C. Pedrosa

, Pedro H. Lopes, Eduardo Luz
:
Evaluating Federated Learning with Homomorphic Encryption for Medical Named Entity Recognition Using Compact BERT Models. 48-56 - Amanda Oliveira

, Pedro H. L. Silva
, Valéria de Carvalho Santos, Gladston Moreira
, Vander L. S. Freitas
, Eduardo José da S. Luz
:
Toxic Text Classification in Portuguese: Is LLaMA 3.1 8B All You Need? 57-66 - Lucelene Lopes

, Thiago Alexandre Salgueiro Pardo
, Magali Sanches Duran:
Syntactic parsing: where are we going? 67-74 - Rafael T. Anchiêta

, Rogério F. de Sousa
, Raimundo S. Moura:
A Robustness Analysis of Automated Essay Scoring Methods. 75-80 - Jonas Gabriel L. de Araújo

, Thaís Gaudencio do Rêgo, Yuri de A. M. Barbosa
:
Avaliação de Algoritmos de Clusterização para Agrupamento de Descrições de Produtos em Notas Fiscais Eletrônicas. 81-86 - Gustavo Evangelista Araújo

, Julio Cesar Galdino
, Rodrigo de F. Lima
, Leonardo Ishida, Gustavo W. Lopes, Miguel Oliveira Jr.
, Arnaldo Cândido Jr.
, Sandra M. Aluísio, Moacir A. Ponti
:
EyetrackingMOS: Proposta de um método de avaliação online para modelos de síntese de fala. 87-96 - Gabriel Assis

, Arthur B. Vasconcelos, Lívia de Azevedo, Mariza Ferro
, Aline Paes:
Modestos e Sustentáveis: O Ajuste Eficiente Beneficia Modelos de Língua de Menor Escala em Português? 97-107 - Natan de S. Rodrigues

, Célia G. Ralha:
A Hybrid Machine Learning Method to Author Name Disambiguation. 108-117 - Cláudia Freitas

, Thiago Alexandre Salgueiro Pardo
:
PropBank e anotação de papéis semânticos para a língua portuguesa: O que há de novo? 118-128 - Israel Campos Fama

, Bárbara Dias Bueno, Alexandre Alcoforado
, Thomas Palmeira Ferraz
, Arnold Moya Lavado, Anna Helena Reali Costa
:
No Argument Left Behind: Overlapping Chunks for Faster Processing of Arbitrarily Long Legal Texts. 129-138 - Marcio Alves Sarmento

, Hilário Tomaz Alves de Oliveira
:
Sumarização Automática de Artigos de Notícias em Português: Da Extração à Abstração com Abordagens Clássicas e Modelos de Neurais. 139-148 - Tiago Felipe V. Braga

, Bruno Cardoso Coutinho
, Hilário Tomaz Alves de Oliveira
:
Geração Automática de Perguntas em Português do Brasil Usando os Modelos PTT5 e FLAN-T5. 149-158 - Gustavo Polleti, Fábio G. Cozman

, Fabrício Ferraz Gerardi:
Unified Knowledge-Graph for Brazilian Indigenous Languages: An Educational Applications Perspective. 159-164 - William Jones Beckhauser

, Renato Fileto
:
Boosting not so Large Language Models by using Knowledge Graphs and Reinforcement Learning. 165-175 - Luiz H. N. Silva, Eloize R. M. Seno, Rozane Rodrigues Rebechi, Helena de Medeiros Caseli

, Fabiano M. Rocha Júnior, Guilherme A. Faller:
Identificação de aspectos explícitos e implícitos em críticas gastronômicas em português: avaliando o potencial dos LLMs. 176-181 - Elvis A. de Souza

, Patricia Ferreira da Silva, Diogo Gomes
, Vitor A. Batista
, Evelyn Batista
, Marco Aurélio Pacheco
:
TableRAG: A Novel Approach for Augmenting LLMs with Information from Retrieved Tables. 182-191 - Ariani Di Felippo

, Maria das Graças Volpe Nunes
, Bryan K. da Silva Barbosa
:
A Dependency Treebank of Tweets in Brazilian Portuguese: Syntactic Annotation Issues and Approach. 192-201 - Lucas Lenoch de Souza, Franciele Beal

, André Roberto Ortoncelli
, Marlon Marcon
:
Detection and Censorship of Offensive Language in Extended Texts in Portuguese. 202-211 - Wagner Narde, João Mendanha, Henrique Barbosa, Frederico Coelho, Bruno P. Santos, Luiz C. B. Torres:

Classificação de Notícias em Português Utilizando Modelos Baseados em Transferência de Aprendizagem e Transformers. 212-216 - Elvis A. de Souza

, Magali Sanches Duran, Maria das Graças Volpe Nunes
, Gustavo Sampaio Lima
, Giovanna Belasco, Thiago A. S. Pardo
:
Automatic Annotation of Enhanced Universal Dependencies for Brazilian Portuguese. 217-226 - Pedro L. S. de Lima

, Cláudio E. C. Campelo:
Disfluency Detection and Removal in Speech Transcriptions via Large Language Models. 227-235 - Mirelle Bueno, Eduardo Seiti de Oliveira

, Rodrigo Nogueira
, Roberto A. Lotufo
, Jayr Pereira
:
Quati: A Brazilian Portuguese Information Retrieval Dataset from Native Speakers. 236-246 - Paula C. F. Cardoso

, Jackson Wilke da Cruz Souza
, Roana Rodrigues
, Ewerson Dantas, Larissa Santa Bárbara
, Mateus Araújo Pereira, Naira Gama, Tobias J. A. Almeida, Gabriel Cruz:
A Linguagem em Foco: Anotação de Sinalizadores Discursivos em Textos Jornalísticos. 247-256 - Ariani Di Felippo

, Norton Trevisan Roman
, Bryan K. S. Barbosa
, Thiago A. S. Pardo
:
Genipapo - A Multigenre Dependency Parser for Brazilian Portuguese. 257-266 - Leandro Yamachita da Costa, João Baptista de Oliveira e Souza Filho

:
Adapting LLMs to New Domains: A Comparative Study of Fine-Tuning and RAG strategies for Portuguese QA Tasks. 267-277 - Bryan K. S. Barbosa

, Cláudio E. C. Campelo:
LLMs as Tools for Evaluating Textual Coherence: A Comparative Analysis. 278-287 - Fabio Masaracchia Maia

, Anna Helena Reali Costa
:
Anomaly Detection in Text Data: A Semi-Supervised Approach Applied to the Portuguese Domain. 288-293 - Fernanda Malheiros Assi

, Helena de Medeiros Caseli
:
Biases in GPT-3.5 Turbo model: a case study regarding gender and language. 294-305 - Vitor Domingos Baldoino do Santos, Livia Alabarse dos Santos

, Orlando B. Coelho
, Renata Mendes de Araujo, Ivan Carlos Alcântara de Oliveira
:
Mineração de Argumentos em Textos de Redes Sociais no Idioma Português. 306-316
Portuguese Description Journey
- Raquel Meister Ko Freitag, Túlio Sousa de Gois

:
Performance in a dialectal profiling task of LLMs for varieties of Brazilian Portuguese. 317-326 - Eliene da S. Alves, Brayna C. dos S. Cardoso:

Mini-glossário do Tucumã do Pará no Município de Acará: olhares, significados e cultura da Amazônia. 327-335 - Lucelene Lopes, Magali Sanches Duran, Thiago Alexandre Salgueiro Pardo:

Desambiguação de lema e atributos morfológicos na anotação do córpus Porttinari-base. 336-345 - Elvis A. de Souza, Magali Sanches Duran, Adriana S. Pagano:

An NLP approach to impersonal -se in Brazilian Portuguese. 346-355 - Magali Sanches Duran, Maria das Graças Volpe Nunes, Thiago A. S. Pardo:

Inferências baseadas em sintaxe: a anotação de sujeitos implícitos. 356-364 - Helena Freire Camero

, Fernanda Olival, Renata Vieira
:
Notes on variation and lexical diachrony in the Parish Memories-Alentejo collection (1758). 365-374 - Francelino Wilson, Vasco Magona, Felermino Ali:

A sílaba e a composicionalidade em emakhuwa (P31): análise de empréstimos do português. 375-385 - Gabriela Wick-Pedro, Roney Lira de Sales Santos, Oto A. Vale:

Linguistic and emotional dynamics in satirical vs. real news: a psycholinguistic analysis. 386-392 - Ryan Saldanha Martinez, Jorge Baptista, Oto A. Vale:

Complementos de eco de adjetivos com completiva-sujeito em português do Brasil. 393-402 - Lorena Tasca Larré, Tiago Timponi Torrent:

Modelagem baseada em frames para identificação do léxico da Violência de Gênero. 403-412 - Maria M. Cantoni

, Vitor A. M. Prado:
Word stress effects on syllable onset in Brazilian Portuguese. 308-315
Undergraduate Research Workshop on Information Technology and Human Language
- Tobias J. A. Almeida

, Patrícia V. Almeida, Paula C. F. Cardoso:
Relações Retóricas de List e Sequence em textos jornalísticos. 413-417 - Naira Silva Gama, Jackson Wilke da Cruz Souza

:
Estudo preliminar sobre sinalizadores discursivos para Conteúdo Gerado por Usuário. 418-423 - Larissa Jesus Santa Bárbara

, Roana Rodrigues
, Jackson Wilke da Cruz Souza
:
Relações de coerência do português brasileiro: um estudo bibliográfico-documental da RST e seus sinalizadores discursivos. 424-428 - Mateus Araújo Pereira, Jackson Wilke da Cruz Souza

:
Subsídios Linguísticos para Classificação Automática de Textos de User-Generated Content. 429-433 - Ewerson Dantas, Roana Rodrigues

, Jackson Wilke da Cruz Souza
:
Relações de coerência do espanhol peninsular: Um estudo bibliográfico-documental da Rhetorical Structure Theory. 434-439 - Gabriel Sizinio Bomfim Cruz, Jackson W. C. Souza

, Paula C. F. Cardoso:
Estratégias Automáticas para Análise da Concordância da Anotação de Sinalizadores Discursivos. 440-444 - Ramon N. Mendes

, Syanne K. M. Tavares, Luiz Nicollas M. Campos, Fabíola P. O. Araújo
:
Mineração de Emoções Multirrótulo Em Textos Curtos. 445-450 - Marcella Queiroz de Castro, Ana Régia de Mendonça Neves:

PLN e Segurança Jurídica: Identificação de divergências jurisprudenciais com Processamento de Linguagem Natural. 451-456 - Iolanda Victoria Morais Ramos

, Jackson Wilke da Cruz Souza
:
Classificação automática de textos de User-Generated Content utilizando Aprendizagem de Máquina Supervisionado. 457-462 - Livia A. dos Santos, Orlando B. Coelho

, Renata Mendes de Araujo, Ivan Carlos A. Oliveira:
Um Pipeline de Pré-Processamento de Dados Textuais em Português para Análise de Redes Sociais. 463-468 - Rodrigo Marques Duarte

, André de Lima Salgado
, Paula Christina Figueira Cardoso:
Especulação Mística. Uma abordagem de Clusterização e Busca Semântica na aproximação de preço em cartas de Magic: The Gathering. 469-473 - Benjamin Grando Moreira

, Luiz Carlos Camargo
, Ricardo J. Pfitscher, Tatiana R. Garcia:
Comparação de Ferramentas para Análise de Sentimentos Aplicada no Contexto Educacional. 474-478 - Mario Pinto Freitas Filho, João Dallyson Sousa de Almeida

, Anselmo Cardoso de Paiva
:
Modelo de Linguagem Quantizados na Area da Saúde: Um Enfoque em Perguntas e Respostas com Base na Tecnica DPO. 479-483
Portuguese Data Augmentation Workshop
- Lucas Nildaimon dos Santos Silva

, Livy Real:
Automated Topic Annotation in Brazilian Product Reviews: A Case Study of Adversarial Examples with Sabia-3. 484-492 - Aline Athaydes, Lucas Krug Bulcao, Caio Sacramento de Britto Almeida, Babacar Mane

, Daniela Barreiro Claro, Marlo Souza, Robespierre Pita
:
Brazilian Consumer Protection Code: a methodology for a dataset to Question-Answer (QA) Models. 493-500 - Fabiana Avais, Marcos Carreira

, Livy Real:
Getting Logic From LLMs: Annotating Natural Language Inference with Sabiá. 501-510 - Evandro Fonseca, Joaquim Neto:

LLM-SEMREL: Towards a Better Coreference Resolution for Portuguese. 511-519 - Leticia Freire de Figueiredo, Joel Pinho Lucas

, Aline Paes:
Augmenting Data to Improve the Performance of Recommender Systems. 520-523

manage site settings
To protect your privacy, all features that rely on external API calls from your browser are turned off by default. You need to opt-in for them to become active. All settings here will be stored as cookies with your web browser. For more information see our F.A.Q.


Google
Google Scholar
Semantic Scholar
Internet Archive Scholar
CiteSeerX
ORCID














