Catarina Label AI
Framework semi-automatizado de rotulagem de dados que utiliza Inteligência Artificial para acelerar o treinamento de modelos, com foco no setor jurídico.
Sobre o Projeto
Da academia para a inovação
Nascido da experiência prática de pesquisadores da UFSC no Projeto Ceos, o Catarina Label AI transforma um desafio real em uma solução acessível para pesquisadores e empreendedores catarinenses.
O Problema
A rotulagem de dados é um gargalo crítico para a inovação em IA. É uma tarefa manual, repetitiva e massiva que consome centenas de horas de trabalho. Em nosso projeto, rotular 100 textos demandava em média duas horas de trabalho.
A Solução
Idealizamos o Catarina-Label AI: um framework semi-automatizado que utiliza a própria IA para acelerar o treinamento de modelos, combinando rotulagem automatizada com validação humana inteligente.
O Foco
Com foco principal na área jurídica, o projeto visa posicionar a UFSC e Santa Catarina como polo de referência no desenvolvimento de ferramentas de IA aplicadas ao contexto jurídico e ao setor público.
Tecnologias
Estado da arte em rotulagem de dados
Integramos técnicas avançadas do estado da arte na área de rotulagem de dados para IA, fundamentadas por pesquisas recentes.
Pré-Rotulagem com Modelos Fundacionais
Utilização de modelos pré-treinados (LLMs) para gerar automaticamente uma primeira versão dos rótulos, seguindo a abordagem emergente 'LLM as a Judge' que apresenta resultados promissores na literatura internacional.
Aprendizagem Ativa (Active Learning)
O modelo de IA identifica quais dados são mais difíceis e solicita a anotação humana apenas para os exemplos mais informativos, otimizando o tempo do especialista.
Interface Human-in-the-Loop
Um fluxo de trabalho interativo em que o humano valida, corrige e refina as decisões da IA, tornando o processo uma colaboração eficiente entre homem e máquina.
Equipe
Pesquisadores e Desenvolvedores
Nossa equipe é composta por pesquisadores da UFSC do Projeto Ceos, com competências em Banco de Dados, Machine Learning, NLP e Engenharia de Software.
Impacto & Público-Alvo
Para quem construímos
O Catarina Label AI atende desde pesquisadores acadêmicos até startups e órgãos públicos, oferecendo uma solução acessível e escalável.
Lawtechs & Legaltechs
Startups de tecnologia jurídica que lidam com grandes volumes de documentos textuais como processos, petições e jurisprudências.
Grupos de Pesquisa
Pesquisadores em Direito e Inteligência Artificial que necessitam de datasets anotados para treinamento de modelos.
Órgãos Públicos
Departamentos de inovação de órgãos públicos e escritórios de advocacia que buscam eficiência com IA.
Ecossistema de Inovação
Estudantes de pós-graduação e startups de base tecnológica em áreas como Engenharias, Saúde e Finanças.
Dados do Ecossistema de Tecnologia de Santa Catarina (ACATE Tech Report 2023)
Quer saber mais sobre o Catarina Label AI?
Estamos na fase de ideação e validação. Se você é pesquisador, empreendedor ou representa uma instituição interessada em rotulagem inteligente de dados, entre em contato conosco.