Projeto Catarina Label AI
Catarina Label AI Logo

Catarina Label AI

Framework semi-automatizado de rotulagem de dados que utiliza Inteligência Artificial para acelerar o treinamento de modelos, com foco no setor jurídico.

10k+Textos rotulados
521Palavras por texto
UFSCUniversidade
R$5MProjeto Ceos

Sobre o Projeto

Da academia para a inovação

Nascido da experiência prática de pesquisadores da UFSC no Projeto Ceos, o Catarina Label AI transforma um desafio real em uma solução acessível para pesquisadores e empreendedores catarinenses.

O Problema

A rotulagem de dados é um gargalo crítico para a inovação em IA. É uma tarefa manual, repetitiva e massiva que consome centenas de horas de trabalho. Em nosso projeto, rotular 100 textos demandava em média duas horas de trabalho.

A Solução

Idealizamos o Catarina-Label AI: um framework semi-automatizado que utiliza a própria IA para acelerar o treinamento de modelos, combinando rotulagem automatizada com validação humana inteligente.

O Foco

Com foco principal na área jurídica, o projeto visa posicionar a UFSC e Santa Catarina como polo de referência no desenvolvimento de ferramentas de IA aplicadas ao contexto jurídico e ao setor público.

Tecnologias

Estado da arte em rotulagem de dados

Integramos técnicas avançadas do estado da arte na área de rotulagem de dados para IA, fundamentadas por pesquisas recentes.

Pré-Rotulagem com Modelos Fundacionais

Utilização de modelos pré-treinados (LLMs) para gerar automaticamente uma primeira versão dos rótulos, seguindo a abordagem emergente 'LLM as a Judge' que apresenta resultados promissores na literatura internacional.

Redução significativa de custo e tempo
Concordância similar a anotadores humanos
Custo até 100x menor que anotação manual

Aprendizagem Ativa (Active Learning)

O modelo de IA identifica quais dados são mais difíceis e solicita a anotação humana apenas para os exemplos mais informativos, otimizando o tempo do especialista.

Seleção inteligente de amostras
Otimização do tempo do especialista
Foco nos exemplos mais informativos

Interface Human-in-the-Loop

Um fluxo de trabalho interativo em que o humano valida, corrige e refina as decisões da IA, tornando o processo uma colaboração eficiente entre homem e máquina.

Validação humana integrada
Refinamento contínuo do modelo
Colaboração homem-máquina

Equipe

Pesquisadores e Desenvolvedores

Nossa equipe é composta por pesquisadores da UFSC do Projeto Ceos, com competências em Banco de Dados, Machine Learning, NLP e Engenharia de Software.

Impacto & Público-Alvo

Para quem construímos

O Catarina Label AI atende desde pesquisadores acadêmicos até startups e órgãos públicos, oferecendo uma solução acessível e escalável.

Lawtechs & Legaltechs

Startups de tecnologia jurídica que lidam com grandes volumes de documentos textuais como processos, petições e jurisprudências.

Grupos de Pesquisa

Pesquisadores em Direito e Inteligência Artificial que necessitam de datasets anotados para treinamento de modelos.

Órgãos Públicos

Departamentos de inovação de órgãos públicos e escritórios de advocacia que buscam eficiência com IA.

Ecossistema de Inovação

Estudantes de pós-graduação e startups de base tecnológica em áreas como Engenharias, Saúde e Finanças.

Dados do Ecossistema de Tecnologia de Santa Catarina (ACATE Tech Report 2023)

22 milEmpresas de tecnologia em SC
R$23,6BFaturamento anual do setor
35,3%Já utilizam IA/ML
7.700+Empresas potencialmente beneficiadas

Quer saber mais sobre o Catarina Label AI?

Estamos na fase de ideação e validação. Se você é pesquisador, empreendedor ou representa uma instituição interessada em rotulagem inteligente de dados, entre em contato conosco.