102014023780 MÉTODO PARA CLASSIFICAÇÃO MULTICLASSE EM CENÁRIOS ABERTOS E USOS DO MESMO
Depósito: 25/09/2014
Destaque: licenciada para Samsung
Inventor: PEDRO RIBEIRO MENDES JÚNIOR / ROBERTO MEDEIROS DE SOUZA / RAFAEL DE OLIVEIRA WERNECK / BERNARDO VECCHIA STEIN / DANIEL VATANABE PAZINATO / WALDIR RODRIGUES DE ALMEIDA / OTÁVIO AUGUSTO BIZETTO PENATTI / RICARDO DA SILVA TORRES / ANDERSON ROCHA
Titular: UNIVERSIDADE ESTADUAL DE CAMPINAS - UNICAMP (BR/SP) (BR/SP) / SAMSUNG ELETRÔNICA DA AMAZÔNIA LTDA. (BR/SP)
A presente invenção refere-se a um método de classificação multiclasse para cenários abertos, onde nem todas as classes possíveis são conhecidas durante a fase de treinamento. O método permite classificar amostras de teste como uma das classes conhecidas ou como "desconhecida", caso não se enquadrem em nenhuma classe treinada. A abordagem é baseada no cálculo da razão entre as duas melhores medidas de similaridade (R = δ₁/δ₂), onde δ₁ e δ₂ são as distâncias da amostra de teste para a primeira e segunda classes mais similares, respectivamente. Um parâmetro de rejeição T, obtido durante a fase de treinamento por otimização, é comparado com a razão R: se R > T, a amostra é classificada como desconhecida; caso contrário, é atribuída à melhor classe. Diferente de métodos tradicionais que usam um limiar sobre uma única medida de similaridade, a razão entre as duas melhores medidas permite uma adaptação superior em espaços de alta dimensionalidade. O método cria um espaço de risco finito e delimitado, melhorando a identificação de amostras desconhecidas. Pode ser aplicado em diversos contextos, como reconhecimento facial, biométrico, de voz, de cenas, classificação médica e sensoriamento remoto, entre outros. A invenção supera classificadores existentes, como OPF, SVM e suas variantes, em cenários abertos, oferecendo maior precisão e robustez sem necessidade de parametrização complexa.
O sistema licenciado pela Samsung, intitulado “Método para classificação multiclasse em cenários abertos”, é um novo classificador que opera em ambientes onde o sistema é treinado com um conjunto limitado de classes, mas deve lidar com categorias nunca vistas durante a operação. Diferente dos cenários fechados, que só reconhecem o que foi previamente cadastrado, este método identifica e classifica amostras desconhecidas como "desconhecidas", evitando erros de categorização. Sua principal inovação é ser inerentemente multiclasse, superando os classificadores binários tradicionais para cenários abertos. Desenvolvido a partir da dissertação de mestrado de Pedro Mendes Júnior, o sistema se mostrou superior aos existentes em experimentos. Por exemplo, se treinado para identificar carros e motos, ele classifica um caminhão como "veículo desconhecido" em vez de forçar uma categorização incorreta. Essa capacidade reflete melhor os sistemas do mundo real, onde não é possível prever todas as categorias. Entre as aplicações estão reconhecimento de impressões digitais, fala, objetos, cenas, caracteres e diagnósticos médicos. Em todas elas, o método rejeita entradas não cadastradas, como uma doença desconhecida, impedindo que sejam classificadas erroneamente como conhecidas, aumentando assim a segurança e a confiabilidade do sistema.

Anderson de Rezende Rocha é Professor Titular (Full-Professor) do Instituto de Computação, Universidade Estadual de Campinas (Unicamp). Graduou-se em Ciência da Computação pela Universidade Federal de Lavras (UFLA) em 2003. Concluiu o mestrado (2006), doutorado (2009), Pós-Doutorado (2009) em Ciência da Computação pela Universidade Estadual de Campinas (Unicamp). Em seu doutorado, também fez um período em Colorado Springs, EUA. Obteve a Livre-Docência em 2014. Suas principais áreas de atuação são Inteligência Artificial, Computação Forense e Inferência em Dados Complexos.
Resumo: 102014023780 O método proposto é utilizado para classificação em cenários abertos, em que muitas vezes não é possível obter previamente os dados de treinamento para todas as classes possíveis que podem surgi na fase de teste. Durante a fase de teste, as amostras de testes pertencentes a uma das classes utilizadas na fase de treinamento devem ser classificadas com base em uma razão emtre medidas de similaridade, como classe conhecida correta e as amostras de teste pertencentes a qualquer outra classe devem ser rejeitadas e classificadas como desconhecidas.
Nenhum comentário:
Postar um comentário