Caso de urso 3

A fonte única da verdade está longe de ser um produto de prateleira.

ARTIGO

Bruno Paulinelli

12/7/20242 min read

Caso de Urso 3: A fonte única da verdade está longe de ser um produto de prateleira.

A verdade pode ser entendida de diferentes (ué) formas:

* Para Hegel e Marx, a verdade é universalmente válida, ou seja, é válida para todos os seres cognoscentes.  

* Para Platão, a verdade absoluta é alcançada através da contemplação do mundo das formas.  

* Para René Descartes e Immanuel Kant, a verdade é a correspondência entre o que está no pensamento e o que existe no mundo.  

No entanto, outras linhas de pensamento explicam que cada pessoa tem a sua própria verdade, e que não existe uma verdade única.  

Tenho aprofundado fortemente em pesquisa e desenvolvimento no tema IA Generativa com dados próprios, desde que surgiu o GPT.

A pergunta que sempre surge em reunião, aula, live, podcast, palestras etc é: Legal, quer dizer que suas pesquisas e protótipos estão funcionando com uma boa performance porém, e se amanhã um provedor de Cloud coloca a mesma coisa na prateleira?

Bora pensar, não necessariamente uma verdade:

1- Provedor de cloud fatura com armazenamento e processamento, qq tecnologia se resume nestes pontos.

2- Um provedor de cloud não tem como principal objetivo pessoal em campo customizando as verdades de cada cliente.

Dado este contexto, ou assumindo isso como verdade, não absoluta, o que exploro em minhas participações é que não vejo isso como risco.

- Modelo Multi LLM, que apresentei pela primeira vez para um pessoal da gringa em março deste ano, batizei com este nome pq vai na contramão da LLM Multi Modal.

Já o Multi Modal, geralmente unifica tudo num pacote só, legal, texto, imagem, áudio e vídeo são resolvidos num único componente. Mas se vc usa 90% de texto, pq pagar pelo preço do mais caro em 100%.

Num pipeline de RAG (tbm RAFT, TAG, HyDE… ) por exemplo, uso LLM pra gerar embeddins, LLM para busca semântica e similaridade nos chunks, pra gerar chunk contextual, outra pra QA, tenho Lab com N, aí a provocação, para que uma Multi Modal pra gerar vetores se eu preciso saber probabilidade e não algo mais atual possível, pra cosseno na similaridade, outra pra ler uma imagem e trazer para o contexto, assim vai… tradeoff, saber implementar.

- A segunda é Modelagem Semântica, minha verdade pode ser diferente da sua, toda verdade é verdade dentro de um contexto, ou seja, minha regra de RH pode ser diferente da sua, uma lei num estado americano é diferente de outro, o que é errado nos EUA, pode não ser aqui.Pergunte ao GPT, Quem é o pai da aviação? Minha verdade é Santos Dumont, alguém na gringa, Irmãos Wright. Pronto, “alucinou”…

Imagina as verdades contábeis e financeiras que se confrontam dentro da mesma empresa, contexto departamental.

Bom, não vejo algo num provedor de cloud tão cedo que mitigue custo por token, não creio numa LLM “Onisciente” e nem produtos custom made de big tech.

Tudo se resume em Técnicas de Modelagem e Recuperação. E cada um tem suas peculiaridades.

A única verdade absoluta é que não existe verdade absoluta.