Caso de urso 3
A fonte única da verdade está longe de ser um produto de prateleira.
ARTIGO
Bruno Paulinelli
12/7/20242 min read
Caso de Urso 3: A fonte única da verdade está longe de ser um produto de prateleira.
A verdade pode ser entendida de diferentes (ué) formas:
* Para Hegel e Marx, a verdade é universalmente válida, ou seja, é válida para todos os seres cognoscentes.
* Para Platão, a verdade absoluta é alcançada através da contemplação do mundo das formas.
* Para René Descartes e Immanuel Kant, a verdade é a correspondência entre o que está no pensamento e o que existe no mundo.
No entanto, outras linhas de pensamento explicam que cada pessoa tem a sua própria verdade, e que não existe uma verdade única.
Tenho aprofundado fortemente em pesquisa e desenvolvimento no tema IA Generativa com dados próprios, desde que surgiu o GPT.
A pergunta que sempre surge em reunião, aula, live, podcast, palestras etc é: Legal, quer dizer que suas pesquisas e protótipos estão funcionando com uma boa performance porém, e se amanhã um provedor de Cloud coloca a mesma coisa na prateleira?
Bora pensar, não necessariamente uma verdade:
1- Provedor de cloud fatura com armazenamento e processamento, qq tecnologia se resume nestes pontos.
2- Um provedor de cloud não tem como principal objetivo pessoal em campo customizando as verdades de cada cliente.
Dado este contexto, ou assumindo isso como verdade, não absoluta, o que exploro em minhas participações é que não vejo isso como risco.
- Modelo Multi LLM, que apresentei pela primeira vez para um pessoal da gringa em março deste ano, batizei com este nome pq vai na contramão da LLM Multi Modal.
Já o Multi Modal, geralmente unifica tudo num pacote só, legal, texto, imagem, áudio e vídeo são resolvidos num único componente. Mas se vc usa 90% de texto, pq pagar pelo preço do mais caro em 100%.
Num pipeline de RAG (tbm RAFT, TAG, HyDE… ) por exemplo, uso LLM pra gerar embeddins, LLM para busca semântica e similaridade nos chunks, pra gerar chunk contextual, outra pra QA, tenho Lab com N, aí a provocação, para que uma Multi Modal pra gerar vetores se eu preciso saber probabilidade e não algo mais atual possível, pra cosseno na similaridade, outra pra ler uma imagem e trazer para o contexto, assim vai… tradeoff, saber implementar.
- A segunda é Modelagem Semântica, minha verdade pode ser diferente da sua, toda verdade é verdade dentro de um contexto, ou seja, minha regra de RH pode ser diferente da sua, uma lei num estado americano é diferente de outro, o que é errado nos EUA, pode não ser aqui.Pergunte ao GPT, Quem é o pai da aviação? Minha verdade é Santos Dumont, alguém na gringa, Irmãos Wright. Pronto, “alucinou”…
Imagina as verdades contábeis e financeiras que se confrontam dentro da mesma empresa, contexto departamental.
Bom, não vejo algo num provedor de cloud tão cedo que mitigue custo por token, não creio numa LLM “Onisciente” e nem produtos custom made de big tech.
Tudo se resume em Técnicas de Modelagem e Recuperação. E cada um tem suas peculiaridades.
A única verdade absoluta é que não existe verdade absoluta.