Evals: come capire se il tuo software AI funziona davvero
Road to Coderful
Un talk su come progettare valutazioni pragmatiche per software basato su AI, misurare la qualita' delle risposte e usare gli evals per iterare con piu' confidenza.
SlidesRoad to Coderful
Un talk su come progettare valutazioni pragmatiche per software basato su AI, misurare la qualita' delle risposte e usare gli evals per iterare con piu' confidenza.
SlidesPython Catania
A practical introduction to modeling workflows with explicit states and transitions in Python, using state machines to make valid paths easier to reason about and maintain.
Slides