Kategoria: AI
-
Inspect AI – Framework do ewaluacji LLM używany przez Anthropic, DeepMind i Grok #EN174
Framework Inspect AI używany przez Anthropic i DeepMind do ewaluacji modeli AI – notatki z prezentacji JJ Allaire
-
LLM w produktach bezpieczeństwa – jak odróżnić prawdziwe AI od marketingowego bełkotu #EN153
Harry Weatherald wyjaśnia jak odróżnić prawdziwe AI od marketingu w produktach bezpieczeństwa cybernetycznego
-
AI w cyberbezpieczeństwie – praktyczny przewodnik ekspertów #EN152
Praktyczny przewodnik po AI w cyberbezpieczeństwie – co działa dziś, czego unikać i jak będzie wyglądać przyszłość do 2030 roku
-
Role prompting to placebo: Jak few-shot prompting daje 70% wzrost dokładności #EN150
Ekspert Sander Schulhoff wyjaśnia które techniki prompt engineering działają w 2025, a które to mity
-
Dlaczego ewaluacja agentów AI jest ważniejsza od prompt engineeringu #EN146
Dlaczego ewaluacja agentów AI zastąpiła prompt engineering? Praktyczne wskazówki dla PM z real-world przykładami i checklistami.