Projects

May 2026

A 30,000-example open-source benchmark for evaluating natural-language → DSL generation, with a public model leaderboard.

May 2026

A framework for evaluating earned autonomy in deployed AI systems.

April 2026

How we architected ASA and ADÉ for adversarial production.

September 2025

A benchmark and three metrics for measuring LLM-generated cybersecurity rules — CAMLIS 2025.

August 2023

Accelerating Adoption of Domain-Specific Languages with Large Language Models.

July 2023

Open-source natural language to domain-specific language dataset for email security.

April 2021

Malware bypass research using reinforcement learning.