Richards.AI is an independent research practice focused on the security, reliability, and human impact of autonomous AI systems. The work spans academic research, enterprise consulting, and open-source tooling.

Current primary focus: agent architecture security, with particular emphasis on multi-agent influence vectors, runtime enforcement frameworks, and operationalizing threat models like MITRE ATLAS for enterprise deployments.

12+

Years in Security

Enterprise

ServiceNow Focus

Open

Research and Code

Research Philosophy

"The three pillars are not separate silos. Security asks can we control it?Applied intelligence asks can we make it useful? And human learning askscan it genuinely improve lives? Each informs and strengthens the others."

Jer Richards

Principal Researcher

Designing, deploying, and defendingand defendingautonomous AI systems

AI Systems, Agents and Security

Applied Intelligence and Automation

Human Learning and Knowledge Systems

AI Systems, Agents and Security

Core Question

Representative Topics

Output Types

Selected Work

Agentic Binary Reverse Engineering: State of the Art, Architecture, Benchmarks, Failure Modes, and Research Agenda

Agentic Patch Validation in Automated Vulnerability Repair

Sandboxing and Capability Control for Tool-Using Autonomous Agents

Tool-using LLM agent security and prompt-injection defenses

Research Integration Model

Active Research Threads

Multi-Agent Prompt Injection Chains

Indirect Injection Propagation

Orchestrator Policy Enforcement

Glitch Token Mining

Enhanced Token Validation

Embedding Cluster Analysis

Email Extraction Failure Modes

Responsible Disclosure Workflow

Multi-Agent Prompt Injection Pillar Page

Glitch Token Glossary Cluster

AI Referral Measurement Setup

llms.txt + Sitemap Foundation

Triage Rubric v1

Selected Papers

Preserving Learning in Generative AI Tutoring Systems: Pedagogical Safety, Cognitive Effort, and Adaptive Scaffolding

Agentic Binary Reverse Engineering: State of the Art, Architecture, Benchmarks, Failure Modes, and Research Agenda

Agentic Patch Validation in Automated Vulnerability Repair

Generative AI Tutors and Personalized Adaptive Learning Systems

Effects of AI Assistance on Critical Thinking and Cognitive Offloading

Tool-use reliability, function-calling robustness, and structured output enforcement

Compound AI systems and orchestration patterns for multi-step automation

Sandboxing and Capability Control for Tool-Using Autonomous Agents

Tool-using LLM agent security and prompt-injection defenses

Hardening Multi-Agent Systems Against Prompt Injection

NOW9000: A Voice-Based AI Jailbreak Game

Full-Vocabulary Glitch Token Census and ASR Validation Methodology Correction

Auditing Glitcher's ASR Validation and Mining Coverage: Deterministic Decoding Bugs and Candidate Generation Gaps in Glitch Token Discovery

Prompt Injection, Tool Hijacking, and Data Exfiltration Defenses in RAG/Agent Systems

Glitcher: Mining and Classifying Glitch Tokens in Large Language Models

Harnessing Large Language Models for Enhanced Malware Reverse Engineering

Fund Independent Research

Background

Designing, deploying, and defending
and defending
autonomous AI systems