SKILL.md

$28

Building...

Priority Rules

Chatbot / conversational AI

Prompt Injection (LLM01), System Prompt Leakage (LLM07), Output Handling (LLM05), Unbounded Consumption (LLM10)

RAG system

Vector/Embedding Weaknesses (LLM08), Prompt Injection (LLM01), Sensitive Disclosure (LLM02), Misinformation (LLM09)

AI agent with tools

Excessive Agency (LLM06), Prompt Injection (LLM01), Output Handling (LLM05), Sensitive Disclosure (LLM02)

Fine-tuning / training

Data Poisoning (LLM04), Supply Chain (LLM03), Sensitive Disclosure (LLM02)

LLM-powered API

Unbounded Consumption (LLM10), Prompt Injection (LLM01), Output Handling (LLM05), Sensitive Disclosure (LLM02)

Content generation

Misinformation (LLM09), Output Handling (LLM05), Prompt Injection (LLM01)

Quick Reference

Vulnerability

Key Prevention

Prompt Injection

Input validation, output filtering, privilege separation

Sensitive Disclosure

Data sanitization, access controls, encryption

Supply Chain

Verify models, SBOM, trusted sources only

Data Poisoning

Data validation, anomaly detection, sandboxing

Output Handling

Treat LLM as untrusted, encode outputs, parameterize queries

Excessive Agency

Least privilege, human-in-the-loop, minimize extensions

System Prompt Leakage

No secrets in prompts, external guardrails

Vector/Embedding

Access controls, data validation, monitoring

Misinformation

RAG, fine-tuning, human oversight, cross-verification

Unbounded Consumption

Rate limiting, input validation, resource monitoring

Key Principles

Never trust LLM output - Validate and sanitize all outputs before use

Least privilege - Grant minimum necessary permissions to LLM systems

Defense in depth - Layer multiple security controls

Human oversight - Require approval for high-impact actions

Monitor and log - Track all LLM interactions for anomaly detection

References

OWASP Top 10 for LLM Applications 2025

MITRE ATLAS - Adversarial Threat Landscape for AI Systems

NIST AI Risk Management Framework

llm-security

SKILL.md

Categories

Critical Impact

High Impact

Quick Reference

Key Principles

References

Stop writing automation&scrapers

llm-security

SKILL.md

Categories

Critical Impact

High Impact

Quick Reference

Key Principles

References

Let your agent run on any real-world website

Related skills

Stop writing automation&scrapers